BEEspoke Data

community

https://www.bees.org/

Activity Feed

AI & ML interests

'an LLM is only as good as the dataset it was trained on' - Sun Tzu

Recent Activity

pszemraj updated a dataset about 1 month ago

BEE-spoke-data/LONGCOT-merged-1M

pszemraj new activity about 1 month ago

BEE-spoke-data/gutenberg-en-v1-clean:Thanks so much!

pszemraj updated a dataset about 2 months ago

BEE-spoke-data/govdocs1-by-extension

View all activity

Organization Card

Community About org cards

🐝📊💁

Collections 7

spaces 1

pinned

Sleeping

BeeCoder Demo

🐝

models 52

datasets 78

BEE-spoke-data/LONGCOT-merged-1M

Viewer • Updated Jan 19 • 1.7M • 455 • 1

BEE-spoke-data/govdocs1-by-extension

Viewer • Updated Jan 3 • 733k • 2.2k • 1

BEE-spoke-data/cosmopedia-v2-mincols

Viewer • Updated Jan 3 • 39.1M • 88

BEE-spoke-data/reddit-title-body-hf

Viewer • Updated Jan 2 • 251M • 859 • 3

BEE-spoke-data/bigpatent-all

Viewer • Updated Jan 2 • 2.43M • 558

BEE-spoke-data/google_wellformed_query-hf

Viewer • Updated Dec 20, 2024 • 25.1k • 89

BEE-spoke-data/fingpt-all-pr_format

Viewer • Updated Nov 26, 2024 • 418k • 56 • 1

BEE-spoke-data/fingpt-all

Viewer • Updated Nov 26, 2024 • 418k • 44

BEE-spoke-data/TxT360-5M-sample-en

Viewer • Updated Oct 11, 2024 • 10M • 178 • 3

BEE-spoke-data/TxT360-500k-sample-no_cc

Viewer • Updated Oct 11, 2024 • 500k • 102

BEEspoke Data

AI & ML interests

Recent Activity

Collections 7

BEE-spoke-data/smol_llama-101M-GQA

BEE-spoke-data/smol_llama-81M-tied

BEE-spoke-data/smol_llama-220M-GQA

BEE-spoke-data/verysmol_llama-v11-KIx2

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/smol_llama-220M-open_instruct

BEE-spoke-data/beecoder-220M-python

BEE-spoke-data/zephyr-220m-sft-full

spaces 1

BeeCoder Demo

models 52

BEE-spoke-data/pegasus-x-base-synthsumm_open-16k

BEE-spoke-data/tFINE-680m-e32-d16-gqa-flan

BEE-spoke-data/tFINE-680m-e32-d16-infinity_instruct-L2

BEE-spoke-data/tFINE-900m-e16-d32-instruct_2e

BEE-spoke-data/tFINE-900m-instruct-orpo

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/tFINE-900m-e16-d32-instruct

BEE-spoke-data/tFINE-900m-e16-d32-flan

BEE-spoke-data/slimpajama_tok-48128-BPE-forT5

BEE-spoke-data/claude-tokenizer-forT5

datasets 78

BEE-spoke-data/LONGCOT-merged-1M

BEE-spoke-data/govdocs1-by-extension

BEE-spoke-data/cosmopedia-v2-mincols

BEE-spoke-data/reddit-title-body-hf

BEE-spoke-data/bigpatent-all

BEE-spoke-data/google_wellformed_query-hf

BEE-spoke-data/fingpt-all-pr_format

BEE-spoke-data/fingpt-all

BEE-spoke-data/TxT360-5M-sample-en

BEE-spoke-data/TxT360-500k-sample-no_cc

AI & ML interests

Recent Activity

Team members 9

Collections 7

spaces 1

BeeCoder Demo

models 52 Sort: Recently updated

datasets 78 Sort: Recently updated

models 52

datasets 78