cool datasets
updated
Viewer
• Updated • 10k • 9.76k
• 556
rahulchakwate/squad-QG-dataset-original
Viewer
• Updated • 87.6k • 10
• 2
Viewer
• Updated • 1k • 45
• 11
Viewer
• Updated • 98.2k • 179k
• 368
rahulchakwate/squad-QG-dataset-shuffled
Viewer
• Updated • 87.6k • 6
Gautam9595/Squad_Translated
Viewer
• Updated • 115k • 12
nreimers/reddit_question_best_answers
Viewer
• Updated • 1.83M • 46
• 17
Preview
• Updated • 80
• 36
glaiveai/glaive-code-assistant
Viewer
• Updated • 136k • 1.16k
• 100
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 31.8k
• 352
Viewer
• Updated • 262k • 7.03k
• 305
Viewer
• Updated • 183k • 1.28k
• 295
Nexusflow/NexusRaven_API_evaluation
Viewer
• Updated • 1.07k • 3.37k
• 17
alielfilali01/MAD-Main-Test
Viewer
• Updated • 67.1k • 12
• 1
Viewer
• Updated • 211k • 348
• 138
migtissera/Tess-Coder-v1.0
Viewer
• Updated • 117k • 21
• 25
Preview
• Updated • 9.33k
• 5
Viewer
• Updated • 135k • 6.33k
• 294
QuixiAI/Code-74k-ShareGPT-Vicuna
Viewer
• Updated • 73.9k • 18
• 12
Viewer
• Updated • 109k • 4.3k
• 62
Viewer
• Updated • 2.75M • 9.69k
• 395
Preview
• Updated • 39
• 52
Preview
• Updated • 245
• 195
wyzelabs/RuleRecommendation
Preview
• Updated • 28
• 18
Updated • 1.65k
• 7
Viewer
• Updated • 1.31M • 74
• 24
Updated • 503
• 6
Locutusque/UltraTextbooks
Viewer
• Updated • 5.52M • 2.12k
• 200
Updated • 4.19k
• 1.05k
Viewer
• Updated • 206k • 7.91k
• 355
Preview
• Updated • 18
• 49
Locutusque/function-calling-chatml
Viewer
• Updated • 113k • 1.28k
• 177
lilacai/glaive-function-calling-v2-sharegpt
Viewer
• Updated • 113k • 856
• 31
Viewer
• Updated • 45.4k • 81
• 13
unalignment/comedy-snippets-v0.1
Viewer
• Updated • 44 • 20
• 10
Viewer
• Updated • 186M • 11.1k
• 39
Viewer
• Updated • 31.1M • 17.1k
• 722
Viewer
• Updated • 5.45B • 28.6k
• 592
Updated • 126k
• 141
Viewer
• Updated • 7.02k • 187
• 136
FreedomIntelligence/ALLaVA-4V
Viewer
• Updated • 143k • 750
• 96
Viewer
• Updated • 2M • 90
• 6
Viewer
• Updated • 1.07k • 506
• 27
CohereLabs/wikipedia-2023-11-embed-multilingual-v3
Viewer
• Updated • 247M • 9.51k
• 248
Weyaxi/huggingface-spaces-codes
Viewer
• Updated • 19.9k • 4.06k
• 11
Updated • 17.2k
• 76
Viewer
• Updated • 16.3k • 9.54k
• 105
Updated • 494
• 1
Viewer
• Updated • 1.87k • 63
• 1
Viewer
• Updated • 629 • 39
• 10
NousResearch/json-mode-eval
Viewer
• Updated • 100 • 1.65k
• 44
NousResearch/func-calling-eval
Viewer
• Updated • 100 • 42
• 16
Updated • 2.1M
• 368
Viewer
• Updated • 3.41M • 3.97k
• 194
Viewer
• Updated • 101k • 118
• 68
Viewer
• Updated • 7.1k • 7.06k
• 159
Viewer
• Updated • 3.35M • 1.17k
• 25
HuggingFaceM4/the_cauldron
Viewer
• Updated • 1.88M • 244k
• 547
Viewer
• Updated • 52.5B • 317k
• 2.91k
gate369/alpaca-star-ascii
Viewer
• Updated • 387 • 18
• 5
Viewer
• Updated • 765 • 2.14k
• 127
Viewer
• Updated • 2.49k • 387
• 9
motherduckdb/duckdb-text2sql-25k
Viewer
• Updated • 25k • 115
• 43
asgaardlab/CommonGameCorruptions
Viewer
• Updated • 7.19k • 36
• 2
Viewer
• Updated • 8.01M • 69.7k
• 522
chansung/merged_ds_coding
Viewer
• Updated • 60.6k • 66
• 18
PleIAs/Post-OCR-Correction
Viewer
• Updated • 50.4k • 1.04k
• 135
MemGPT/MemGPT-DPO-Dataset
Viewer
• Updated • 42.3k • 25
• 11
nthakur/swim-ir-monolingual
Viewer
• Updated • 3.17M • 150
• 10
nthakur/swim-ir-cross-lingual
Viewer
• Updated • 15.4M • 330
• 9
Updated • 144
• 14
Viewer
• Updated • 31.1k • 1.02k
• 14
AILab-CVC/SEED-Bench-2-plus
Viewer
• Updated • 555 • 213
• 5
bigcode/self-oss-instruct-sc2-exec-filter-50k
Viewer
• Updated • 50.7k • 11.5k
• 106
Viewer
• Updated • 143k • 360
• 17
masakhane/afriqa-gold-passages
Updated • 56
• 6
masakhane/african-ultrachat
Viewer
• Updated • 55k • 82
• 5
Viewer
• Updated • 153k • 1.22k
• 13
Viewer
• Updated • 1.28B • 761
• 60
Updated • 3.46k
• 391
NousResearch/CharacterCodex
Viewer
• Updated • 15.9k • 391
• 238
Viewer
• Updated • 433k • 674
• 48
allenai/SciRIFF-train-mix
Viewer
• Updated • 70.7k • 47
• 10
PromptSystematicReview/ThePromptReport
Viewer
• Updated • 83 • 1.69k
• 46
louisbrulenaudet/legalkit
Viewer
• Updated • 53k • 152
• 33
microsoft/MeetingBank-LLMCompressed
Viewer
• Updated • 5.17k • 240
• 16
Viewer
• Updated • 17.3k • 878
• 36
microsoft/MeetingBank-QA-Summary
Viewer
• Updated • 862 • 134
• 15
Magpie-Align/Magpie-Qwen2-Pro-1M-v0.1
Viewer
• Updated • 1M • 125
• 14
Viewer
• Updated • 2.55M • 9.42k
• 306
Viewer
• Updated • 486k • 487
• 65
Viewer
• Updated • 1.75M • 189
• 107
Viewer
• Updated • 6k • 806
• 201
Viewer
• Updated • 119k • 7.31k
• 91
CATMuS/medieval-segmentation
Viewer
• Updated • 1.68k • 350
• 7
antoinejeannot/jurisprudence
Viewer
• Updated • 2.12M • 298
• 27
Viewer
• Updated • 39.5k • 19.1k
• 367
HuggingFaceFW/fineweb-edu
Viewer
• Updated • 3.5B • 384k
• 1.17k
Viewer
• Updated • 6.91k • 157
• 27
argilla/FinePersonas-v0.1
Viewer
• Updated • 42.1M • 9.46k
• 409
lmms-lab/LLaVA-Video-178K
Viewer
• Updated • 1.63M • 25.5k
• 197
Updated • 3.99k
• 263
recursal/SuperWikiImage-7M
Updated • 118
• 19
Preview
• Updated • 90.4k
• 98
Viewer
• Updated • 826M • 7.8k
• 73
Updated • 226
• 86
louisbrulenaudet/lemone-docs-embedded
Viewer
• Updated • 16.1k • 35
• 3
naijavoices/naijavoices-dataset
Viewer
• Updated • 1.92M • 755
• 26
Viewer
• Updated • 12.4M • 3.38k
• 176
Viewer
• Updated • 824 • 16.1k
• 262
ClovenDoug/150k_keyphrases_labelled
Viewer
• Updated • 2.26M • 35
• 2
Cour-de-cassation/alpaca_ccass_motivations_sommaires_titres
Viewer
• Updated • 19.1k • 39
• 3
microsoft/orca-agentinstruct-1M-v1
Viewer
• Updated • 1.05M • 2.6k
• 465
alpindale/two-million-bluesky-posts
Viewer
• Updated • 2.11M • 835
• 203
Viewer
• Updated • 118M • 4.02k
• 117
Viewer
• Updated • 286k • 190
• 124
agibot-world/AgiBotWorld-Alpha
Viewer
• Updated • 49.8M • 10.5k
• 225
DAMO-NLP-SG/multimodal_textbook
Updated • 925
• 163
Viewer
• Updated • 926k • 166
• 21
bytedance-research/ToolHop
Updated • 552
• 23
Benchmark
• Updated • 2.5k • 28.3k
• 849
Viewer
• Updated • 182k • 477
• 125
ServiceNow-AI/R1-Distill-SFT
Viewer
• Updated • 1.85M • 2.57k
• 322
open-thoughts/OpenThoughts-114k
Viewer
• Updated • 228k • 72.7k
• 867
tomg-group-umd/alpaca_cleaned_dataset_short
Viewer
• Updated • 32 • 8
• 1
Viewer
• Updated • 5.42M • 1.32k
• 5
MaziyarPanahi/M2Lingual-sharegpt
Viewer
• Updated • 174k • 12
• 2
Viewer
• Updated • 4.59k • 1.48k
• 11
Viewer
• Updated • 307k • 341
• 3
OpenLLM-France/Lucie-Training-Dataset
Viewer
• Updated • 10.9B • 6.58k
• 36
Viewer
• Updated • 2.19k • 1.37k
• 26
Josephgflowers/Finance-Instruct-500k
Viewer
• Updated • 518k • 1.14k
• 229
facebook/natural_reasoning
Viewer
• Updated • 1.15M • 1.91k
• 574
Updated • 5.16k
• 60
Viewer
• Updated • 3.08M • 3.98k
• 7
VanWang/Bespoke_dpo_filter
Viewer
• Updated • 10.1k • 15
• 1
VanWang/Bespoke_dpo_filter_len_long
Viewer
• Updated • 1k • 5
• 1
TheFinAI/Fino1_Reasoning_Path_FinQA
Viewer
• Updated • 5.5k • 625
• 40
Preview
• Updated • 58
• 4
declare-lab/AlgoPuzzleVQA
Viewer
• Updated • 1.8k • 151
• 9
Viewer
• Updated • 487k • 4.52k
• 113
Viewer
• Updated • 205 • 4.18k
• 39
Viewer
• Updated • 160 • 167
• 5
Viewer
• Updated • 79.5M • 560
• 23
Preview
• Updated • 593
• 14
Locutusque/Platinum-CoT-v0.1-ShareGPT
Viewer
• Updated • 2.42k • 12
• 1
gretelai/gretel-safety-alignment-en-v1
Viewer
• Updated • 16.7k • 779
• 22
Locutusque/deeplm-training-data
Viewer
• Updated • 2.17M • 31
• 3
Viewer
• Updated • 1B • 5.38k
• 38
winglian/codeforces-cot-16k-context
Viewer
• Updated • 24.3k • 12
• 1
glaiveai/reasoning-v1-20m
Viewer
• Updated • 22.2M • 3.64k
• 236
nvidia/Llama-Nemotron-Post-Training-Dataset
Viewer
• Updated • 3.91M • 4.89k
• 679
nomic-ai/cornstack-python-v1
Viewer
• Updated • 23.6M • 1.04k
• 28
Viewer
• Updated • 254k • 4.31k
• 221
Viewer
• Updated • 753k • 10.4k
• 546
Viewer
• Updated • 1.15k • 1.37k
• 122
Anthropic/values-in-the-wild
Viewer
• Updated • 6.91k • 686
• 151
Viewer
• Updated • 1.98k • 193
• 33
Viewer
• Updated • 7.5k • 185
• 19
ZennyKenny/tactical-military-reasoning-v.1.0
Viewer
• Updated • 150 • 255
• 24
nvidia/Nemotron-CrossThink
Preview
• Updated • 354
• 115
Preview
• Updated • 4.94k
• 31
a-m-team/AM-DeepSeek-Distilled-40M
Viewer
• Updated • 11.5M • 1.97k
• 56
open-r1/Mixture-of-Thoughts
Viewer
• Updated • 699k • 6.67k
• 319
Viewer
• Updated • 5.82M • 499
• 66
Viewer
• Updated • 157M • 2.11k
• 58
facebook/seamless-interaction
Updated • 45k
• 190
MaziyarPanahi/smoltalk2-sft-no-think
Viewer
• Updated • 1.9M • 70
• 6
facebook/community-alignment-dataset
Viewer
• Updated • 90.3k • 204
• 41
interstellarninja/hermes_reasoning_tool_use
Viewer
• Updated • 51k • 2.52k
• 172
Viewer
• Updated • 1.25M • 3.68k
• 133
MegaScience/TextbookReasoning
Viewer
• Updated • 652k • 610
• 33
HuggingFaceH4/Multilingual-Thinking
Viewer
• Updated • 1k • 9.45k
• 117
motionlabs/fineweb-ultra-mini
Viewer
• Updated • 131k • 214
• 4
Viewer
• Updated • 168k • 435
• 5
Updated • 3.78k
• 46
Viewer
• Updated • 71.4k • 392
• 9
OS-Copilot/OS-Genesis-web-data
Updated • 26
• 8
Updated • 1.13k
• 30
Preview
• Updated • 1.92k
• 85
nvidia/Nemotron-Post-Training-Dataset-v2
Viewer
• Updated • 6.34M • 8.69k
• 139
Text Generation
• 8B • Updated • 689
• • 69
continuedev/instinct-data
Viewer
• Updated • 9.04k • 21
• 31
Viewer
• Updated • 476M • 74.4k
• 882
Viewer
• Updated • 5.89M • 9.31k
• 97
Preview
• Updated • 10.2k
• 50
Viewer
• Updated • 7.09B • 38.4k
• 94
smolagents/aguvis-stage-2
Viewer
• Updated • 784k • 2.32k
• 29
nvidia/esm2_uniref_pretraining_data
Viewer
• Updated • 188M • 1.08k
• 9
biglam/doab-metadata-extraction
Viewer
• Updated • 8.09k • 173
• 14
rl-research/dr-tulu-rl-data
Viewer
• Updated • 4.88k • 362
• 14
RUC-DataLab/DataScience-Instruct-500K
Viewer
• Updated • 26.2k • 954
• 76
openbmb/InfLLM-V2-data-5B
Viewer
• Updated • 7.19M • 891
• 34
OpenMed/Medical-Reasoning-SFT-GPT-OSS-120B
Viewer
• Updated • 200k • 367
• 252
allenai/Dolci-Think-RL-7B-Completions-SFT
Viewer
• Updated • 636k • 101
• 9
mahdi-ranjbar/math_search_strategy
Viewer
• Updated • 40 • 11
• 1
genrobot2025/10Kh-RealOmin-OpenData
Updated • 1.16M
• 222
Alibaba-Apsara/Superior-Reasoning-SFT-gpt-oss-120b
Viewer
• Updated • 306k • 1.06k
• 349
Viewer
• Updated • 1.86M • 6.15k
• 245
Viewer
• Updated • 1.67M • 32.1k
• 243
nvidia/Nemotron-Math-Proofs-v1
Viewer
• Updated • 925k • 922
• 122
Viewer
• Updated • 7.09M • 4.42k
• 183
Viewer
• Updated • 140 • 43
• 5
BigData-KSU/RS-instructions-dataset
Viewer
• Updated • 73.3k • 33
• 1
henry-07/sentinel-imagery-captions
Viewer
• Updated • 500 • 9
• 1
henry-07/sentinel-image-captions
Viewer
• Updated • 6.01k • 8
• 1
Updated • 74
• 2
Viewer
• Updated • 2.73M • 3.64k
• 70
Viewer
• Updated • 1.7M • 2.85k
• 188
Benchmark
• Updated • 480 • 67.1k
• 133
Updated • 212k
• 139
Jaward/lectura-agents-data
Viewer
• Updated • 280 • 1.16k
• 24
Updated • 573k
• 69