2 18 35

Jiang Jiwen

jjw0126

AI & ML interests

RL, LLM

Recent Activity

liked a dataset 1 day ago

adyen/DABstep

liked a dataset 1 day ago

ibm-granite/GneissWeb

liked a dataset 3 days ago

AymanTarig/function-calling-v0.2-with-r1-cot

View all activity

Organizations

jjw0126's activity

liked 2 datasets 1 day ago

adyen/DABstep

Viewer • Updated 7 days ago • 10.4k • 3.13k • 9

ibm-granite/GneissWeb

Updated about 4 hours ago • 2.2k • 23

liked 2 datasets 3 days ago

AymanTarig/function-calling-v0.2-with-r1-cot

Viewer • Updated 26 days ago • 58k • 819 • 27

Jofthomas/hermes-function-calling-thinking-V1

Viewer • Updated 13 days ago • 3.57k • 5.04k • 13

liked a model 4 days ago

Salesforce/blip2-opt-2.7b

Image-Text-to-Text • Updated 26 days ago • 358k • 340

updated a model 4 days ago

PLM-Team/PLM-SFT-id

Updated 4 days ago • 10

upvoted an article 9 days ago

Article

Open-R1: a fully open reproduction of DeepSeek-R1

Jan 28

• 782

upvoted an article 10 days ago

Article

DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge

•

21 days ago

• 45

liked a dataset 11 days ago

Congliu/Chinese-DeepSeek-R1-Distill-data-110k

Viewer • Updated 8 days ago • 110k • 4.77k • 406

liked 5 datasets 21 days ago

upvoted 2 collections 21 days ago

🧠 Reasoning datasets

Collection

Datasets with reasoning traces for math and code released by the community • 12 items • Updated 9 days ago • 84

Reasoning Datasets

Collection

Distilled synthetic Reasoning datasets • 7 items • Updated 26 days ago • 55

liked 3 datasets 21 days ago

Aarushhh/Thinking-Preference-7k

Viewer • Updated about 1 month ago • 7.12k • 129 • 2

ServiceNow-AI/R1-Distill-SFT

Viewer • Updated 20 days ago • 1.85M • 8.09k • 260

mlfoundations-dev/LIMO

Viewer • Updated 22 days ago • 817 • 88 • 2

liked a model 22 days ago

simplescaling/s1-32B

Text Generation • Updated 3 days ago • 12.9k • 282