7 12 42

Yuqi Wang

Greenbean

AI & ML interests

None yet

Recent Activity

upvoted a paper 9 days ago

Qwen2.5-VL Technical Report

liked a Space 9 days ago

nanotron/ultrascale-playbook

upvoted a paper 10 days ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

View all activity

Organizations

Greenbean's activity

upvoted a paper 9 days ago

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 9 days ago • 150

liked a Space 9 days ago

1.79k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

upvoted a paper 10 days ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 13 days ago • 135

upvoted a paper 11 days ago

BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models

Paper • 2502.07346 • Published 18 days ago • 49

upvoted a paper 16 days ago

Expect the Unexpected: FailSafe Long Context QA for Finance

Paper • 2502.06329 • Published 19 days ago • 125

liked a dataset 16 days ago

MMInstruction/Clevr_CoGenT_TrainA_R1

Viewer • Updated 16 days ago • 37.8k • 2.58k • 32

upvoted a paper 16 days ago

Teaching Language Models to Critique via Reinforcement Learning

Paper • 2502.03492 • Published 24 days ago • 23

upvoted a paper 17 days ago

Scaling Pre-training to One Hundred Billion Data for Vision Language Models

Paper • 2502.07617 • Published 17 days ago • 28

New activity in MMInstruction/ArxivCap 17 days ago

Missing sub_caption

#6 opened 26 days ago by

andreamad8

upvoted 2 papers 17 days ago

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Paper • 2502.06394 • Published 18 days ago • 85

Competitive Programming with Large Reasoning Models

Paper • 2502.06807 • Published 25 days ago • 65

liked a dataset 18 days ago

AI-MO/NuminaMath-1.5

Viewer • Updated 18 days ago • 896k • 3.05k • 115

liked a dataset about 1 month ago

PleIAs/YouTube-Commons

Updated Jun 26, 2024 • 3.54k • 339

liked a model about 1 month ago

MiniMaxAI/MiniMax-VL-01

Image-Text-to-Text • Updated 6 days ago • 578 • 242

New activity in MMInstruction/ArxivQA about 2 months ago

Arxiv IDs in the Dataset

#3 opened about 2 months ago by

ghazalkhn

liked a model 2 months ago

openai/whisper-small

Automatic Speech Recognition • Updated Feb 29, 2024 • 11.7M • • 362

liked a model 3 months ago

openai/whisper-large-v3

Automatic Speech Recognition • Updated Aug 12, 2024 • 3.82M • • 4.1k

liked 2 datasets 3 months ago

LIUM/tedlium

Updated Sep 10, 2024 • 2.33k • 25

amphion/Emilia-Dataset

Viewer • Updated about 19 hours ago • 54.8M • 43.2k • 236

liked a model 3 months ago

Qwen/Qwen2-VL-72B-Instruct

Image-Text-to-Text • Updated 23 days ago • 152k • • 278