pythagoras's picture

29 2

pythagoras

dingangui

·

dingangui

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

X-Dancer: Expressive Music to Human Dance Video Generation

upvoted a paper 4 days ago

MONSTER: Monash Scalable Time Series Evaluation Repository

upvoted a paper 4 days ago

RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers

View all activity

Organizations

dingangui's activity

upvoted 15 papers 4 days ago

X-Dancer: Expressive Music to Human Dance Video Generation

Paper • 2502.17414 • Published 4 days ago • 9

MONSTER: Monash Scalable Time Series Evaluation Repository

Paper • 2502.15122 • Published 8 days ago • 2

RIFLEx: A Free Lunch for Length Extrapolation in Video Diffusion Transformers

Paper • 2502.15894 • Published 7 days ago • 16

VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing

Paper • 2502.17258 • Published 4 days ago • 58

Beyond Release: Access Considerations for Generative AI Systems

Paper • 2502.16701 • Published 5 days ago • 9

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 9 days ago • 56

Forecasting Open-Weight AI Model Growth on Hugging Face

Paper • 2502.15987 • Published 7 days ago • 9

Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration

Paper • 2502.17110 • Published 4 days ago • 10

Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment

Paper • 2502.16894 • Published 5 days ago • 22

Benchmarking Temporal Reasoning and Alignment Across Chinese Dynasties

Paper • 2502.16922 • Published 5 days ago • 7

Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning

Paper • 2502.17407 • Published 4 days ago • 22

Multimodal Inconsistency Reasoning (MMIR): A New Benchmark for Multimodal Reasoning Models

Paper • 2502.16033 • Published 7 days ago • 15

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

Paper • 2502.16614 • Published 5 days ago • 22

Audio-FLAN: A Preliminary Release

Paper • 2502.16584 • Published 5 days ago • 30

Thus Spake Long-Context Large Language Model

Paper • 2502.17129 • Published 4 days ago • 63

upvoted a paper 2 months ago

GenEx: Generating an Explorable World

Paper • 2412.09624 • Published Dec 12, 2024 • 90

upvoted 2 papers 3 months ago

ZipAR: Accelerating Autoregressive Image Generation through Spatial Locality

Paper • 2412.04062 • Published Dec 5, 2024 • 9

Mimir: Improving Video Diffusion Models for Precise Text Understanding

Paper • 2412.03085 • Published Dec 4, 2024 • 12

upvoted 2 papers 4 months ago

Framer: Interactive Frame Interpolation

Paper • 2410.18978 • Published Oct 24, 2024 • 37

MarDini: Masked Autoregressive Diffusion for Video Generation at Scale

Paper • 2410.20280 • Published Oct 26, 2024 • 23