Ougrid Dumdang

Ougrid-D

ougrid

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Slamming: Training a Speech Language Model on One GPU in a Day

upvoted a paper 2 days ago

DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks

upvoted a paper 4 days ago

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

View all activity

Organizations

None yet

Ougrid-D's activity

upvoted 2 papers 2 days ago

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 9 days ago • 56

DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks

Paper • 2502.17157 • Published 4 days ago • 48

upvoted a paper 4 days ago

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

Paper • 2502.14377 • Published 8 days ago • 11

upvoted an article 4 days ago

Article

SigLIP 2: A better multilingual vision language encoder

8 days ago

• 114

upvoted an article 7 days ago

Article

SmolVLM2: Bringing Video Understanding to Every Device

9 days ago

• 177

upvoted 2 papers 9 days ago

Magma: A Foundation Model for Multimodal AI Agents

Paper • 2502.13130 • Published 10 days ago • 48

Continuous Diffusion Model for Language Modeling

Paper • 2502.11564 • Published 11 days ago • 49

upvoted 3 papers 14 days ago

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published 16 days ago • 142

Typhoon T1: An Open Thai Reasoning Model

Paper • 2502.09042 • Published 15 days ago • 16

An Open Recipe: Adapting Language-Specific LLMs to a Reasoning Model in One Day via Model Merging

Paper • 2502.09056 • Published 15 days ago • 30

upvoted a paper 16 days ago

ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

Paper • 2502.06772 • Published 18 days ago • 19

upvoted a paper 17 days ago

ARR: Question Answering with Large Language Models via Analyzing, Retrieving, and Reasoning

Paper • 2502.04689 • Published 22 days ago • 7

upvoted an article 17 days ago

Article

Fine-tune Deepseek-R1 with a Synthetic Reasoning Dataset

•

18 days ago

• 44

upvoted 2 papers 17 days ago

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published 18 days ago • 140

On-device Sora: Enabling Diffusion-Based Text-to-Video Generation for Mobile Devices

Paper • 2502.04363 • Published 24 days ago • 11

upvoted a paper 18 days ago

Generating Symbolic World Models via Test-time Scaling of Large Language Models

Paper • 2502.04728 • Published 22 days ago • 18

upvoted a paper 19 days ago

BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation

Paper • 2502.03860 • Published 22 days ago • 23

upvoted a paper 22 days ago

DeepRAG: Thinking to Retrieval Step by Step for Large Language Models

Paper • 2502.01142 • Published 25 days ago • 23

upvoted 2 papers 23 days ago

s1: Simple test-time scaling

Paper • 2501.19393 • Published 28 days ago • 107

Scaling Embedding Layers in Language Models

Paper • 2502.01637 • Published 25 days ago • 22