15 580 242

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper about 12 hours ago

NeoBERT: A Next-Generation BERT

upvoted a paper 3 days ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

upvoted a paper 4 days ago

Slamming: Training a Speech Language Model on One GPU in a Day

View all activity

Organizations

taufiqdp's activity

upvoted a paper about 12 hours ago

NeoBERT: A Next-Generation BERT

Paper • 2502.19587 • Published 2 days ago • 10

upvoted a paper 3 days ago

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published 3 days ago • 46

upvoted 2 papers 4 days ago

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published 9 days ago • 56

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 8 days ago • 151

upvoted a collection 7 days ago

SigLIP2

Collection

36 items • Updated 7 days ago • 51

upvoted 2 papers 8 days ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 8 days ago • 92

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 8 days ago • 118

upvoted an article 8 days ago

Article

SmolVLM2: Bringing Video Understanding to Every Device

9 days ago

• 177

liked a dataset 9 days ago

SakanaAI/AI-CUDA-Engineer-Archive

Viewer • Updated 9 days ago • 30.6k • 10.7k • 128

upvoted an article 9 days ago

Article

PaliGemma 2 Mix - New Instruction Vision Language Models by Google

10 days ago

• 60

upvoted a collection 9 days ago

PaliGemma 2 Mix

Collection

13 items • Updated 9 days ago • 59

upvoted a paper 9 days ago

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 9 days ago • 150

liked a model 10 days ago

perplexity-ai/r1-1776

Text Generation • Updated 2 days ago • 31.9k • • 1.9k

upvoted 2 papers 11 days ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 12 days ago • 134

ReLearn: Unlearning via Learning for Large Language Models

Paper • 2502.11190 • Published 12 days ago • 28

upvoted a paper 12 days ago

Large Language Diffusion Models

Paper • 2502.09992 • Published 15 days ago • 94

upvoted 2 papers 14 days ago

mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data

Paper • 2502.08468 • Published 16 days ago • 13

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published 16 days ago • 142

upvoted a paper 16 days ago

TransMLA: Multi-head Latent Attention Is All You Need

Paper • 2502.07864 • Published 17 days ago • 45

liked a model 17 days ago

agentica-org/DeepScaleR-1.5B-Preview

Text Generation • Updated 6 days ago • 39.2k • • 487