Lize Pirenne's picture

179 17

Lize Pirenne

Inversta

·

Pangasius

AI & ML interests

LLMs, RL

Organizations

None yet

Inversta's activity

upvoted a paper 1 day ago

Zipfian Whitening

Paper • 2411.00680 • Published 9 days ago • 8

upvoted 4 papers 6 days ago

What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published 10 days ago • 57

GPT-4o System Card

Paper • 2410.21276 • Published 16 days ago • 76

Can Knowledge Editing Really Correct Hallucinations?

Paper • 2410.16251 • Published 20 days ago • 53

Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss

Paper • 2410.17243 • Published 19 days ago • 87

upvoted a paper 17 days ago

Aligning Large Language Models via Self-Steering Optimization

Paper • 2410.17131 • Published 19 days ago • 19

upvoted a paper 19 days ago

Fluid: Scaling Autoregressive Text-to-image Generative Models with Continuous Tokens

Paper • 2410.13863 • Published 24 days ago • 35

upvoted a paper 27 days ago

WALL-E: World Alignment by Rule Learning Improves World Model-based LLM Agents

Paper • 2410.07484 • Published Oct 9 • 48

upvoted a paper 30 days ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7 • 165

upvoted 9 papers about 1 month ago

TLDR: Token-Level Detective Reward Model for Large Vision Language Models

Paper • 2410.04734 • Published Oct 7 • 16

FAN: Fourier Analysis Networks

Paper • 2410.02675 • Published Oct 3 • 24

Addition is All You Need for Energy-efficient Language Models

Paper • 2410.00907 • Published Oct 1 • 143

Training Language Models on Synthetic Edit Sequences Improves Code Synthesis

Paper • 2410.02749 • Published Oct 3 • 12

Not All LLM Reasoners Are Created Equal

Paper • 2410.01748 • Published Oct 2 • 27

RATIONALYST: Pre-training Process-Supervision for Improving Reasoning

Paper • 2410.01044 • Published Oct 1 • 34

Modulated Intervention Preference Optimization (MIPO): Keep the Easy, Refine the Difficult

Paper • 2409.17545 • Published Sep 26 • 18

Emu3: Next-Token Prediction is All You Need

Paper • 2409.18869 • Published Sep 27 • 89

Discovering the Gems in Early Layers: Accelerating Long-Context LLMs with 1000x Input Token Reduction

Paper • 2409.17422 • Published Sep 25 • 24

upvoted 2 papers about 2 months ago

Kolmogorov-Arnold Transformer

Paper • 2409.10594 • Published Sep 16 • 38

Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers

Paper • 2409.04109 • Published Sep 6 • 43