todo - a heyjoonkim Collection

heyjoonkim 's Collections

todo

todo

updated about 17 hours ago

Is Safety Standard Same for Everyone? User-Specific Safety Evaluation of Large Language Models

Paper • 2502.15086 • Published 8 days ago • 14
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Paper • 2502.14502 • Published 8 days ago • 80
Does Time Have Its Place? Temporal Heads: Where Language Models Recall Time-specific Information

Paper • 2502.14258 • Published 9 days ago • 23
S^2R: Teaching LLMs to Self-verify and Self-correct via Reinforcement Learning

Paper • 2502.12853 • Published 10 days ago • 27
Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published 11 days ago • 27
Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering

Paper • 2502.13962 • Published 9 days ago • 27
Language Models' Factuality Depends on the Language of Inquiry

Paper • 2502.17955 • Published 4 days ago • 23
Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning?

Paper • 2502.19361 • Published 2 days ago • 19
Can Language Models Falsify? Evaluating Algorithmic Reasoning with Counterexample Creation

Paper • 2502.19414 • Published 2 days ago • 16