reasoning - a CelesteChen Collection

CelesteChen 's Collections

models

code

RAG

others

math

Align

reasoning

updated 3 days ago

Large Language Models Can Self-Improve in Long-context Reasoning

Paper • 2411.08147 • Published Nov 12, 2024 • 64
Reverse Thinking Makes LLMs Stronger Reasoners

Paper • 2411.19865 • Published Nov 29, 2024 • 22
Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published Dec 9, 2024 • 78
HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

Paper • 2412.18925 • Published Dec 25, 2024 • 97
ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning

Paper • 2501.06590 • Published Jan 11 • 9
O1-Pruner: Length-Harmonizing Fine-Tuning for O1-Like Reasoning Pruning

Paper • 2501.12570 • Published Jan 22 • 24
Pairwise RM: Perform Best-of-N Sampling with Knockout Tournament

Paper • 2501.13007 • Published Jan 22 • 20
Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 92
Step-KTO: Optimizing Mathematical Reasoning through Stepwise Binary Feedback

Paper • 2501.10799 • Published Jan 18 • 15
Process Reinforcement through Implicit Rewards

Paper • 2502.01456 • Published 25 days ago • 54
One Example Shown, Many Concepts Known! Counterexample-Driven Conceptual Reasoning in Mathematical LLMs

Paper • 2502.10454 • Published 17 days ago • 7
Large Language Models and Mathematical Reasoning Failures

Paper • 2502.11574 • Published 11 days ago • 3
PhysReason: A Comprehensive Benchmark towards Physics-Based Reasoning

Paper • 2502.12054 • Published 11 days ago • 5
LightThinker: Thinking Step-by-Step Compression

Paper • 2502.15589 • Published 7 days ago • 25