Reading List - a mchi Collection

mchi 's Collections

Reading List

updated Aug 22, 2025

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9, 2025 • 263
A Survey on Latent Reasoning

Paper • 2507.06203 • Published Jul 8, 2025 • 93
Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 18
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

Paper • 1910.10683 • Published Oct 23, 2019 • 15
Training language models to follow instructions with human feedback

Paper • 2203.02155 • Published Mar 4, 2022 • 24
LLaMA: Open and Efficient Foundation Language Models

Paper • 2302.13971 • Published Feb 27, 2023 • 20
Mistral 7B

Paper • 2310.06825 • Published Oct 10, 2023 • 56
Gemma 2: Improving Open Language Models at a Practical Size

Paper • 2408.00118 • Published Jul 31, 2024 • 78
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published Feb 4, 2025 • 253
Kimi-VL Technical Report

Paper • 2504.07491 • Published Apr 10, 2025 • 133
Hierarchical Reasoning Model

Paper • 2506.21734 • Published Jun 26, 2025 • 46
DeepSeek-V3 Technical Report

Paper • 2412.19437 • Published Dec 27, 2024 • 74