pankajmathur
/

nanochat-d20

Text Generation

Model card Files Files and versions

pankajmathur commited on Dec 10, 2025

Commit

d4bf336

·

verified ·

1 Parent(s): d9ae245

Update README.md

Files changed (1) hide show

README.md +13 -8

README.md CHANGED Viewed

@@ -11,6 +11,7 @@ tags:
 pipeline_tag: text-generation
 datasets:
 - HuggingFaceTB/smol-smoltalk
 ---
 # nanochat-d20
@@ -19,10 +20,14 @@ datasets:
 ### Training Pipeline
-1.**Base-training** General PreTraining using nanochat framework
-2. **Mid-training**: General instruction tuning on SmolTalk, MMLU, GSM8K, Spelling tasks
-3. **SFT (Supervised Fine-Tuning)**: Chat-specific training on ARC, GSM8K, SmolTalk
-4. **RL (Reinforcement Learning)**: Optional GRPO-style training on GSM8K (if included)
 ## Repository Structure
@@ -34,13 +39,13 @@ datasets:
 ├── mid_checkpoints/d34/       # Mid-training checkpoint
 │   ├── model_*.pt
 │   └── meta_*.json
-├── chatsft_checkpoints/d34/   # SFT checkpoint
 │   ├── model_*.pt
 │   └── meta_*.json
-├── chatsft_checkpoints_int8/d34/   # SFT checkpoint
 │   ├── model_*.pt
 │   └── meta_*.json
-├── chatrl_checkpoints/d34/    # RL checkpoint (if available)
 │   ├── model_*.pt
 │   └── meta_*.json
 ├── report/                    # Evaluation reports
@@ -55,7 +60,7 @@ MIT License (same as nanochat)
 ## Acknowledgments
-- [Andrej Karpathy](https://github.com/karpathy) for the nanochat framework and pre-trained base model
 ```bibtex
 @misc{nanochat,

 pipeline_tag: text-generation
 datasets:
 - HuggingFaceTB/smol-smoltalk
+- karpathy/fineweb-edu-100b-shuffle
 ---
 # nanochat-d20
 ### Training Pipeline
+  1.**Base-training** PreTraining on FineWeb-EDU dataset using nanochat framework
+  2. **Mid-training**: General instruction tuning on SmolTalk, MMLU, GSM8K, Spelling tasks
+  3. **SFT (Supervised Fine-Tuning)**: Chat-specific training on ARC, GSM8K, SmolTalk
+  4. **RL (Reinforcement Learning)**: Optional GRPO-style training on GSM8K (if included)
 ## Repository Structure
 ├── mid_checkpoints/d34/       # Mid-training checkpoint
 │   ├── model_*.pt
 │   └── meta_*.json
+├── chatsft_checkpoints/d20/   # SFT checkpoint
 │   ├── model_*.pt
 │   └── meta_*.json
+├── chatsft_checkpoints_int8/d20/   # SFT checkpoint
 │   ├── model_*.pt
 │   └── meta_*.json
+├── chatrl_checkpoints/d20/    # RL checkpoint (if available)
 │   ├── model_*.pt
 │   └── meta_*.json
 ├── report/                    # Evaluation reports
 ## Acknowledgments
+- [Andrej Karpathy](https://github.com/karpathy) for the nanochat framework
 ```bibtex
 @misc{nanochat,