Verify Capacity-Driven Gains from Multilingual SFT at 27B

Larger models extract disproportionately more from multilingual supervised fine-tuning

4.52x

27B/4B Slope Ratio

3.42x

Relative Advantage 27B vs 4B

0.820

Quality 27B at 55 langs

p<0.001

Slope Test Significance

Scaling Curves: Quality vs Number of Languages

Group	Slope (27B)	Slope (4B)	Ratio
High Resource	0.00464	0.00112	4.15x
Mid Resource	0.00632	0.00152	4.16x
Low Resource	0.00624	0.00150	4.17x
Typologically Distant	0.00626	0.00130	4.80x