Rstar Math

使用场景在MATH基准测试中,将Qwen2.5-Math-7B的性能从58.8%提升至90.0%,Phi3-mini-3.8B从41.4%提升至86.4%。在A...