Rstar Math

使用场景在MATH基准测试中，将Qwen2.5-Math-7B的性能从58.8%提升至90.0%，Phi3-mini-3.8B从41.4%提升至86.4%。在A...