模型训练与部署 研究工具 人工智能 语言模型 数学推理 深度学习 教育科技 普通产品 开源
使用场景在MATH基准测试中,将Qwen2.5-Math-7B的性能从58.8%提升至90.0%,Phi3-mini-3.8B从41.4%提升至86.4%。在A...