Nemotron CC

使用场景使用Nemotron-CC数据集训练一个8B参数的模型,在MMLU指标上比DCLM提高了5.6一个8B参数模型使用该数据集训练15T tokens后,在...