AI模型 开发与工具 人工智能 数据集 预训练 自然语言处理 普通产品
使用场景使用Nemotron-CC数据集训练一个8B参数的模型,在MMLU指标上比DCLM提高了5.6一个8B参数模型使用该数据集训练15T tokens后,在...