Longcite

使用场景研究人员使用LongCite模型在学术论文中自动引用相关研究。开发者将LongCite集成到问答系统中,提高系统的回答质量和可信度。教育机构利用Long...

  • Longcite

    类别:AI问答,AI模型,长文本问答,引用生成,大型语言模型,自然语言处理,普通产品,开源,
    官网:https://github.com/THUDM/LongCite 更新时间:2025-08-01 19:03:41
  • 使用场景

    研究人员使用LongCite模型在学术论文中自动引用相关研究。

    开发者将LongCite集成到问答系统中,提高系统的回答质量和可信度。

    教育机构利用LongCite模型教授学生如何进行学术引用。

    产品特色

    支持长文本问答,生成准确的回答和精确的句级引用。

    提供两个训练好的模型:LongCite-glm4-9b和LongCite-llama3.1-8b。

    支持高达128K的上下文长度。

    提供环境设置指南和模型部署方法。

    提供CoF(Citation with Fine-grained Context)流水线。

    提供模型训练和评估的详细指南。

    提供自动基准测试:LongBench-Cite,用于衡量引用质量和回答正确性。

    使用教程

    1. 根据环境设置指南安装必要的软件和库。

    2. 使用提供的代码示例下载并设置LongCite模型。

    3. 准备长文本上下文和查询。

    4. 调用模型的query_longcite函数,传入上下文和查询。

    5. 获取模型生成的回答和引用。

    6. 根据需要调整模型参数,如输入长度和新令牌数量。

    7. 部署模型到服务器或本地环境,以供实际应用。