Minirag

使用场景在移动设备上部署RAG系统,为用户提供快速准确的问答服务。在边缘计算环境中,利用MiniRAG进行实时文本生成任务,如自动摘要、内容创作等。学术研究中,...

  • Minirag

    类别:模型训练与部署,开发与工具,检索增强生成,小型语言模型,异构图索引,轻量级检索,自然语言处理,开源模型,普通产品,开源,
    官网:https://github.com/HKUDS/MiniRAG 更新时间:2025-08-02 10:17:42
  • 使用场景

    在移动设备上部署RAG系统,为用户提供快速准确的问答服务。

    在边缘计算环境中,利用MiniRAG进行实时文本生成任务,如自动摘要、内容创作等。

    学术研究中,作为轻量级RAG系统的基准模型,进行算法优化和性能评估。

    产品特色

    提供异构图索引机制,结合文本块和命名实体,减少对复杂语义理解的依赖。

    采用轻量级拓扑增强检索方法,利用图结构进行高效知识发现,无需高级语言能力。

    在使用小型语言模型时,仍能实现与大型语言模型相当的性能。

    仅需25%的存储空间,大大降低了部署成本。

    提供了一个全面的基准数据集LiHua-World,用于评估轻量级RAG系统在真实设备场景下的性能。

    支持从源代码安装和通过PyPI安装,方便开发者快速上手。

    代码结构清晰,易于理解和扩展,便于开发者进行二次开发。

    使用教程

    1. 从GitHub克隆MiniRAG仓库到本地。

    2. 通过命令`pip install -e .`从源代码安装MiniRAG,或通过`pip install lightrag-hku`从PyPI安装。

    3. 下载所需的LiHua-World数据集,并将其放置在`./dataset/LiHua-World/data/`目录下。

    4. 使用`python ./reproduce/Step_0_index.py`命令对数据集进行索引。

    5. 运行`python ./reproduce/Step_1_QA.py`进行问答任务,或使用`main.py`中的代码初始化MiniRAG。

    6. 根据需要调整参数和配置,进行模型训练和优化。