使用场景
在移动设备上部署RAG系统,为用户提供快速准确的问答服务。
在边缘计算环境中,利用MiniRAG进行实时文本生成任务,如自动摘要、内容创作等。
学术研究中,作为轻量级RAG系统的基准模型,进行算法优化和性能评估。
产品特色
提供异构图索引机制,结合文本块和命名实体,减少对复杂语义理解的依赖。
采用轻量级拓扑增强检索方法,利用图结构进行高效知识发现,无需高级语言能力。
在使用小型语言模型时,仍能实现与大型语言模型相当的性能。
仅需25%的存储空间,大大降低了部署成本。
提供了一个全面的基准数据集LiHua-World,用于评估轻量级RAG系统在真实设备场景下的性能。
支持从源代码安装和通过PyPI安装,方便开发者快速上手。
代码结构清晰,易于理解和扩展,便于开发者进行二次开发。
使用教程
1. 从GitHub克隆MiniRAG仓库到本地。
2. 通过命令`pip install -e .`从源代码安装MiniRAG,或通过`pip install lightrag-hku`从PyPI安装。
3. 下载所需的LiHua-World数据集,并将其放置在`./dataset/LiHua-World/data/`目录下。
4. 使用`python ./reproduce/Step_0_index.py`命令对数据集进行索引。
5. 运行`python ./reproduce/Step_1_QA.py`进行问答任务,或使用`main.py`中的代码初始化MiniRAG。
6. 根据需要调整参数和配置,进行模型训练和优化。