VARAG

使用场景法律团队使用VARAG快速检索合同文档中的相关条款。研究人员利用VARAG从大量学术论文中提取关键信息。商业分析师使用VARAG分析市场报告中的图表和数...

  • VARAG

    类别:AI搜索引擎,AI数据挖掘,检索,生成,OCR,多模态,文档处理,普通产品,开源,
    官网:https://adithya-s-k.github.io/VARAG/ 更新时间:2025-08-02 09:25:11
  • 使用场景

    法律团队使用VARAG快速检索合同文档中的相关条款。

    研究人员利用VARAG从大量学术论文中提取关键信息。

    商业分析师使用VARAG分析市场报告中的图表和数据。

    产品特色

    支持多种检索技术,包括文本、图像和多模态文档检索。

    Simple RAG:通过OCR技术提取文档中的文本并进行检索。

    Vision RAG:结合视觉信息进行检索,使用JinaCLIP模型进行跨模态编码。

    ColPali RAG:直接将文档页面作为图像嵌入,使用PaliGemma模型进行编码。

    Hybrid ColPali RAG:结合图像嵌入和ColPali的晚期交互机制进行检索。

    提供交互式游乐场,可以比较不同的RAG解决方案。

    支持本地运行和Google Colab上的演示。

    使用教程

    克隆仓库:使用git命令克隆VARAG的GitHub仓库。

    设置环境:使用Conda创建并激活虚拟环境。

    安装依赖:使用pip或poetry安装所需的Python包。

    运行演示:执行demo.py脚本,通过--share参数在本地或Google Colab上运行。

    索引数据源:使用VARAG提供的类和方法对数据源进行索引。

    执行搜索:输入查询并执行搜索,获取检索结果。

    使用结果:将检索结果用于进一步的分析或生成响应。