Itext2kg

使用场景构建科学文献的知识图谱,用于研究和数据分析。从公司网站提取信息,构建公司知识图谱,用于业务分析和决策支持。处理个人简历,构建个人知识图谱,用于职业发展和...

  • Itext2kg

    类别:AI知识图谱,AI开发助手,知识图谱,自然语言处理,大型语言模型,Neo4j,Python,普通产品,开源,
    官网:https://github.com/AuvaLab/itext2kg/ 更新时间:2025-08-01 19:03:22
  • 使用场景

    构建科学文献的知识图谱,用于研究和数据分析。

    从公司网站提取信息,构建公司知识图谱,用于业务分析和决策支持。

    处理个人简历,构建个人知识图谱,用于职业发展和技能评估。

    产品特色

    文档蒸馏器:处理原始文档并将其重构成基于用户定义模式的语义块。

    增量实体提取器:从语义块中提取独特实体并解决歧义,确保每个实体都有明确的定义。

    增量关系提取器:识别提取实体之间的关系,可以丰富图谱或提供更精确的关系。

    图集成和可视化:将提取的实体和关系集成到Neo4j数据库中,提供知识图谱的可视化。

    支持零样本能力,无需特定领域训练即可进行知识提取。

    与Neo4j数据库集成,便于数据的可视化和分析。

    使用教程

    1. 安装iText2KG,确保Python环境已安装,使用pip进行安装。

    2. 定义或上传预定义的文档蒸馏模式。

    3. 使用DocumentDistiller模块对文档进行蒸馏,提取语义块。

    4. 通过iText2KG模块构建知识图谱,提取实体和关系。

    5. 将提取的实体和关系通过GraphIntegrator模块集成到Neo4j数据库中。

    6. 使用Neo4j进行知识图谱的可视化和交互式探索。