使用场景
构建科学文献的知识图谱,用于研究和数据分析。
从公司网站提取信息,构建公司知识图谱,用于业务分析和决策支持。
处理个人简历,构建个人知识图谱,用于职业发展和技能评估。
产品特色
文档蒸馏器:处理原始文档并将其重构成基于用户定义模式的语义块。
增量实体提取器:从语义块中提取独特实体并解决歧义,确保每个实体都有明确的定义。
增量关系提取器:识别提取实体之间的关系,可以丰富图谱或提供更精确的关系。
图集成和可视化:将提取的实体和关系集成到Neo4j数据库中,提供知识图谱的可视化。
支持零样本能力,无需特定领域训练即可进行知识提取。
与Neo4j数据库集成,便于数据的可视化和分析。
使用教程
1. 安装iText2KG,确保Python环境已安装,使用pip进行安装。
2. 定义或上传预定义的文档蒸馏模式。
3. 使用DocumentDistiller模块对文档进行蒸馏,提取语义块。
4. 通过iText2KG模块构建知识图谱,提取实体和关系。
5. 将提取的实体和关系通过GraphIntegrator模块集成到Neo4j数据库中。
6. 使用Neo4j进行知识图谱的可视化和交互式探索。