使用场景
研究人员使用Graphusion从学术论文中提取关键概念和关系,构建学术领域知识图谱。
企业利用Graphusion分析客户反馈,提取产品改进的关键信息。
开发者使用Graphusion从技术文档中提取术语和定义,构建技术知识库。
产品特色
创建新的conda环境并安装所需包。
处理指定目录下的文本文件作为输入。
需要一个JSON文件来定义关系。
提供预处理notebook来转换数据格式。
通过命令行运行整个管道。
输出包括概念抽象、提取的三元组和融合后的三元组。
支持通过参数调整来优化结果。
提供详细的使用说明和参数配置。
使用教程
1. 创建一个新的conda环境并激活。
2. 使用pip安装requirements.txt中列出的依赖包。
3. 准备输入文本文件和关系定义的JSON文件。
4. 使用preprocess.ipynb notebook将数据转换为所需格式。
5. 通过命令行运行main.py,指定必要的参数,如数据集名称和关系定义文件路径。
6. 根据需要调整其他参数,例如模型名称、最大响应令牌数等。
7. 运行管道并检查输出文件,包括概念抽象、提取的三元组和融合后的三元组。