使用场景
合同管理:提取合同中的关键信息,如参与方名称、生效日期和续签日期。
财务报告:从年报或盈利声明中提取财务数据。
研究提取:针对一系列研究报告提出关键问题并提取信息。
元数据生成:通过运行针对性问题对文件进行分类和标记,生成关于文档和文件的信息。
产品特色
使用自然语言查询从非结构化文档中提取结构化数据。
创建表格和图表等结构化知识表示。
自定义提取规则以确保数据质量。
控制提取数据的输出格式。
根据元数据或提取的数据过滤文档。
将提取的数据导出为CSV或图三元组。
引用之前列中的数据进行链式提取。
集成Unstructured API以增强文档处理能力。
使用教程
1. 访问Knowledge Table的GitHub页面并克隆代码库。
2. 安装必要的依赖项,包括Docker和Docker Compose。
3. 根据需要运行Docker容器或本地环境。
4. 设置环境变量,如OpenAI API密钥。
5. 定义提取规则和格式化选项。
6. 上传非结构化文档并创建问题以指导数据提取。
7. 根据问题和规则处理数据并获取结构化输出。
8. 根据需要调整问题或规则设置以优化提取结果。