使用场景
社交媒体评论的分类和情感分析。
新闻文章的自动归档和主题分类。
客户反馈数据的整理和提取,用于产品改进。
产品特色
数据分类:使用LLMs将数据分入预定义的类别。
数据转换:通过提示对数据进行转换。
数据提取:根据模式将数据提取成结构化格式。
批量处理:节省令牌,通过只发送一次模式和示例来分类一批数据。
重试逻辑:内置重试逻辑,用于处理API相关错误。
进度条:在处理大量数据时提供进度反馈。
自动批处理:自动调整批处理大小以最优化令牌使用和错误处理。
使用教程
1. 安装databonsai库。
2. 在项目根目录下创建一个包含API密钥的.env文件。
3. 设置LLM提供程序和类别。
4. 使用categorize函数对单条数据进行分类。
5. 使用categorize_batch函数对数据批量进行分类。
6. 使用apply_to_column_autobatch函数对DataFrame或列表进行自动批处理。
7. 监控进度条以了解当前处理进度。
8. 在遇到错误时,根据需要调整批处理大小或使用更好的LLM模型。