Databonsai

使用场景社交媒体评论的分类和情感分析。新闻文章的自动归档和主题分类。客户反馈数据的整理和提取,用于产品改进。产品特色数据分类:使用LLMs将数据分入预定义的类别...

  • Databonsai

    类别:AI数据挖掘,AI开发助手,数据清洗,机器学习,自动化,大型语言模型,普通产品,开源,
    官网:https://github.com/databonsai/databonsai 更新时间:2025-08-01 17:56:14
  • 使用场景

    社交媒体评论的分类和情感分析。

    新闻文章的自动归档和主题分类。

    客户反馈数据的整理和提取,用于产品改进。

    产品特色

    数据分类:使用LLMs将数据分入预定义的类别。

    数据转换:通过提示对数据进行转换。

    数据提取:根据模式将数据提取成结构化格式。

    批量处理:节省令牌,通过只发送一次模式和示例来分类一批数据。

    重试逻辑:内置重试逻辑,用于处理API相关错误。

    进度条:在处理大量数据时提供进度反馈。

    自动批处理:自动调整批处理大小以最优化令牌使用和错误处理。

    使用教程

    1. 安装databonsai库。

    2. 在项目根目录下创建一个包含API密钥的.env文件。

    3. 设置LLM提供程序和类别。

    4. 使用categorize函数对单条数据进行分类。

    5. 使用categorize_batch函数对数据批量进行分类。

    6. 使用apply_to_column_autobatch函数对DataFrame或列表进行自动批处理。

    7. 监控进度条以了解当前处理进度。

    8. 在遇到错误时,根据需要调整批处理大小或使用更好的LLM模型。