Workflowllm

使用场景开发者使用WorkflowLLM来自动化复杂的软件开发流程。数据科学家利用WorkflowLLM处理和分析大规模数据集。自动化工程师使用Workflow...

  • Workflowllm

    类别:大型语言模型,工作流编排,数据集,微调,自动化,普通产品,开源,
    官网:https://github.com/OpenBMB/WorkflowLLM 更新时间:2025-08-02 09:48:59
  • 使用场景

    开发者使用WorkflowLLM来自动化复杂的软件开发流程。

    数据科学家利用WorkflowLLM处理和分析大规模数据集。

    自动化工程师使用WorkflowLLM来设计和优化工业自动化流程。

    产品特色

    数据收集:从RoutineHub等平台收集现实世界的Apple快捷指令,并将其转录成Python风格的代码。

    查询扩展:使用ChatGPT生成多样化和复杂的任务查询,以丰富工作流数据集。

    工作流生成:训练有素的注释模型为合成查询生成工作流,然后进行质量检查,并与收集的样本合并,形成最终的数据集。

    模型微调:使用WorkflowBench微调Llama-3.1-8B模型,创建WorkflowLlama,专门针对工作流编排任务优化。

    实验结果:WorkflowLlama在编排复杂工作流和泛化到未见API方面表现出色。

    数据预处理:将原始的Apple Shortcuts plist格式转换为抽象语法树(AST)表示,提高数据的可读性和实用性。

    训练与推理:提供工具用于模型的训练和推理,支持日志记录和保存中间检查点。

    使用教程

    1. 环境设置:确保Python 3.8已安装,并根据requirements.txt安装所有依赖。

    2. 数据预处理:运行preprocess/Convert_ShortCut_to_Python.py脚本来将.plist或.shortcut文件转换为Python兼容格式。

    3. 训练模型:执行scripts/train.sh脚本来开始训练模型,提供基础模型路径和数据路径作为参数。

    4. 运行推理:模型训练完成后,使用scripts/infer.sh运行推理,提供训练好的模型检查点路径。

    5. 查看结果:分析模型的输出,评估工作流编排的效果。

    6. 微调和优化:根据实验结果对模型进行微调,以适应特定的工作流需求。