SELA

使用场景使用SELA在泰坦尼克号数据集上进行模型选择和集成。利用SELA在房价预测任务中优化模型性能。通过SELA进行消融研究,比较不同搜索策略对模型性能的影响...

  • SELA

    类别:模型训练与部署,研究工具,自动化机器学习,蒙特卡洛树搜索,大型语言模型,模型选择,模型集成,普通产品,开源,
    官网:https://github.com/geekan/MetaGPT/tree/main/metagpt/ext/sela 更新时间:2025-08-02 09:40:44
  • 使用场景

    使用SELA在泰坦尼克号数据集上进行模型选择和集成。

    利用SELA在房价预测任务中优化模型性能。

    通过SELA进行消融研究,比较不同搜索策略对模型性能的影响。

    产品特色

    数据准备:支持从链接下载数据集或从头开始准备数据集。

    配置灵活:用户可以根据需要修改数据配置和LLM配置。

    SELA运行:提供了运行SELA的详细步骤,包括设置、运行实验和参数配置。

    实验模式:支持MCTS和随机搜索(RS)两种实验模式。

    参数调整:用户可以根据需要调整诸如rollouts、timeout等参数。

    断点续跑:支持加载现有的MCTS树,以便在实验中断后继续。

    Ablation Study:支持进行消融研究,比较不同搜索策略的效果。

    使用教程

    1. 数据准备:根据SELA的指南下载或准备数据集。

    2. 配置设置:根据需要修改`datasets.yaml`和`data.yaml`文件中的配置。

    3. 安装依赖:在SELA目录下运行`pip install -r requirements.txt`安装所需依赖。

    4. 运行SELA:使用`python run_experiment.py`命令并附加相应参数来运行实验。

    5. 参数调整:根据实验需要调整rollouts、timeout等参数。

    6. 结果分析:分析实验结果,根据反馈迭代改进策略。

    7. 断点续跑:如果实验中断,可以使用`--load_tree`参数加载之前的MCTS树继续实验。