OrchestraML

什么是 OrchestraML？

OrchestraML 是一款 AI 辅助的机器学习工作流工具，可将用自然语言描述的 ML 目标转化为引导式流水线。它支持数据集搜索或上传、探索性数据分析、清洗、特征工程、使用 AutoML 进行模型选择、评估，以及部署或打包导出。

该产品围绕多智能体工作流设计，并在关键检查点设置人工审批。它会用通俗英文记录决策，生成包含指标和可解释性产物的报告，还可以输出可下载的模型包或实时 API 端点。

多智能体流水线编排：分别由不同智能体处理编排、数据集选择、EDA、清洗、特征工程、建模、评估和部署。
人工检查点：流水线在 6 个关键关卡暂停，用户可在继续前审批或引导决策。
AutoML 模型搜索：使用 FLAML AutoML，并根据数据集大小和任务复杂度自适应分配时间预算来选模。
审计轨迹与报告：记录 AI 决策及通俗英文推理，并生成包含指标、图表、SHAP 可解释性、偏差检查和部署选项的分栏报告。
数据准备与诊断：包括自动剖析、空值与异常值处理、类别不平衡检测、特征选择，以及分布图、热力图、类别平衡图和箱线图等 EDA 图表。
导出与部署选项：生成可直接运行的 ZIP 包，包含 model.pkl、scaler.pkl、predict.py、requirements.txt 和 README 等文件，或部署为实时 API。
安全处理：上传时加密数据集，并在流水线完成后删除它们，仅保留训练好的模型。

先用自然语言描述你的 ML 目标，然后上传数据集，或者让智能体为你寻找数据集。系统随后会逐步运行流水线，显示日志，并在关键检查点请求批准。

工作流完成后，查看包含指标、SHAP 解释、偏差分析和 AI 决策日志的报告。之后，你可以下载模型包，或将生成的模型部署为 API。