OrchestraML icon

OrchestraML

OrchestraMLは、自然な指示からデータセット処理、モデリング、評価、デプロイまでを導くマルチエージェントMLワークフローです。重要な工程では人の承認を挟めます。

OrchestraML

OrchestraMLとは?

OrchestraMLは、AI支援の機械学習ワークフローツールで、平易な英語のML目標をガイド付きパイプラインに変換します。データセットの検索またはアップロード、探索的データ分析、クリーニング、特徴量エンジニアリング、AutoMLによるモデル選択、評価、デプロイまたはパッケージ出力をサポートします。

この製品は、重要なチェックポイントで人の承認を挟むマルチエージェントワークフローを中心に設計されています。意思決定を平易な英語で記録し、メトリクスや説明可能性アーティファクトを含むレポートを生成し、ダウンロード可能なモデルパッケージまたはライブAPIエンドポイントを出力できます。

主な機能

  • マルチエージェントのパイプライン統括: オーケストレーション、データセット選択、EDA、クリーニング、特徴量エンジニアリング、モデリング、評価、デプロイをそれぞれ別のエージェントが担当します。
  • 人によるチェックポイント: パイプラインは6つの重要なゲートで停止し、続行前にユーザーが決定を承認または指示できます。
  • AutoMLによるモデル探索: FLAML AutoMLと適応的な時間予算を使い、データセットサイズとタスクの複雑さに基づいてモデルを選択します。
  • 監査ログとレポート: AIの判断を平易な英語の理由付きで記録し、メトリクス、チャート、SHAP説明、バイアスチェック、デプロイオプションを含むタブ付きレポートを生成します。
  • データ準備と診断: 自動プロファイリング、欠損値と外れ値の処理、不均衡検出、特徴選択、分布、ヒートマップ、クラスバランスチャート、ボックスプロットなどのEDAチャートを備えます。
  • エクスポートとデプロイのオプション: model.pklscaler.pklpredict.pyrequirements.txt、READMEなどを含むすぐに実行できるZIPを生成するか、ライブAPIをデプロイします。
  • セキュリティ対応: アップロード時にデータセットを暗号化し、パイプライン完了後に削除して、学習済みモデルのみを保持します。

OrchestraMLの使い方

まず、MLの目標を平易な英語で説明し、データセットをアップロードするか、エージェントに見つけてもらいます。その後、システムがパイプラインを段階的に実行し、ログを表示しながら重要なチェックポイントで承認を求めます。

ワークフロー完了後は、メトリクス、SHAPによる説明、バイアス分析、AIの意思決定ログを含むレポートを確認します。そこから、モデルパッケージをダウンロードするか、生成されたモデルをAPIとしてデプロイします。

利用例

  • 前処理、モデル選択、デプロイを手作業でコーディングせずに最初の機械学習プロジェクトを作る学生。
  • CSVを持っていて、データのクリーニング、モデル学習、性能確認までのガイド付きワークフローを求める分析担当者。
  • モデルを共有する前に、SHAPプロットや予測ごとの説明などの説明可能性アーティファクトが必要なユーザー。
  • 主要なステップで承認が必要で、完全な自動運転ではない管理型パイプラインを求めるチーム。
  • 学習済みモデル、前処理ファイル、予測スクリプトを含む、パッケージ化されたローカルモデル成果物が必要なワークフロー。

FAQ

  • OrchestraMLにMLの専門知識は必要ですか? いいえ。ソースによると、ユーザーは目標を平易な英語で説明できればよく、始めるのにMLの専門知識は必要ありません。
  • 自分のデータセットをアップロードできますか? はい。製品はデータセットのアップロードと、エージェントが処理するデータセット検索の両方をサポートします。
  • パイプラインは監督なしで実行されますか? いいえ。重要な操作を続ける前に承認のために停止する6つの人によるチェックポイントがあります。
  • 出力には何が含まれますか? レポートにはメトリクス、SHAPによる説明可能性、バイアス分析、デプロイオプションが含まれ、ダウンロード可能なパッケージもエクスポートできます。
  • ライブデプロイをサポートしていますか? はい。ソースによると、ユーザーはモデルパッケージをダウンロードするか、ライブAPIをデプロイできます。

代替手段

  • 従来のノートブックベースのワークフロー: より手動の制御と柔軟性がありますが、分析、クリーニング、学習、パッケージ化を段階的にユーザーが扱う必要があります。
  • マネージドなAutoMLプラットフォーム: モデル選択と学習の自動化に重点を置きますが、マルチエージェントのチェックポイント駆動ワークフローや、同等レベルの意思決定監査の詳細は重視しない場合があります。
  • 個別ツールで構築したMLOpsパイプライン: データ準備からデプロイまで対応できますが、1つのガイド付きインターフェースではなく、複数コンポーネントの組み立てと保守が通常必要です。
  • PythonのMLライブラリによる手動スクリプト: 最大限のカスタマイズが可能ですが、EDA、特徴量エンジニアリング、評価、デプロイ設定の全負担をユーザーが負います。