OrchestraML icon

OrchestraML

OrchestraML은 자연어 목표를 데이터셋 처리, 모델링, 평가, 배포까지 안내하는 다중 에이전트 ML 워크플로 도구입니다.

OrchestraML

OrchestraML이란?

OrchestraML은 평이한 영어로 된 ML 목표를 안내형 파이프라인으로 바꿔주는 AI 지원 머신러닝 워크플로 도구입니다. 데이터셋 검색 또는 업로드, 탐색적 데이터 분석, 정제, 피처 엔지니어링, AutoML 기반 모델 선택, 평가, 배포 또는 패키지 내보내기를 지원합니다.

이 제품은 중요한 체크포인트마다 사람의 승인을 받는 다중 에이전트 워크플로를 기반으로 설계되었습니다. 의사결정을 평이한 영어로 기록하고, 지표와 설명 가능성 산출물을 포함한 보고서를 생성하며, 다운로드 가능한 모델 패키지 또는 실시간 API 엔드포인트를 만들 수 있습니다.

주요 기능

  • 다중 에이전트 파이프라인 오케스트레이션: 오케스트레이션, 데이터셋 선택, EDA, 정제, 피처 엔지니어링, 모델링, 평가, 배포를 각각 다른 에이전트가 처리합니다.
  • 사람 검토 지점: 파이프라인이 6개의 중요한 관문에서 멈추며, 사용자가 계속 진행 전 결정을 승인하거나 방향을 줄 수 있습니다.
  • AutoML 모델 탐색: FLAML AutoML과 적응형 시간 예산을 사용해 데이터셋 크기와 작업 복잡도에 따라 모델을 선택합니다.
  • 감사 추적 및 보고: AI 의사결정을 평이한 영어의 근거와 함께 기록하고, 지표, 차트, SHAP 설명 가능성, 편향 점검, 배포 옵션이 포함된 탭형 보고서를 제공합니다.
  • 데이터 준비 및 진단: 자동 프로파일링, 결측치 및 이상치 처리, 불균형 감지, 피처 선택, 분포, 히트맵, 클래스 균형 차트, 박스플롯 같은 EDA 차트를 포함합니다.
  • 내보내기 및 배포 옵션: model.pkl, scaler.pkl, predict.py, requirements.txt, README 같은 파일이 포함된 바로 실행 가능한 ZIP을 생성하거나, 실시간 API를 배포합니다.
  • 보안 처리: 업로드 시 데이터셋을 암호화하고 파이프라인 완료 후 삭제하며, 학습된 모델만 유지합니다.

OrchestraML 사용 방법

먼저 ML 목표를 평이한 영어로 설명하고, 데이터셋을 업로드하거나 에이전트가 데이터셋을 찾도록 맡기면 됩니다. 그러면 시스템이 파이프라인을 단계별로 실행하면서 로그를 보여주고 주요 체크포인트에서 승인을 요청합니다.

워크플로가 끝나면 지표, SHAP 설명, 편향 분석, AI 의사결정 로그가 포함된 보고서를 검토하세요. 그런 다음 모델 패키지를 다운로드하거나 결과 모델을 API로 배포할 수 있습니다.

사용 사례

  • 전처리, 모델 선택, 배포를 직접 코딩하지 않고 첫 머신러닝 프로젝트를 만드는 학생
  • CSV를 가지고 있고, 데이터 정제, 모델 학습, 성능 검토를 위한 안내형 워크플로가 필요한 분석가
  • 모델을 공유하기 전에 SHAP 플롯과 예측별 설명 같은 설명 가능성 산출물이 필요한 사용자
  • 주요 단계에서 자동 무인 실행 대신 승인이 필요한 통제된 파이프라인을 원하는 팀
  • 학습된 모델, 전처리 파일, 예측 스크립트를 포함한 패키지화된 로컬 모델 결과물이 필요한 워크플로

FAQ

  • OrchestraML은 ML 전문 지식이 필요한가요? 아니요. 소스에 따르면 사용자는 평이한 영어로 목표를 설명할 수 있으며 시작하는 데 ML 전문 지식이 필요하지 않습니다.
  • 자체 데이터셋을 업로드할 수 있나요? 네. 이 제품은 데이터셋 업로드와 에이전트가 처리하는 데이터셋 검색을 모두 지원합니다.
  • 파이프라인이 감독 없이 실행되나요? 아니요. 중요한 작업을 계속하기 전에 승인을 위해 멈추는 6개의 사람 체크포인트가 포함됩니다.
  • 출력에는 무엇이 포함되나요? 보고서에는 지표, SHAP 설명 가능성, 편향 분석, 배포 옵션이 포함되며, 제품은 다운로드 가능한 패키지도 내보낼 수 있습니다.
  • 실시간 배포를 지원하나요? 네. 소스에 따르면 사용자는 모델 패키지를 다운로드하거나 실시간 API를 배포할 수 있습니다.

대안

  • 기존 노트북 기반 워크플로: 더 많은 수동 제어와 유연성을 제공하지만, 분석, 정제, 학습, 패키징을 단계별로 사용자가 직접 처리해야 합니다.
  • 관리형 AutoML 플랫폼: 자동화된 모델 선택과 학습에 집중하지만, 다중 에이전트의 체크포인트 기반 워크플로 또는 같은 수준의 의사결정 감사 세부사항을 강조하지 않을 수 있습니다.
  • 개별 도구로 구성한 MLOps 파이프라인: 데이터 준비부터 배포까지 다룰 수 있지만, 하나의 안내형 인터페이스 대신 여러 구성 요소를 직접 조합하고 유지해야 하는 경우가 많습니다.
  • Python ML 라이브러리를 이용한 수동 스크립팅: 최대한의 커스터마이징을 제공하지만, EDA, 피처 엔지니어링, 평가, 배포 설정의 전부를 사용자가 책임져야 합니다.