UStackUStack
MiniMax-AI/cli icon

MiniMax-AI/cli

MiniMax-AI/cli는 MiniMax AI Platform의 공식 CLI로 텍스트·이미지·영상·음성·음악 생성은 물론 비전과 웹 검색까지 지원합니다.

MiniMax-AI/cli

MiniMax-AI/cli란?

MiniMax-AI/cli는 MiniMax AI Platform의 공식 명령줄 인터페이스(CLI)입니다. 에이전트 워크플로, 터미널 또는 자동화 파이프라인에서 텍스트, 이미지, 영상, 음성, 음악 등 다양한 미디어 유형을 직접 생성하고 처리할 수 있습니다.

CLI는 모든 에이전트 환경(“모든 에이전트나 터미널에서 사용 가능”)에서 활용할 수 있도록 설계되었으며, 서로 다른 API 엔드포인트를 통해 글로벌 및 CN 지역을 모두 지원합니다.

주요 기능

  • 하나의 CLI로 멀티모달 생성: 명령줄 프롬프트와 입력으로 텍스트, 이미지, 영상, 음성(TTS), 음악을 생성합니다.
  • 스트리밍 및 구조화 출력 지원 텍스트 채팅: mmx text chat 명령으로 멀티턴 채팅, 스트리밍, 시스템 프롬프트, JSON 출력을 지원합니다.
  • 이미지 생성 제어: 종횡비 설정과 배치 생성(--n)으로 이미지를 만들고, 결과를 출력 디렉터리에 저장합니다.
  • 진행 상황 추적 비동기 영상 생성: 영상 작업을 비동기(--async)로 시작하고, 작업/파일 ID로 나중에 결과를 다운로드합니다.
  • 음성, 속도, 스트리밍 지원 음성 합성: 30+ 음성으로 TTS를 생성하고 속도를 조정하며, 오디오 출력을 미디어 플레이어로 스트리밍합니다.
  • 음악 생성 기능: 가사 기반 노래 제작, 프롬프트로 자동 가사 생성(--lyrics-optimizer), 인스트루멘탈 트랙 제작, 참조 오디오로 커버 생성.
  • 명령줄 비전 및 검색: mmx vision으로 이미지 설명, mmx search로 웹 검색(포함 JSON 출력 모드).
  • 인증 및 지역 설정: API 키로 로그인하고 지역 설정 관리(예: 지역을 cn으로 설정).

MiniMax-AI/cli 사용 방법

  1. 설치:
    • AI 에이전트(OpenClaw, Cursor, Claude Code 등): npx skills add MiniMax-AI/cli -y -g로 스킬 추가.
    • 터미널 사용: npm install -g mmx-cli로 전역 설치.
  2. MiniMax 토큰 플랜 API 키로 인증:
    • mmx auth login --api-key sk-xxxxx
  3. 미디어 명령 실행. 예시:
    • 텍스트: mmx text chat --message "What is MiniMax?"
    • 이미지: mmx image "A cat in a spacesuit"
    • 음성: mmx speech synthesize --text "Hello!" --out hello.mp3
    • 영상: mmx video generate --prompt "Ocean waves at sunset"
    • 음악: mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
  4. 필요 시 JSON 모드 사용: 입력을 파이프(예: cat messages.json)로 채팅 명령에 전달하고 --output json 요청.

사용 사례

  • 에이전트 워크플로(코딩 어시스턴트): AI 에이전트에 이 CLI를 “스킬”로 추가해 mmx text chat, mmx image, mmx video generate 등의 명령을 에이전트 규칙에 따라 호출.
  • 터미널 기반 콘텐츠 제작: 별도 UI 없이 스크립트로 이미지, 음성, 음악 생성(예: 자산 생성 후 출력 경로 저장).
  • 인터랙티브 작업을 위한 스트리밍 텍스트 응답: mmx text chat --stream으로 터미널 세션에서 응답 생성 과정을 실시간 관찰.
  • 비동기 미디어 파이프라인: --async로 영상 생성 작업 시작 후 mmx video task get --task-id ...mmx video download --file-id ...로 결과 검색 및 다운로드.
  • 미디어 변환 및 음악 커버: mmx music cover--audio-file 또는 --audio를 사용해 인스트루멘탈 트랙이나 참조 오디오 기반 커버 버전 생성.

자주 묻는 질문

  • CLI로 생성 가능한 미디어 유형은? README에 텍스트, 이미지, 영상, 음성(TTS), 음악 지원이 나와 있으며, 비전(이미지 이해/설명)과 웹 검색도 포함됩니다.

  • 인증 방법은? mmx auth login --api-key sk-xxxxx 사용. CLI는 mmx auth status, mmx auth refresh, mmx auth logout 명령도 제공합니다.

  • 스트리밍 출력 지원하나요? 네. 텍스트 채팅에 --stream 옵션이 있고, 음성 합성은 --stream 모드 지원(예: 출력 mpv -로 파이프).

  • 채팅/검색 JSON 출력 사용법은? CLI 예시에서 텍스트 채팅(파일/STDIN 메시지 파이프 포함)과 검색 명령에 --output json 표시.

  • 글로벌 및 CN 엔드포인트 모두 지원하나요? 프로젝트에 “api.minimax.io(글로벌)와 api.minimaxi.com(CN) 완벽 지원” 명시, 지역을 cn으로 설정 예시(mmx config set --key region --value cn).

대안

  • MiniMax Platform HTTP API 클라이언트: 직접 통합 선호 시 자체 스크립트로 플랫폼 엔드포인트 호출. CLI보다 제어 우수하나 인증 및 요청 로직 직접 처리 필요.
  • 기타 에이전트 “도구/스킬” CLI: 많은 AI 에이전트가 도구/스킬 연결 지원; 다른 도구 커넥터로 에이전트 기반 미디어 생성 가능. 차이는 도구 노출 방식과 명령 호출 방식.
  • 전용 UI 기반 미디어 생성기: 비개발자 워크플로에 브라우저 기반 도구가 프롬프트-출력 상호작용 간소화. CLI 대비 자동화 및 스크립팅 유연성 대신 가이드 인터페이스 제공.