MiniMax-AI/cli
MiniMax-AI/cli는 MiniMax AI Platform의 공식 CLI로 텍스트·이미지·영상·음성·음악 생성은 물론 비전과 웹 검색까지 지원합니다.
MiniMax-AI/cli란?
MiniMax-AI/cli는 MiniMax AI Platform의 공식 명령줄 인터페이스(CLI)입니다. 에이전트 워크플로, 터미널 또는 자동화 파이프라인에서 텍스트, 이미지, 영상, 음성, 음악 등 다양한 미디어 유형을 직접 생성하고 처리할 수 있습니다.
CLI는 모든 에이전트 환경(“모든 에이전트나 터미널에서 사용 가능”)에서 활용할 수 있도록 설계되었으며, 서로 다른 API 엔드포인트를 통해 글로벌 및 CN 지역을 모두 지원합니다.
주요 기능
- 하나의 CLI로 멀티모달 생성: 명령줄 프롬프트와 입력으로 텍스트, 이미지, 영상, 음성(TTS), 음악을 생성합니다.
- 스트리밍 및 구조화 출력 지원 텍스트 채팅:
mmx text chat명령으로 멀티턴 채팅, 스트리밍, 시스템 프롬프트, JSON 출력을 지원합니다. - 이미지 생성 제어: 종횡비 설정과 배치 생성(
--n)으로 이미지를 만들고, 결과를 출력 디렉터리에 저장합니다. - 진행 상황 추적 비동기 영상 생성: 영상 작업을 비동기(
--async)로 시작하고, 작업/파일 ID로 나중에 결과를 다운로드합니다. - 음성, 속도, 스트리밍 지원 음성 합성: 30+ 음성으로 TTS를 생성하고 속도를 조정하며, 오디오 출력을 미디어 플레이어로 스트리밍합니다.
- 음악 생성 기능: 가사 기반 노래 제작, 프롬프트로 자동 가사 생성(
--lyrics-optimizer), 인스트루멘탈 트랙 제작, 참조 오디오로 커버 생성. - 명령줄 비전 및 검색:
mmx vision으로 이미지 설명,mmx search로 웹 검색(포함 JSON 출력 모드). - 인증 및 지역 설정: API 키로 로그인하고 지역 설정 관리(예: 지역을
cn으로 설정).
MiniMax-AI/cli 사용 방법
- 설치:
- AI 에이전트(OpenClaw, Cursor, Claude Code 등):
npx skills add MiniMax-AI/cli -y -g로 스킬 추가. - 터미널 사용:
npm install -g mmx-cli로 전역 설치.
- AI 에이전트(OpenClaw, Cursor, Claude Code 등):
- MiniMax 토큰 플랜 API 키로 인증:
mmx auth login --api-key sk-xxxxx
- 미디어 명령 실행. 예시:
- 텍스트:
mmx text chat --message "What is MiniMax?" - 이미지:
mmx image "A cat in a spacesuit" - 음성:
mmx speech synthesize --text "Hello!" --out hello.mp3 - 영상:
mmx video generate --prompt "Ocean waves at sunset" - 음악:
mmx music generate --prompt "Upbeat pop" --lyrics "[verse] La da dee, sunny day"
- 텍스트:
- 필요 시 JSON 모드 사용: 입력을 파이프(예:
cat messages.json)로 채팅 명령에 전달하고--output json요청.
사용 사례
- 에이전트 워크플로(코딩 어시스턴트): AI 에이전트에 이 CLI를 “스킬”로 추가해
mmx text chat,mmx image,mmx video generate등의 명령을 에이전트 규칙에 따라 호출. - 터미널 기반 콘텐츠 제작: 별도 UI 없이 스크립트로 이미지, 음성, 음악 생성(예: 자산 생성 후 출력 경로 저장).
- 인터랙티브 작업을 위한 스트리밍 텍스트 응답:
mmx text chat --stream으로 터미널 세션에서 응답 생성 과정을 실시간 관찰. - 비동기 미디어 파이프라인:
--async로 영상 생성 작업 시작 후mmx video task get --task-id ...와mmx video download --file-id ...로 결과 검색 및 다운로드. - 미디어 변환 및 음악 커버:
mmx music cover로--audio-file또는--audio를 사용해 인스트루멘탈 트랙이나 참조 오디오 기반 커버 버전 생성.
자주 묻는 질문
-
CLI로 생성 가능한 미디어 유형은? README에 텍스트, 이미지, 영상, 음성(TTS), 음악 지원이 나와 있으며, 비전(이미지 이해/설명)과 웹 검색도 포함됩니다.
-
인증 방법은?
mmx auth login --api-key sk-xxxxx사용. CLI는mmx auth status,mmx auth refresh,mmx auth logout명령도 제공합니다. -
스트리밍 출력 지원하나요? 네. 텍스트 채팅에
--stream옵션이 있고, 음성 합성은--stream모드 지원(예: 출력mpv -로 파이프). -
채팅/검색 JSON 출력 사용법은? CLI 예시에서 텍스트 채팅(파일/STDIN 메시지 파이프 포함)과 검색 명령에
--output json표시. -
글로벌 및 CN 엔드포인트 모두 지원하나요? 프로젝트에 “api.minimax.io(글로벌)와 api.minimaxi.com(CN) 완벽 지원” 명시, 지역을
cn으로 설정 예시(mmx config set --key region --value cn).
대안
- MiniMax Platform HTTP API 클라이언트: 직접 통합 선호 시 자체 스크립트로 플랫폼 엔드포인트 호출. CLI보다 제어 우수하나 인증 및 요청 로직 직접 처리 필요.
- 기타 에이전트 “도구/스킬” CLI: 많은 AI 에이전트가 도구/스킬 연결 지원; 다른 도구 커넥터로 에이전트 기반 미디어 생성 가능. 차이는 도구 노출 방식과 명령 호출 방식.
- 전용 UI 기반 미디어 생성기: 비개발자 워크플로에 브라우저 기반 도구가 프롬프트-출력 상호작용 간소화. CLI 대비 자동화 및 스크립팅 유연성 대신 가이드 인터페이스 제공.
대안
紫东太初
중국 과학 아카데미 자동화 연구소와 우한 인공지능 연구원이 공동으로 출시한 차세대 멀티모달 대형 모델로, 다중 회차 Q&A, 텍스트 작성, 이미지 생성 등 포괄적인 Q&A 작업을 지원합니다.
PXZ AI
이미지, 비디오, 음성, 글쓰기 및 채팅 도구를 통합한 올인원 AI 플랫폼으로, 창의성과 협업을 향상시킵니다.
Slidesgo
Slidesgo에서 무료 Google Slides 테마와 PowerPoint 템플릿을 찾아 다운로드하고, 온라인에서 맞춤 편집해 프레젠테이션을 제작하세요.
Grok AI Assistant
Grok은 xAI가 개발한 무료 AI 어시스턴트로, 실시간 정보 접근 및 이미지 생성과 같은 고급 기능을 제공하는 동시에 진실성과 객관성을 최우선으로 하도록 설계되었습니다.
AakarDev AI
AakarDev AI는 원활한 벡터 데이터베이스 통합을 통해 AI 애플리케이션 개발을 간소화하는 강력한 플랫폼으로, 신속한 배포와 확장성을 가능하게 합니다.
Oli: Pregnancy Safety Scanner
Oli: Pregnancy Safety Scanner로 임신 중 음식, 스킨케어, 보충제 등 제품을 바코드·사진 스캔해 안전 여부를 확인하세요(임신 주차별).