UStackUStack
xAI API icon

xAI API

개발자를 위한 xAI API 튜토리얼. 계정/크레딧 설정, API 키 생성, SDK 설치 후 Grok 모델에 첫 텍스트·이미지 요청.

xAI API

xAI API란?

xAI API는 애플리케이션 코드에서 xAI의 Grok 모델을 사용할 수 있는 개발자용 인터페이스입니다. API의 핵심 목적은 프롬프트(일부 모델의 경우 이미지 포함)를 받아 생성된 응답을 반환하여 표시, 처리 또는 후속 작업에 구조화할 수 있게 하는 것입니다.

빠른 시작 가이드는 전체 워크플로를 안내합니다: xAI 계정 및 크레딧 생성, API 키 생성, SDK 설치, 지원 엔드포인트와 예제를 사용한 Grok 모델로의 첫 요청 전송.

주요 기능

  • 환경 변수 API 키 인증: XAI_API_KEY로 코드를 구성하면 xAI SDK가 자동으로 읽습니다.
  • 일반 언어 SDK 지원: Python 또는 JavaScript용 xAI SDK를 설치해 원시 HTTP 요청 없이 Grok 모델 호출.
  • 대화식 텍스트 생성: 시스템 및 사용자 메시지 전송 후 모델의 텍스트 응답 샘플링.
  • Responses 엔드포인트 호환: API 키로 https://api.x.ai/v1/responses 직접 호출하여 모델 추론.
  • 멀티모달 입력(텍스트 + 이미지): 지원 모델의 경우 단일 요청에 텍스트와 이미지 URL 포함.
  • 구조화된 출력(지원 모델): 일부 모델에서 출력 스키마를 강제해 생성 결과 형태 제어.

xAI API 사용 방법

  1. xAI 계정 생성 accounts.x.ai에서 후 크레딧 추가하여 API 사용.
  2. API 키 생성 xAI Console의 API Keys에서.
  3. XAI_API_KEY 설정 터미널 export 또는 .env 파일에 추가:
    • export XAI_API_KEY="your_api_key"
    • XAI_API_KEY=your_api_key
  4. 언어에 맞는 SDK 설치:
    • Python: pip install xai-sdk
    • JavaScript: npm install ai @ai-sdk/xai zod
  5. Grok 모델로 요청 전송 (예: 텍스트용 grok-4.20-reasoning, 이미지+텍스트용 grok-4). SDK 예제 또는 직접 responses HTTP 요청 사용.

사용 사례

  • Grok용 채팅 인터페이스 구축: 사용자 질문과 선택적 시스템 지시 전송 후 response.content 또는 completion.output_text 표시.
  • 알려진 모델 엔드포인트로 텍스트 생성: POST https://api.x.ai/v1/responses 워크플로로 직접 HTTP 호출 선호 서비스에 Grok 통합.
  • Q&A 흐름에 이미지 이해 추가: 빠른 시작의 멀티모달 요청 형식으로 “이 이미지에 뭐가 있나요?” 같은 프롬프트와 이미지 URL 제출.
  • 후속 처리용 출력 형식 강제: 지원 Grok 모델에서 구조화된 출력을 적용해 정의한 스키마 준수.
  • 런타임 간 빠른 실험: 동일 환경 변수 설정(XAI_API_KEY) 유지하며 Python과 JavaScript 예제 전환.

자주 묻는 질문

xAI API 요청 인증 방법은?

xAI Console에서 API 키 생성 후 XAI_API_KEY로 설정(export XAI_API_KEY="..." 또는 .env 파일). xAI SDK가 이 환경 변수를 자동 읽음.

첫 요청에 어떤 Grok 모델 사용?

빠른 시작 예제는 텍스트 전용 대화 생성에 grok-4.20-reasoning, 이미지+텍스트 입력에 grok-4 사용.

SDK 없이 API 호출 가능?

네. 빠른 시작에 https://api.x.ai/v1/responsesmodelinput 포함 JSON 본문을 게시하는 직접 curl 예제 포함.

Grok에 이미지 전송 방법?

이미지 수용 모델의 경우 입력에 텍스트와 이미지 URL 포함 (SDK에서 input_image / input_text 구조 또는 responses 호출의 형식화된 콘텐츠 구조 사용).

구조화된 출력이란?

빠른 시작에서 특정 모델이 구조화된 출력을 지원하며 LLM 출력에 스키마 강제. 상세 사용은 “Text Generation Guide” 참조.

대안

  • 다른 LLM 제공자의 채팅/어시스턴트 API 사용: “프롬프트 입력, 생성 텍스트 출력” 워크플로라면 유사 키 기반 인증 및 요청 형식으로 다른 벤더 API 교체.
  • 프레임워크 무관 텍스트 생성 접근: 벤더 특정 SDK 대신 “completions/responses” 스타일 엔드포인트로 직접 요청 구축해 언어 간 일관성 유지.
  • 멀티모달 모델 API 사용: 이미지+텍스트 이해가 주요 필요 시 이미지 입력을 명시 지원하는 제공자 API 스키마 찾고 요청 페이로드 조정.