Kimi-K2.7-Code icon

Kimi-K2.7-Code

Kimi-K2.7-Code는 Moonshot AI의 코딩 중심 에이전틱 모델로, 사고 모드 추론, 긴 문맥, 도구 사용, Moonshot AI 공식 API를 지원합니다.

Kimi-K2.7-Code

개요

Kimi-K2.7-Code는 Hugging Face에서 제공되는 Moonshot AI의 코딩 중심 에이전틱 모델입니다. 실제 세계의 장기적인 코딩 작업과 향상된 토큰 효율성에서 더 강한 성능을 보이는 Kimi-K2.6의 업데이트로 소개됩니다.

모델 요약에는 총 1T 파라미터, 활성화 파라미터 32B, 256K 문맥 길이, 그리고 공식 API를 통한 사고 모드, 도구 호출, 이미지/비디오 입력 지원을 갖춘 Mixture-of-Experts 아키텍처가 설명됩니다. 배포 가이드는 Kimi-K2.5/K2.6과 동일한 아키텍처를 재사용할 수 있다고 밝히며, vLLM, SGLang, KTransformers 예시를 제공합니다.

소프트웨어 엔지니어링 어시스턴트나 내부 코딩 워크플로를 구축하는 팀을 위해, 문서는 종단 간 작업 완료, 추론 중심 사용, 일반적인 추론 엔진에 대한 배포를 강조합니다. 또한 이 모델은 Moonshot AI 플랫폼을 통해 OpenAI/Anthropic 호환 API 액세스를 제공합니다.

주요 기능

에이전틱 코딩 중심

Kimi K2.6 위에 구축된 코딩 중심 에이전틱 모델로, 장기 소프트웨어 엔지니어링 작업과 종단 간 작업 완료에 대한 지원이 향상되었습니다.

감소된 사고 토큰 사용량

모델 페이지는 Kimi K2.6보다 사고 토큰 사용량이 약 30% 낮다고 보고하며, 이는 코딩 워크플로에서 더 토큰 효율적인 추론을 의미합니다.

대규모 MoE 아키텍처

총 1T 파라미터, 활성화 파라미터 32B, 384개 전문가, 토큰당 8개 선택 전문가를 갖춘 Mixture-of-Experts 아키텍처를 사용합니다.

긴 문맥 창

문맥 길이는 256K로 표시되어 있어, 긴 코드베이스 상호작용과 확장된 작업 문맥을 지원합니다.

여러 배포 경로

배포 가이드는 vLLM, SGLang, KTransformers에 대한 공식 지원을 권장하며, 사용 예시에는 OpenAI/Anthropic 호환 API가 표시됩니다.

멀티모달 및 도구 사용 지원

모델 문서에는 공식 API에서 도구 호출, 사고 모드 추론, 이미지/비디오 입력 예시가 포함되어 있습니다.

일반적인 사용 사례

  • 종단 간 코딩 작업

    문맥이 길고 추론과 도구 사용이 도움이 되는 저장소 또는 프로젝트 계획 전반의 다단계 소프트웨어 엔지니어링 작업을 위한 코딩 어시스턴트로 사용합니다.

  • 개발자 도구용 API 통합

    클라이언트 측 요청 패턴을 바꾸지 않고 코딩 모델에 대한 OpenAI 또는 Anthropic 호환 액세스를 원하는 팀을 위해 내부 API 뒤에 배포합니다.

  • 자체 호스팅 추론

    자체 호스팅 추론 구성이 필요하고 Moonshot AI가 문서화한 배포 패턴을 따르고 싶을 때 vLLM, SGLang 또는 KTransformers로 실행합니다.

  • 멀티모달 어시스턴트 워크플로

    공식 API 예시를 사용해 텍스트 프롬프트를 이미지나 비디오와 함께 처리하여, 코딩 중심 추론과 함께 시각적 이해가 필요한 워크플로를 지원합니다.

  • 장기 실행 에이전트 워크플로

    모델이 단일 고립된 프롬프트에 답하는 대신 긴 호흡의 작업을 계속 진행해야 하는 지속형 에이전트 스타일 작업에 적용합니다.

Pros and Cons

Pros

  • 문서는 이 모델이 사고 모드만 지원하며 즉시 모드는 지원하지 않는다고 설명합니다.
  • 수집된 근거에는 공개된 모델별 가격표나 사용 한도가 포함되어 있지 않습니다.
  • 일부 배포 세부 정보는 예시 기반이며, 가이드에서는 추론 엔진이 빠르게 변하고 있으므로 구성이 조정될 수 있다고 안내합니다.

Cons

  • 일반 채팅보다 코딩과 에이전틱 작업 완료에 초점을 맞춥니다.
  • 긴 256K 문맥 창은 확장된 저장소 및 워크플로 문맥에 유용합니다.
  • 공식 API 예시는 텍스트, 이미지, 비디오 입력을 다룹니다.
  • 배포 가이드는 vLLM, SGLang, KTransformers에 대해 제공됩니다.
  • 모델 페이지는 Kimi K2.6보다 낮은 사고 토큰 사용량을 보고합니다.

FAQ

Kimi-K2.7-Code를 어떻게 배포하나요?

Kimi-K2.7-Code는 Hugging Face의 코딩 중심 에이전틱 모델입니다. 배포 가이드에서는 Kimi-K2.5/K2.6과 동일한 아키텍처를 재사용할 수 있다고 설명하며, vLLM, SGLang, KTransformers용 예시 배포가 제공됩니다.

Kimi-K2.7-Code는 즉시 모드를 지원하나요?

이 모델은 사고 모드만 지원하는 것으로 문서화되어 있습니다. 사용 노트에도 즉시 모드는 지원되지 않는다고 되어 있으며, 서드파티 배포에서는 추론 파서를 적절하게 설정해야 합니다.

Kimi-K2.7-Code는 이미지나 비디오와 함께 사용할 수 있나요?

예. 사용 예시와 배포 가이드에는 텍스트 채팅과 시각적 입력이 모두 표시되어 있으며, 공식 API에서 이미지와 비디오 입력이 지원된다고 안내합니다.

공식 API에는 어떻게 접근하나요?

모델 페이지에 따르면 platform.moonshot.ai에서 API에 액세스할 수 있으며, OpenAI 호환 및 Anthropic 호환 API 옵션이 제공됩니다.

이 모델을 사용하는 데 비용은 얼마인가요?

원본 페이지에는 이 모델에 대한 전체 공개 가격 내역이 제공되지 않습니다. Hugging Face 가격 페이지 링크는 있지만, 수집된 근거에는 모델별 가격이나 사용 한도가 표시되어 있지 않습니다.

Quick Facts

카테고리
Developer Tool
모델 패밀리
Moonshot AI Kimi K2.7 Code
플랫폼
Hugging Face
소스 도메인
huggingface.co
API 액세스
platform.moonshot.ai
문맥 길이
256K