에이전틱 코딩 중심
Kimi K2.6 위에 구축된 코딩 중심 에이전틱 모델로, 장기 소프트웨어 엔지니어링 작업과 종단 간 작업 완료에 대한 지원이 향상되었습니다.
Kimi-K2.7-Code는 Moonshot AI의 코딩 중심 에이전틱 모델로, 사고 모드 추론, 긴 문맥, 도구 사용, Moonshot AI 공식 API를 지원합니다.
Kimi-K2.7-Code는 Hugging Face에서 제공되는 Moonshot AI의 코딩 중심 에이전틱 모델입니다. 실제 세계의 장기적인 코딩 작업과 향상된 토큰 효율성에서 더 강한 성능을 보이는 Kimi-K2.6의 업데이트로 소개됩니다.
모델 요약에는 총 1T 파라미터, 활성화 파라미터 32B, 256K 문맥 길이, 그리고 공식 API를 통한 사고 모드, 도구 호출, 이미지/비디오 입력 지원을 갖춘 Mixture-of-Experts 아키텍처가 설명됩니다. 배포 가이드는 Kimi-K2.5/K2.6과 동일한 아키텍처를 재사용할 수 있다고 밝히며, vLLM, SGLang, KTransformers 예시를 제공합니다.
소프트웨어 엔지니어링 어시스턴트나 내부 코딩 워크플로를 구축하는 팀을 위해, 문서는 종단 간 작업 완료, 추론 중심 사용, 일반적인 추론 엔진에 대한 배포를 강조합니다. 또한 이 모델은 Moonshot AI 플랫폼을 통해 OpenAI/Anthropic 호환 API 액세스를 제공합니다.
Kimi K2.6 위에 구축된 코딩 중심 에이전틱 모델로, 장기 소프트웨어 엔지니어링 작업과 종단 간 작업 완료에 대한 지원이 향상되었습니다.
모델 페이지는 Kimi K2.6보다 사고 토큰 사용량이 약 30% 낮다고 보고하며, 이는 코딩 워크플로에서 더 토큰 효율적인 추론을 의미합니다.
총 1T 파라미터, 활성화 파라미터 32B, 384개 전문가, 토큰당 8개 선택 전문가를 갖춘 Mixture-of-Experts 아키텍처를 사용합니다.
문맥 길이는 256K로 표시되어 있어, 긴 코드베이스 상호작용과 확장된 작업 문맥을 지원합니다.
배포 가이드는 vLLM, SGLang, KTransformers에 대한 공식 지원을 권장하며, 사용 예시에는 OpenAI/Anthropic 호환 API가 표시됩니다.
모델 문서에는 공식 API에서 도구 호출, 사고 모드 추론, 이미지/비디오 입력 예시가 포함되어 있습니다.
문맥이 길고 추론과 도구 사용이 도움이 되는 저장소 또는 프로젝트 계획 전반의 다단계 소프트웨어 엔지니어링 작업을 위한 코딩 어시스턴트로 사용합니다.
클라이언트 측 요청 패턴을 바꾸지 않고 코딩 모델에 대한 OpenAI 또는 Anthropic 호환 액세스를 원하는 팀을 위해 내부 API 뒤에 배포합니다.
자체 호스팅 추론 구성이 필요하고 Moonshot AI가 문서화한 배포 패턴을 따르고 싶을 때 vLLM, SGLang 또는 KTransformers로 실행합니다.
공식 API 예시를 사용해 텍스트 프롬프트를 이미지나 비디오와 함께 처리하여, 코딩 중심 추론과 함께 시각적 이해가 필요한 워크플로를 지원합니다.
모델이 단일 고립된 프롬프트에 답하는 대신 긴 호흡의 작업을 계속 진행해야 하는 지속형 에이전트 스타일 작업에 적용합니다.
Kimi-K2.7-Code는 Hugging Face의 코딩 중심 에이전틱 모델입니다. 배포 가이드에서는 Kimi-K2.5/K2.6과 동일한 아키텍처를 재사용할 수 있다고 설명하며, vLLM, SGLang, KTransformers용 예시 배포가 제공됩니다.
이 모델은 사고 모드만 지원하는 것으로 문서화되어 있습니다. 사용 노트에도 즉시 모드는 지원되지 않는다고 되어 있으며, 서드파티 배포에서는 추론 파서를 적절하게 설정해야 합니다.
예. 사용 예시와 배포 가이드에는 텍스트 채팅과 시각적 입력이 모두 표시되어 있으며, 공식 API에서 이미지와 비디오 입력이 지원된다고 안내합니다.
모델 페이지에 따르면 platform.moonshot.ai에서 API에 액세스할 수 있으며, OpenAI 호환 및 Anthropic 호환 API 옵션이 제공됩니다.
원본 페이지에는 이 모델에 대한 전체 공개 가격 내역이 제공되지 않습니다. Hugging Face 가격 페이지 링크는 있지만, 수집된 근거에는 모델별 가격이나 사용 한도가 표시되어 있지 않습니다.
Ghost는 채팅, 코드 생성, 터미널 작업 실행을 지원하는 터미널 기반 AI assistant입니다. 무료 모델을 제공하며 Linux, macOS, Windows를 지원하는 오픈 소스입니다.
Devin is an AI coding agent and software engineer that helps developers and engineering teams plan and execute complex software tasks. It is available through desktop, cloud, JetBrains, and CLI surfaces, with plans for individuals, teams, and enterprises.
imgcook is a design-to-code tool that converts design drafts into front-end code. It supports plugin-based and developer workflows for Sketch, Photoshop, VS Code, and CLI usage.
Pi Coding Agent is a terminal-based coding agent for developers who want a minimal, extensible harness for interactive work and automation. It supports model switching, session branching, and multiple run modes including TUI, print/JSON, RPC, and SDK.
Assemble by Cohesium AI is an open-source prompt orchestration system for AI coding tools. It generates native config files that turn one project into a structured multi-agent setup across 21 platforms.
Ably Chat is a chat API platform for building custom realtime chat applications. It supports room-based messaging, typing indicators, presence, reactions, and message updates, with usage-based pricing options for different deployment stages.