Kimi-K2.7-Code

Kimi-K2.7-Code — агентная модель для программирования от Moonshot AI на Hugging Face: режим мышления, длинный контекст, tool use и доступ к официальному API.

Агент программирования

AI Инструменты Разработчика

AI Ассистент Кода

Посетить Сайт

Обзор

Kimi-K2.7-Code — агентная модель для программирования от Moonshot AI, доступная на Hugging Face. Она представляется как обновление Kimi-K2.6 с более высокой эффективностью на реальных долгосрочных задачах программирования и лучшей эффективностью использования токенов.

Сводка модели описывает архитектуру Mixture-of-Experts с 1T общих параметров, 32B активируемых параметров, контекстом 256K и поддержкой режима мышления, вызова инструментов и входов изображений/видео через официальный API. Руководство по развертыванию говорит, что можно повторно использовать ту же архитектуру, что и у Kimi-K2.5/K2.6, и приводит примеры для vLLM, SGLang и KTransformers.

Для команд, создающих ассистентов по разработке ПО или внутренние рабочие процессы программирования, документация делает акцент на полном завершении задач, использовании, ориентированном на рассуждение, и развертывании на распространенных inference-движках. Модель также предоставляет доступ к API, совместимому с OpenAI/Anthropic, через платформу Moonshot AI.

Ключевые возможности

Агентный фокус на программировании

Создана как агентная модель для программирования на базе Kimi K2.6, с улучшенной поддержкой долгосрочных задач разработки и полного завершения задач.

Сниженное использование thinking-токенов

На странице модели указано примерно на 30% меньшее использование thinking-токенов по сравнению с Kimi K2.6, что говорит о более экономичном по токенам рассуждении в рабочих сценариях программирования.

Крупная MoE-архитектура

Использует архитектуру Mixture-of-Experts с 1T общих параметров, 32B активируемых параметров, 384 экспертами и выбором 8 экспертов на токен.

Длинное окно контекста

Длина контекста указана как 256K, что подходит для длинных взаимодействий с кодовой базой и расширенного контекста задачи.

Несколько вариантов развертывания

В руководстве по развертыванию рекомендуется официальная поддержка vLLM, SGLang и KTransformers, а в примерах использования показаны API, совместимые с OpenAI и Anthropic.

Поддержка мультимодальности и tool use

В документации модели приведены tool calling, рассуждения в режиме мышления и примеры ввода изображений и видео в официальном API.

Типичные сценарии использования

Полные задачи программирования
Используйте модель как ассистента по программированию для многошаговой инженерной работы, где полезны длинный контекст, рассуждение и использование инструментов по всему репозиторию или плану проекта.
Интеграция API для инструментов разработчика
Разверните её за внутренним API для команд, которым нужен доступ к модели для программирования, совместимый с OpenAI или Anthropic, без изменения шаблонов запросов на стороне клиента.
Самостоятельно размещаемый inference
Запускайте её с помощью vLLM, SGLang или KTransformers, когда требуется self-hosted inference и нужно следовать схемам развертывания, описанным Moonshot AI.
Мультимодальные рабочие процессы ассистента
Используйте примеры официального API для обработки текстовых запросов вместе с изображениями или видео в сценариях, где визуальное понимание нужно вместе с рассуждением, ориентированным на программирование.
Долгоживущие агентные сценарии
Применяйте её к длительным агентным задачам, где модели нужно продолжать работу над долгосрочными сценариями, а не отвечать на один изолированный запрос.

Pros and Cons

Pros

Ориентирована на программирование и завершение агентных задач, а не на общий чат.
Длинное окно контекста 256K полезно для расширенного контекста репозитория и рабочего процесса.
Официальные примеры API охватывают текст, изображения и видео.
Доступны рекомендации по развертыванию для vLLM, SGLang и KTransformers.
На странице модели указано более низкое использование thinking-токенов по сравнению с Kimi K2.6.

Cons

В документации указано, что модель поддерживает только режим мышления, а instant mode не поддерживается.
Собранные данные не содержат публичной таблицы цен или ограничений по использованию, специфичных для этой модели.
Некоторые детали развертывания приведены в виде примеров, а в руководстве отмечено, что inference-движки быстро меняются, поэтому конфигурации могут потребовать настройки.

FAQ

Как можно развернуть Kimi-K2.7-Code?

Kimi-K2.7-Code — агентная модель для программирования на Hugging Face. В руководстве по развертыванию указано, что можно повторно использовать ту же архитектуру, что и для Kimi-K2.5/K2.6, а примеры развертывания приведены для vLLM, SGLang и KTransformers.

Поддерживает ли Kimi-K2.7-Code instant mode?

Модель документирована как поддерживающая только режим мышления. В примечаниях по использованию также указано, что instant mode не поддерживается, а сторонние развертывания должны корректно настраивать parser рассуждений.

Может ли Kimi-K2.7-Code работать с изображениями или видео?

Да. Примеры использования и руководство по развертыванию показывают как текстовый чат, так и визуальные входные данные, а также указывают, что поддерживаются входы изображений и видео через официальный API.

Как получить доступ к официальному API?

Да. На странице модели указано, что доступ к API возможен на platform.moonshot.ai, с вариантами API, совместимыми с OpenAI и Anthropic.

Сколько стоит использование модели?

Исходные страницы не содержат полной публичной разбивки цен для этой модели. На страницу цен Hugging Face есть ссылка, но в собранных данных не указана модельная цена или квота.

Quick Facts

Категория: Developer Tool
Семейство модели: Moonshot AI Kimi K2.7 Code
Платформа: Hugging Face
Домен источника: huggingface.co
Доступ к API: platform.moonshot.ai
Длина контекста: 256K

Альтернативы Kimi-K2.7-Code

Ghost

Ghost — терминальный AI-ассистент для чата, генерации кода и запуска задач в командной строке. Бесплатные модели, Linux, macOS, Windows, open source.

Devin

Devin is an AI coding agent and software engineer that helps developers and engineering teams plan and execute complex software tasks. It is available through desktop, cloud, JetBrains, and CLI surfaces, with plans for individuals, teams, and enterprises.

图像大厨imgcook

imgcook is a design-to-code tool that converts design drafts into front-end code. It supports plugin-based and developer workflows for Sketch, Photoshop, VS Code, and CLI usage.

Pi Coding Agent

Pi Coding Agent is a terminal-based coding agent for developers who want a minimal, extensible harness for interactive work and automation. It supports model switching, session branching, and multiple run modes including TUI, print/JSON, RPC, and SDK.

Assemble

Assemble by Cohesium AI is an open-source prompt orchestration system for AI coding tools. It generates native config files that turn one project into a structured multi-agent setup across 21 platforms.

Ably Chat

Ably Chat is a chat API platform for building custom realtime chat applications. It supports room-based messaging, typing indicators, presence, reactions, and message updates, with usage-based pricing options for different deployment stages.