UStackUStack
Kimi-K2.7-Code icon

Kimi-K2.7-Code

Kimi-K2.7-Code — агентная модель для программирования от Moonshot AI на Hugging Face: режим мышления, длинный контекст, tool use и доступ к официальному API.

Kimi-K2.7-Code

Обзор

Kimi-K2.7-Code — агентная модель для программирования от Moonshot AI, доступная на Hugging Face. Она представляется как обновление Kimi-K2.6 с более высокой эффективностью на реальных долгосрочных задачах программирования и лучшей эффективностью использования токенов.

Сводка модели описывает архитектуру Mixture-of-Experts с 1T общих параметров, 32B активируемых параметров, контекстом 256K и поддержкой режима мышления, вызова инструментов и входов изображений/видео через официальный API. Руководство по развертыванию говорит, что можно повторно использовать ту же архитектуру, что и у Kimi-K2.5/K2.6, и приводит примеры для vLLM, SGLang и KTransformers.

Для команд, создающих ассистентов по разработке ПО или внутренние рабочие процессы программирования, документация делает акцент на полном завершении задач, использовании, ориентированном на рассуждение, и развертывании на распространенных inference-движках. Модель также предоставляет доступ к API, совместимому с OpenAI/Anthropic, через платформу Moonshot AI.

Ключевые возможности

Агентный фокус на программировании

Создана как агентная модель для программирования на базе Kimi K2.6, с улучшенной поддержкой долгосрочных задач разработки и полного завершения задач.

Сниженное использование thinking-токенов

На странице модели указано примерно на 30% меньшее использование thinking-токенов по сравнению с Kimi K2.6, что говорит о более экономичном по токенам рассуждении в рабочих сценариях программирования.

Крупная MoE-архитектура

Использует архитектуру Mixture-of-Experts с 1T общих параметров, 32B активируемых параметров, 384 экспертами и выбором 8 экспертов на токен.

Длинное окно контекста

Длина контекста указана как 256K, что подходит для длинных взаимодействий с кодовой базой и расширенного контекста задачи.

Несколько вариантов развертывания

В руководстве по развертыванию рекомендуется официальная поддержка vLLM, SGLang и KTransformers, а в примерах использования показаны API, совместимые с OpenAI и Anthropic.

Поддержка мультимодальности и tool use

В документации модели приведены tool calling, рассуждения в режиме мышления и примеры ввода изображений и видео в официальном API.

Типичные сценарии использования

  • Полные задачи программирования

    Используйте модель как ассистента по программированию для многошаговой инженерной работы, где полезны длинный контекст, рассуждение и использование инструментов по всему репозиторию или плану проекта.

  • Интеграция API для инструментов разработчика

    Разверните её за внутренним API для команд, которым нужен доступ к модели для программирования, совместимый с OpenAI или Anthropic, без изменения шаблонов запросов на стороне клиента.

  • Самостоятельно размещаемый inference

    Запускайте её с помощью vLLM, SGLang или KTransformers, когда требуется self-hosted inference и нужно следовать схемам развертывания, описанным Moonshot AI.

  • Мультимодальные рабочие процессы ассистента

    Используйте примеры официального API для обработки текстовых запросов вместе с изображениями или видео в сценариях, где визуальное понимание нужно вместе с рассуждением, ориентированным на программирование.

  • Долгоживущие агентные сценарии

    Применяйте её к длительным агентным задачам, где модели нужно продолжать работу над долгосрочными сценариями, а не отвечать на один изолированный запрос.

Pros and Cons

Pros

  • Ориентирована на программирование и завершение агентных задач, а не на общий чат.
  • Длинное окно контекста 256K полезно для расширенного контекста репозитория и рабочего процесса.
  • Официальные примеры API охватывают текст, изображения и видео.
  • Доступны рекомендации по развертыванию для vLLM, SGLang и KTransformers.
  • На странице модели указано более низкое использование thinking-токенов по сравнению с Kimi K2.6.

Cons

  • В документации указано, что модель поддерживает только режим мышления, а instant mode не поддерживается.
  • Собранные данные не содержат публичной таблицы цен или ограничений по использованию, специфичных для этой модели.
  • Некоторые детали развертывания приведены в виде примеров, а в руководстве отмечено, что inference-движки быстро меняются, поэтому конфигурации могут потребовать настройки.

FAQ

Как можно развернуть Kimi-K2.7-Code?

Kimi-K2.7-Code — агентная модель для программирования на Hugging Face. В руководстве по развертыванию указано, что можно повторно использовать ту же архитектуру, что и для Kimi-K2.5/K2.6, а примеры развертывания приведены для vLLM, SGLang и KTransformers.

Поддерживает ли Kimi-K2.7-Code instant mode?

Модель документирована как поддерживающая только режим мышления. В примечаниях по использованию также указано, что instant mode не поддерживается, а сторонние развертывания должны корректно настраивать parser рассуждений.

Может ли Kimi-K2.7-Code работать с изображениями или видео?

Да. Примеры использования и руководство по развертыванию показывают как текстовый чат, так и визуальные входные данные, а также указывают, что поддерживаются входы изображений и видео через официальный API.

Как получить доступ к официальному API?

Да. На странице модели указано, что доступ к API возможен на platform.moonshot.ai, с вариантами API, совместимыми с OpenAI и Anthropic.

Сколько стоит использование модели?

Исходные страницы не содержат полной публичной разбивки цен для этой модели. На страницу цен Hugging Face есть ссылка, но в собранных данных не указана модельная цена или квота.

Quick Facts

Категория
Developer Tool
Семейство модели
Moonshot AI Kimi K2.7 Code
Платформа
Hugging Face
Домен источника
huggingface.co
Доступ к API
platform.moonshot.ai
Длина контекста
256K