Kimi-K2.7-Code icon

Kimi-K2.7-Code

Kimi-K2.7-Code est un modèle agentique axé code de Moonshot AI sur Hugging Face, avec raisonnement en mode thinking, long contexte, outils et API officielle.

Kimi-K2.7-Code

Aperçu

Kimi-K2.7-Code est un modèle agentique axé code de Moonshot AI disponible sur Hugging Face. Il est présenté comme une mise à jour de Kimi-K2.6, avec de meilleures performances sur des tâches de codage réelles à long horizon et une efficacité en jetons améliorée.

Le résumé du modèle décrit une architecture Mixture-of-Experts avec 1T de paramètres au total, 32B de paramètres activés, une longueur de contexte de 256K, ainsi que la prise en charge du mode thinking, de l’appel d’outils et des entrées image/vidéo via l’API officielle. Le guide de déploiement précise que la même architecture que Kimi-K2.5/K2.6 peut être réutilisée et fournit des exemples pour vLLM, SGLang et KTransformers.

Pour les équipes qui construisent des assistants d’ingénierie logicielle ou des workflows de codage internes, la documentation met l’accent sur l’exécution de tâches de bout en bout, l’utilisation centrée sur le raisonnement et le déploiement sur des moteurs d’inférence courants. Le modèle expose aussi un accès API compatible OpenAI/Anthropic via la plateforme de Moonshot AI.

Fonctionnalités clés

Focalisation sur le codage agentique

Conçu comme un modèle agentique axé sur le code, au-dessus de Kimi K2.6, avec un meilleur support des tâches d’ingénierie logicielle à long horizon et de l’exécution de tâches de bout en bout.

Réduction de l’usage des jetons de thinking

La page du modèle indique une consommation de jetons de thinking d’environ 30 % inférieure à celle de Kimi K2.6, ce qui suggère un raisonnement plus économe en jetons pendant les workflows de codage.

Grande architecture MoE

Il utilise une architecture Mixture-of-Experts avec 1T de paramètres au total, 32B de paramètres activés, 384 experts et 8 experts sélectionnés par jeton.

Fenêtre de contexte longue

La longueur de contexte est indiquée à 256K, ce qui prend en charge les interactions longues avec une base de code et un contexte de tâche étendu.

Plusieurs voies de déploiement

Le guide de déploiement recommande la prise en charge officielle de vLLM, SGLang et KTransformers, et les exemples d’utilisation montrent des API compatibles OpenAI/Anthropic.

Support multimodal et des outils

La documentation du modèle inclut le tool calling, le raisonnement en mode thinking et des exemples d’entrée image/vidéo dans l’API officielle.

Cas d’utilisation courants

  • Tâches de codage de bout en bout

    Utilisez le modèle comme assistant de codage pour des travaux d’ingénierie logicielle en plusieurs étapes qui bénéficient d’un long contexte, du raisonnement et de l’utilisation d’outils sur un dépôt ou un plan de projet.

  • Intégration API pour outils de développement

    Déployez-le derrière une API interne pour les équipes qui veulent un accès compatible OpenAI ou Anthropic à un modèle de codage sans changer les schémas de requêtes côté client.

  • Inférence auto-hébergée

    Exécutez-le avec vLLM, SGLang ou KTransformers lorsque vous avez besoin d’une configuration d’inférence auto-hébergée et souhaitez suivre les modèles de déploiement documentés par Moonshot AI.

  • Workflows d’assistant multimodal

    Utilisez les exemples de l’API officielle pour traiter des invites texte avec des images ou de la vidéo pour des workflows nécessitant une compréhension visuelle en plus d’un raisonnement orienté codage.

  • Workflows d’agent de longue durée

    Appliquez-le à des jobs d’agent persistants où le modèle doit continuer à travailler sur des tâches à long horizon plutôt que de répondre à une seule invite isolée.

Pros and Cons

Pros

  • Axé sur le codage et l’exécution de tâches agentiques plutôt que sur le chat général.
  • La longue fenêtre de contexte de 256K est utile pour les contextes étendus de dépôt et de workflow.
  • Les exemples d’API officiels couvrent les entrées texte, image et vidéo.
  • Des indications de déploiement sont disponibles pour vLLM, SGLang et KTransformers.
  • La page du modèle indique une consommation de jetons de thinking inférieure à celle de Kimi K2.6.

Cons

  • La documentation indique que le modèle prend en charge uniquement le mode thinking, et que le mode instant n’est pas pris en charge.
  • Les éléments recueillis n’incluent pas de tableau public de tarification ni de limites d’utilisation spécifiques au modèle.
  • Certains détails de déploiement sont donnés à titre d’exemple, et le guide précise que les moteurs d’inférence évoluent rapidement, donc les configurations peuvent nécessiter des ajustements.

FAQ

Comment puis-je déployer Kimi-K2.7-Code ?

Kimi-K2.7-Code est un modèle agentique axé code sur Hugging Face. Le guide de déploiement indique que la même architecture que Kimi-K2.5/K2.6 peut être réutilisée, et des exemples de déploiement sont fournis pour vLLM, SGLang et KTransformers.

Kimi-K2.7-Code prend-il en charge le mode instant ?

Le modèle est documenté comme prenant en charge uniquement le mode thinking. Les notes d’utilisation indiquent aussi que le mode instant n’est pas pris en charge, et que les déploiements tiers doivent conserver le parseur de raisonnement correctement configuré.

Kimi-K2.7-Code peut-il fonctionner avec des images ou de la vidéo ?

Oui. Les exemples d’utilisation et le guide de déploiement montrent à la fois du chat textuel et des entrées visuelles, et indiquent que les entrées image et vidéo sont prises en charge dans l’API officielle.

Comment accéder à l’API officielle ?

La page du modèle indique que vous pouvez accéder à l’API sur platform.moonshot.ai, avec des विकल्प d’API compatibles OpenAI et compatibles Anthropic.

Combien coûte l’utilisation du modèle ?

Les pages source ne fournissent pas de détail public complet sur la tarification de ce modèle. La page de tarification Hugging Face est liée, mais aucun prix ni quota spécifique au modèle n’est indiqué dans les éléments recueillis.

Quick Facts

Catégorie
Outil de développement
Famille de modèles
Moonshot AI Kimi K2.7 Code
Plateforme
Hugging Face
Domaine स्रोत
huggingface.co
Accès API
platform.moonshot.ai
Longueur de contexte
256K