A Moonshot AI Kimi K2.6 modellje 300 alágenssel és 4000 lépéssel skálázódik
A kínai Moonshot AI nyílt forráskódúvá tette Kimi K2.6 modelljét, amely jelentős előrelépést hoz a hosszú távú kódolási feladatok és az ügynökrajok skálázhatóságában.

A Kimi K2.6 egy natív multimodális ügynökmodell, amely autonóm módon képes összetett szoftverfejlesztési problémákat megoldani — írja a MarkTechPost. A kiadás a gyakorlati telepítési forgatókönyvekre fókuszál, mint például a hosszú ideig futó kódoló ügynökök, a természetes nyelvből történő front-end generálás, valamint a masszívan párhuzamos ügynökrajok, amelyek egyszerre több száz specializált alágenset koordinálnak.
A modell már elérhető a Kimi.com-on, a Kimi alkalmazásban, az API-n és a Kimi Code CLI-n keresztül. A súlyokat a Hugging Face-en tették közzé, módosított MIT licenc alatt.
Hosszú távú kódolási teljesítmény
A Kimi K2.6 58,6 pontot ért el a SWE-Bench Pro teljesítményteszten, amely valós GitHub problémák megoldását teszteli professzionális szoftver-tárházakban. Ez az eredmény felülmúlja a GPT-5.4 (57,7), a Claude Opus 4.6 (53,4) és a Gemini 3.1 Pro (54,2) teljesítményét. A Terminal-Bench 2.0-n 66,7 pontot ért el, míg a LiveCodeBench (v6) teszten 89,6 pontot.
Az egyik legkiemelkedőbb eredmény a Humanity’s Last Exam (HLE-Full) with tools teljesítményteszten született, ahol a K2.6 54,0 ponttal vezet minden összehasonlított modellt, beleértve a GPT-5.4-et (52,1) és a Claude Opus 4.6-ot (53,0) is. A Moonshot AI belső Kimi Code Bench benchmarkján is jelentős javulást mutatott a K2.5-höz képest.
Ügynökrajok és autonóm kódolás
A K2.6 egyik legérdekesebb képessége az ügynökraj (Agent Swarm), amely komplex feladatokat párhuzamosít számos specializált alágens között. Az architektúra horizontálisan skálázódik, akár 300 alágenssel és 4000 koordinált lépéssel, ami jelentős bővítés a K2.5 100 alágenséhez és 1500 lépéséhez képest.
Két mérnöki esettanulmány is bemutatja a hosszú távú kódolás gyakorlati értékét. Az egyikben a Kimi K2.6 sikeresen telepítette a Qwen3.5-0.8B modellt egy Mac gépen, majd optimalizálta a modell következtetését Zig nyelven. A modell több mint 12 órás folyamatos futás során, 4000+ eszközhívással és 14 iterációval, mintegy 20%-kal gyorsabb sebességet ért el, mint a LM Studio. Egy másik esetben a Kimi K2.6 autonóm módon újratervezte az exchange-core nevű, 8 éves nyílt forráskódú pénzügyi illesztőmotort, 13 óra alatt 12 optimalizálási stratégiával több mint 4000 kódsort módosítva, 185%-os átviteli sebesség növekedést eredményezve. A Moonshot AI a Kimi K2.6 modelljét 2024. március 15-én tette elérhetővé a fejlesztők számára.