Французький стартап Mistral AI представив нову модель штучного інтелекту для кодування під назвою Devstral 2. Ця модель, що має 123 мільярди параметрів, розроблена для використання в автономних системах програмного забезпечення. Devstral 2 досягла 72,2% результату на тесті SWE-bench Verified, що підтверджує її ефективність у вирішенні реальних проблем програмування, взятих з GitHub.
Крім того, Mistral випустила новий додаток – Mistral Vibe. Це командний інтерфейс (CLI), подібний до Claude Code та OpenAI Codex, який дозволяє розробникам взаємодіяти з моделями Devstral безпосередньо у терміналі. Інструмент може сканувати структури файлів та статус Git, забезпечуючи контекст для роботи над проектами, вносити зміни в кілька файлів та виконувати командні операції автономно. Mistral випустила CLI під ліцензією Apache 2.0.
Хоча варто обережно ставитися до результатів тестування штучного інтелекту, відомо, що провідні компанії в цій сфері уважно стежать за моделями, які показують високі результати на SWE-bench Verified. Цей тест містить 500 реальних проблем програмування, які демонструють можливості моделей у реальних умовах. Дослідження показують, що 90% завдань у тесті – це прості виправлення помилок, які досвідчені інженери можуть виконати менш ніж за годину.
Також Mistral випустила Devstral Small 2, модель з 24 мільярдами параметрів, яка показала 68% на тому ж тесті та може працювати на споживчому обладнанні без підключення до Інтернету. Обидві моделі підтримують контекстний вікно до 256 000 токенів, що дозволяє їм обробляти досить великі кодові бази.
