Китайська компанія Alibaba випустила компактний аналог великим мовним моделям

·Xataka
Китайська компанія Alibaba випустила компактний аналог великим мовним моделям

Китайська компанія Alibaba представила нову мовну модель Qwen3.6-27B, яка має лише 27 мільярдів параметрів і важить менше 17 ГБ. Незважаючи на свої скромні розміри, вона демонструє продуктивність, порівнянну з великими моделями.

Що сталося

Китайська компанія Alibaba випустила нову мовну модель Qwen3.6-27B, яка є компактним аналогом раніше випущеної моделі Qwen3.5-397B-A17B з 397 мільярдами параметрів. Нова модель має лише 27 мільярдів параметрів і важить менше 17 ГБ.

Подробиці

Qwen3.6-27B є щільною моделлю, тобто всі її 27 мільярдів параметрів активуються під час виконання завдань. Це відрізняє її від більшості великих моделей, які використовують архітектуру Mixture-of-Experts (MoE) і активують лише частину параметрів. Нова модель демонструє продуктивність, порівнянну з великими моделями, зокрема вона досягає 77,2% у бенчмарку SWE-bench Verified і 59,3% у Terminal-Bench 2.0. Ці результати порівняні з результатами моделі Claude Opus 4.5 від Anthropic.

Подробиці

Alibaba активно просуває Qwen3.6-27B як більш ефективну альтернативу своїм великим моделям. Завдяки своєму компактному розміру, цю модель можна використовувати на машинах з відносно невеликим обсягом пам'яті, наприклад, на відеокартах з 24 ГБ пам'яті. Це робить її більш доступною для використання локально.

Що це означає

Випуск Qwen3.6-27B демонструє, що для ефективної роботи мовної моделі не обов'язково потрібен величезний розмір. Це означає, що користувачі в Іспанії та інших країнах можуть використовувати більш компактні та ефективні мовні моделі, які потребують менше ресурсів. Це також відкриває нові можливості для розробки та використання мовних моделей у різних галузях.