Час читання: < 1 хв.
Китайська компанія Alibaba представила третє покоління своїх великих мовних моделей Qwen. За даними тестів, новинки демонструють кращі результати, ніж нещодавно представлені моделі o1 та o3-mini від OpenAI, а також DeepSeek R1 і Grok 3 від компанії Ілона Маска, повідомляє портал TechCrunch.
Qwen 3 використовує гібридний підхід до обробки запитів: моделі можуть працювати в режимі глибокого аналізу, поетапно розбираючи завдання і формуючи розгорнуту відповідь, або в режимі швидкої відповіді для повсякденних запитів.
Реклама
Частина моделей побудована на архітектурі MoE (Mixture of Experts), що дозволяє підвищити ефективність обчислень за рахунок розподілу завдань між меншими спеціалізованими модулями, кожен із яких виконує свою частину роботи.
Моделі Qwen 3 доступні для завантаження з відкритою ліцензією на платформах Hugging Face та GitHub. Їх можна запускати локально — розмір моделей варіюється від 600 мільйонів до 235 мільярдів параметрів.
Використовувати Qwen 3 можна також у веб-версії або в мобільних додатках для iOS і Android. ШІ підтримує 119 мов, зокрема українську та російську.