Субота, 15 Березня, 2025

Попри оновлення, нова версія ChatGPT o1 допускає базові помилки

Дата:

Час читання: 2 хв.

У середині вересня OpenAI представила нову модель штучного інтелекту під назвою o1, раніше відому як Strawberry. Цей чат-бот розроблений для вирішення складних завдань у галузях фізики, хімії та біології, наближаючи його здатність до людського мислення.

Реклама

Попри досягнення, нова GPT-модель все ще припускається простих помилок. За даними OpenAI, ця версія продемонструвала рівень продуктивності, порівняний з аспірантом, у складних тестах. Проте з простими завданнями ШІ все ще має труднощі.

Наприклад, Матьє Ашер з Insa Rennes у Франції поділився на платформі X, що GPT-o1 робить нелогічні ходи у шахових головоломках, повторюючи типові помилки, вже відомі з GPT-4o та GPT-3.5. У шаховій позиції на четвертому ході ферзь робить неправильний хід на f7. Дослідник повторив експеримент п’ять разів, і результат був аналогічний.

Також інший дослідник, Колін Фрейзер, перевірив здатність моделі вирішувати прості логічні задачі, такі як питання про кількість переходів пастуха через річку з трьома вівцями. Чат-бот o1 дав неправильну відповідь.

Штучний інтелект Навид Могаддам знайшов ще одну типову помилку: якщо запитати, скільки разів буква “R” зустрічається у слові “Strawberry”, GPT-o1 дає неправильну відповідь, стверджуючи, що дві букви, замість трьох.

На цей момент GPT-o1 є тестовою версією, доступною лише для платних користувачів, і OpenAI визнала, що вона все ще на ранній стадії розвитку. Модель має недоліки в текстовій та графічній обробці, а також у відповідях на питання про актуальні події.

OpenAI обіцяє регулярні оновлення та значні покращення в майбутніх версіях. Дослідник Ноам Браун вважає, що в перспективі моделі ШІ можуть обмірковувати відповіді тижнями, що потенційно приведе до наукових проривів. Однак критики, такі як Гері Маркус, наголошують, що перед ШІ ще довгий шлях до досягнення справжніх революцій.

Свіжі новини

В України майже закінчилися запаси ракет для ЗРК Samp-T, – ЗМІ

0
Уряд України звернувся до Італії та Франції з проханням надати додаткові ракети Aster-30 зенітних батарей Samp-T. Причиною стало те, що наявні боєприпаси майже вичерпані....

Новий iPhone 16e випередив iPhone SE 2022 за кількістю продажів

0
Час читання: < 1 хв.За даними аналітиків компанії IDC, за перші тижні продажу попит на iPhone 16e виявився на 60% вищим у порівнянні...

Поділитися:

Популярне

Новини
Актуальні

Новий iPhone 16e випередив iPhone SE 2022 за кількістю продажів

Час читання: < 1 хв.За даними аналітиків компанії...

В Україні знову закликають до блокування Telegram: що відомо

Час читання: < 1 хв.Голова Комітету ВР з...