Субота, 5 Липня, 2025

Дослідження виявило, що ШІ інколи йде на порушення правил для досягнення результату

Дата:

Час читання: < 1 хв.

Співробітники компанії Palisade Research провели незвичайний експеримент, пов’язаний зі схильністю штучного інтелекту до шахрайства. Виявилося, деякі моделі чат-ботів здатні порушувати правила у межах шахових партій задля досягнення перемоги.

Для перевірки гіпотези автори взяли кілька ШІ-моделей, включаючи GPT4o та o1-preview від OpenAI, DeepSeek R1 та Claude 3.5 Sonnet. У кожну вбудували шаховий двигун Stockfish. Щоб оцінити їхній потенціал, кожна модель зіграла кілька сотень матчів.

Реклама

Зважаючи на можливості Stockfish шансів на перемогу у штучного інтелекту практично не було. Але OpenAI o1-preview і DeepSeek R1 самі вирішили вдатися до шахрайства. Обидві моделі намагалися створити копію Stockfish, щоб використати можливості шахового двигуна проти нього самого.

А ось GPT4o і Claude 3.5 Sonnet діяли чесним шляхом і спочатку не мали наміру грати проти правил. Щоправда, для шахрайських дій потрібно лише трохи направити ШІ. Результати експерименту стривожили співробітників Palisade Research, оскільки підтвердили часткову “некерованість” чат-ботів.

Свіжі новини

Окупанти навчають молодь виявляти "нелояльних мешканців" на ТОТ

0
На тимчасово окупованих територіях російські інструктори проводять курси для молоді, навчаючи їх розпізнавати "нелояльних мешканців" та складати доноси. Особливий акцент робиться на підлітках для...

У Воронезькій області внаслідок атаки БПЛА спалахнула пожежа в районі військового...

0
У ніч на 5 липня Воронезьку область рф атакували БпЛА, спричинивши пожежу в районі військового аеродрому "Борисоглєбськ". Місцеві жителі чули 8-10 вибухів, а система...

Поділитися:

Популярне

Новини
Актуальні

Як подовжити час роботи Samsung Galaxy: прості поради для економії батареї

Час читання: 2 хв.Сучасний користувач смартфона витрачає години...

Realme 15 отримає рекордну автономність і преміальну камеру

Час читання: < 1 хв.Міністерство промисловості та інформаційних...

Що готує Apple у 2025: всі головні премʼєри в одному матеріалі

Час читання: 2 хв.Перша половина 2025-го вже позаду,...