Магія за межами Гоґвортсу. Книжки про Гаррі Поттера дозволили вченим навчити ШІ забувати інформацію


Магія за межами Гоґвортсу. Книжки про Гаррі Поттера дозволили вченим навчити ШІ забувати інформацію

Книги-бестселери про Гаррі Поттера використовують для експериментів (Фото:Wirestock/Depositphotos)

Все більше дослідників використовують книги-бестселери про Гаррі Поттера для експериментів з генеративною технологією штучного інтелекту. Наприклад, вчені змогли видалити з ШІ-моделей матеріали, захищені авторським правом.

Тільки за останні місяці з’явилася низка наукових робіт, у яких для роботи з ШІ було використано книжки Джоан К. Ролінґ («Машинне навчання для розробки зілля в Гоґвортсі», «Великі мовні моделі знайомляться з Гаррі Поттером», «Виявлення заклинань у фентезійній літературі за допомогою штучного інтелекту на основі трансформатора» тощо), пише Bloomberg.

В одному з досліджень фахівці з Microsoft Марк Руссінович і Ронен Елдан продемонстрували, що моделі штучного інтелекту можна змінити або відредагувати, щоб видалити будь-які відомості про існування книг про Гаррі Поттера, включаючи персонажів і сюжети, не жертвуючи загальним рішенням системи штучного інтелекту.

«Ми вірили, що дослідницькій спільноті буде простіше оцінити модель, створену за допомогою нашої техніки, і переконатися, що контент справді був „невивченим“. Майже будь-хто може придумати підказки для моделі, які б перевірили, чи „знає“ вона книги. Навіть люди, які не читали книг, знають елементи сюжету та персонажів», — сказав Руссінович, головний технічний директор Microsoft Azure.

В іншому дослідженні вчені з Університету Вашингтона в Сіетлі, Університету Каліфорнії в Берклі та Інституту Аллена з питань ШІ розробили нову мовну модель під назвою Silo, яка може видаляти дані, щоб зменшити юридичні ризики.

Дослідники використали книги про Гаррі Поттера, щоб побачити, чи впливають окремі фрагменти тексту на продуктивність системи ШІ. Висновок був невтішним: протестована модель стала менш точною.

«Коли книги про Гаррі Поттера видаляються зі сховища даних, розгубленість (показник ефективності ШІ, який демонструє, наскільки добре модель прогнозує вибірку та розподіляє ймовірності — NV) стає ще гіршим», — сказали дослідники.