Справу авторів про авторські права проти Meta чекають труднощі

1 липня 2025 року суддя окружного суду США Вінс Чабрія ухвалив важливе рішення, яке задовольнило позов Meta Platforms, в якому стверджувалося, що їхня модель штучного інтелекту Llama 3 порушує авторські права, навчаючись на несанкціонованих книгах. Хоча два недавні рішення, одне з яких стосувалося компанії Anthropic, визнали таке навчання штучного інтелекту «трансформаційним», Чабрія підкреслив, що справедливе використання залежить від доведення шкоди для ринку, а не лише від трансформаційної мети.
Передумови: Llama 3 та дискусія про справедливе використання
Llama 3 — це велика мовна модель на основі трансформера з приблизно 70 мільярдами параметрів і контекстним вікном на 128 тисяч токенів, що дозволяє краще розуміти довгі документи, але не має механізмів для точного відтворення великих уривків тексту. Meta зібрала різноманітний корпус даних через торрентинг та веб-сканування, використовуючи токенізацію з парним кодуванням для виділення мовних патернів для подальших генеративних завдань.
Недостатні аргументи щодо шкоди для ринку
Чабрія виявив, що скарга 13 авторів базувалася на двох теоріях: по-перше, що Llama 3 може відтворювати текстові уривки; по-друге, що несанкціоноване копіювання підриває ліцензійний ринок для даних навчання штучного інтелекту. Meta спростувала ці претензії, представивши експертні свідчення, які показали незначний вплив на продаж книг та відсутність технічних можливостей для тривалого точного відтворення.
Чабрія зазначив, що рішення не свідчить про те, що використання Meta авторських матеріалів для навчання своїх мовних моделей є законним, а про те, що позивачі висунули неправильні аргументи і не змогли належно обґрунтувати свої позиції.
Технічний аналіз: обмеження точного відтворення
Експерти вказують на стохастичне вибіркове відтворення та температурні контролі в Llama 3 як на запобіжники проти запам’ятовування. Дослідники з Meta AI та незалежні аналітики провели сотні експериментів, підтвердивши, що виходи рідко перевищують 50 токенів, які відповідають навчальному набору. Це обмеження ставить під сумнів твердження про те, що моделі штучного інтелекту можуть заповнити ринок майже точними відтвореннями.
Нові ліцензійні моделі для навчання штучного інтелекту
У відповідь на напруженість у сфері авторських прав, галузеві коаліції розробляють платформи для ліцензування даних, які використовують блокчейн-технології для відстеження походження та смарт-контракти. За цими моделями, власники контенту отримують мікроплатежі за кожен токен, що використовується, розраховані за допомогою метрик диференційної конфіденційності для оцінки впливу використання. Професор Лора Стівенс з юридичного факультету Стенфорда вважає, що ця модель може забезпечити баланс стимулів: прозора книга транзакцій з даними для навчання сприятиме справедливій компенсації без стримування інновацій.
Політичні наслідки та Закон ЄС про штучний інтелект
Запропонований ЄС Закон про штучний інтелект передбачає розкриття джерел авторських прав та оцінку ризиків для генеративних моделей. Згідно з новими положеннями, розробники штучного інтелекту повинні документувати набори даних і отримувати дозволи, коли виходи мають високий потенціал заміщення. Законодавці США також внесли паралельні законопроекти, що мають на меті створення ліцензійного консорціуму, подібного до моделі ASCAP у видавництві музики.
Нещодавні та поточні судові позови
Триває друга хвиля судових позовів: The New York Times, Reuters та Microsoft стверджують, що ChatGPT та Bing Chat генерують контент, який підриває підписну журналістику. Іан Кросбі, головний адвокат у справі NYT, зазначив, що акцент Чабрії на шкоді для ринку підсилює їх аргумент про те, що продукти генеративного штучного інтелекту не можуть масово виробляти журналістський контент без ліцензійних угод.
План дій для майбутніх позовів щодо авторських прав
- Непряме заміщення: Показати, що твори, створені штучним інтелектом, виконують функцію заміщення, наприклад, коли читач обирає роман, написаний штучним інтелектом, замість твору людини.
- Вплив на ліцензійний ринок: Надати докази упущених доходів у нових секторах ліцензування даних для штучного інтелекту.
- Регуляторний вплив: Використовувати нові закони та стандарти для забезпечення справедливої компенсації за авторські внески.
Висновок
Хоча Meta здобула обмежену перемогу, це рішення підкреслює, що лише трансформаційна мета недостатня. Власники прав повинні формувати переконливі докази про вплив на ринок або використовувати розвиваючі політичні рамки, щоб досягти успіху в спорах щодо авторських прав на штучний інтелект.