Meta стикається з критикою в ЄС через навчання ШІ та виклики GDPR

Передумови
14 травня 2025 року орган захисту приватності Noyb надіслав Meta Platforms Inc. лист із вимогою припинити дії, погрожуючи позовом на мільярд євро відповідно до Загального регламенту захисту даних (GDPR). Це сталося після того, як Meta повідомила користувачів ЄС про те, що публічні пости будуть використані для навчання її моделей штучного інтелекту, якщо вони не відмовляться до 27 травня.
Юридичний виклик Noyb
Noyb стверджує, що Meta порушує статтю 21, пункт 2 GDPR, змушуючи користувачів, які відмовилися від навчання ШІ у 2024 році, подавати нову заяву про відмову. Після того, як дані потрапляють у модель, їх може бути неможливо відновити, і користувачі втрачають можливість назавжди закрити доступ до свого контенту.
- Стаття 21(2) GDPR надає користувачам право заперечувати проти обробки персональних даних для цілей, що здійснюються в суспільних інтересах або для законних інтересів
- Noyb стверджує, що Meta приймала заперечення у 2024 році, але потім змінила свої обіцянки, підриваючи довіру
- Непрозорість може завадити громадянам ЄС повністю відмовитися від обробки даних
Механізм відмови Meta: короткий огляд
Meta впровадила сповіщення в додатку та електронні листи, які закликають користувачів перейти до налаштувань конфіденційності. Процес використовує прапорець переваг користувача, доданий до метаданих профілю, який, за задумом, має поважатися під час збору та навчання даних.
- Оновлення прапорців передаються через потоки Kafka та Spark, які використовуються в інфраструктурі даних Meta
- Навчальні набори даних формуються з кластерів HDFS та включають прапорці згоди користувачів через об’єднання метаданих
- Видалення даних з позначкою з попередньо навчених моделей вимагає складних процедур “недоучування”, таких як повторне навчання або градієнтна хірургія
Технічна можливість диференціації даних
Noyb зазначає, що раніше Meta стверджувала, що соціальна мережа є єдиною розподіленою системою, де вузли часто з’єднують користувачів з ЄС і поза його межами. Це викликає сумніви щодо технічної можливості ізоляції даних користувачів ЄС після їх змішування.
- Графові бази даних зберігають мільярди зв’язків між профілями, що ускладнює юрисдикційне фільтрування
- Розподілене шардінг моделей може вбудовувати дані користувачів у кілька параметричних частин
- Нові дослідження в галузі “недоучування” машин описують підходи, але бракує широкого впровадження у виробництво
Порівняльний регуляторний ландшафт
У той же час Федеральний суд Німеччини з питань захисту даних та свободи інформації висловив підтримку позиції Noyb. Тим часом Європейська рада захисту даних опублікувала рекомендації щодо ШІ та GDPR, уточнюючи обмежене застосування “законного інтересу”.
Цифровий акт ЄС та майбутній акт про ШІ також накладають зобов’язання щодо прозорості та оцінки ризиків на системи ШІ високого ризику, що може вплинути на глобальний розвиток Meta.
Технічні виклики при видаленні даних
Коли навчальні дані агрегуються в матрицю ваг нейронної мережі, їх неможливо вибірково видалити, як у базі даних. Техніки, такі як SISA недоучування або обмеження повторення даних, можуть лише наближено видалити дані, але це супроводжується зниженням продуктивності та складністю.
Експерти Інституту штучного інтелекту Аллена зазначають, що повне повторне навчання великих мовних моделей є непрактичним через витрати на обчислення, які можуть сягати мільйонів годин роботи графічних процесорів.
Вплив на інновації в галузі ШІ та ринкову динаміку
Meta попереджає, що затримки в зборі даних можуть відкинути Європу на задній план у порівнянні з США та Китаєм у розвитку генеративного ШІ. Однак критики вказують на моделі, такі як Mistral, та ініціативи з відкритим кодом, які досягають конкурентних показників без використання даних соціальних мереж.
Юридичний тиск може стимулювати розвиток інструментів генерації синтетичних даних або рамок федеративного навчання, що відповідають принципам конфіденційності за дизайном.
Перспективи
Noyb попросив Meta відповісти до 21 травня 2025 року. Незалежні органи захисту даних ЄС можуть розпочати розслідування або видати заборони. Тим часом Meta продовжує співпрацювати з Комісією з питань захисту даних Ірландії та лобіювати за регуляторну прозорість.
Результат цього процесу стане прецедентом для того, як соціальні платформи балансуватимуть інновації в галузі ШІ та права суб’єктів даних відповідно до GDPR у наступному десятилітті.