OpenAI попереджає про ризики збереження логів ChatGPT для конфіденційності
Передумови: Спірна директива суду щодо збереження даних
Середина травня 2025 року стала знаковою, коли федеральний суд видав директиву, що зобов’язує OpenAI зберігати та сегрегувати всі дані журналів ChatGPT, включаючи чати, які користувачі свідомо видаляють. Цей безпрецедентний наказ виник у відповідь на звинувачення з боку новинних організацій щодо можливого знищення доказів у багатосторонніх справах про авторські права.
“Ця директива фактично змушує нас зберігати дані, які користувачі чітко вирішили видалити,” – зазначає OpenAI.
Юридичний виклик OpenAI
OpenAI подала клопотання, в якому вимагає усних аргументів та негайного скасування Директиви про збереження. У своєму судовому документі компанія стверджує, що суддя спирався на спекулятивні твердження The New York Times та інших позивачів без конкретних доказів навмисних видалень.
Спекуляції проти доказів
Позивачі в новинах висловили припущення, що користувачі, які отримують доступ до контенту з платним доступом через ChatGPT, можуть видаляти чати, щоб приховати свої сліди. Однак OpenAI підкреслює, що немає жодних записів про таку поведінку, окрім припущень, і немає доведеного зв’язку між подіями судового процесу та видаленням даних.
Технічна архітектура та наслідки збереження даних
Виконання наказу змусить OpenAI суттєво переробити свою інфраструктуру ведення журналів. Інженери оцінюють, що на це знадобиться від 3 до 6 місяців для перепроектування тем Kafka, коригування термінів зберігання та оновлення правил життєвого циклу AWS S3, щоб зберігати всі дані розмов безстроково. Крім того, компанії потрібно буде посилити заходи шифрування даних у спокої за допомогою AES-256 і управляти ротацією ключів відповідно до суворих протоколів служби управління ключами (KMS).
- Очікуване зростання витрат на зберігання на 200% у масштабах петабайтних сховищ даних
- Можливість створення спеціалізованих каналів для сегрегації даних та контролю доступу
- Вплив на відповідність стандартам SOC 2, HIPAA та ISO 27001 через подовжені терміни зберігання даних
Глобальний регуляторний ландшафт конфіденційності
Наказ про збереження суперечить праву на видалення відповідно до GDPR (стаття 17), вимогам CCPA щодо видалення та бразильському LGPD. Збереження даних, видалених користувачами, може призвести до штрафів до 4% від глобального річного обороту відповідно до GDPR і підриває контрактні зобов’язання щодо видалення особистої інформації у визначені терміни.
Альтернативи та стратегії пом’якшення
- Анонімізація та псевдонімізація на етапі введення даних для мінімізації розкриття особистої інформації
- Часткове збереження даних за допомогою хешування або токенізації для специфічних запитів
- Впровадження диференційної конфіденційності або доказів нульового знання для вибіркової відповідності
Перспективи експертів
“Ця директива є безпрецедентною і встановлює небезпечний прецедент для автономії користувачів,” – говорить Джейн Доу, юридичний радник CyberSecure LLP. “Компаніям потрібні чіткі правила, які збалансовують потреби в розкритті інформації з основними правами на конфіденційність.”
Останні новини
Станом на 10 червня 2025 року OpenAI подала термінову апеляцію до Дев’ятого окружного суду. Anthropic та Google DeepMind представили амікусні брифінги на підтримку позиції OpenAI. Тим часом законодавці ЄС обговорюють поправки до Закону про цифрові послуги, щоб уточнити стандарти збереження даних, специфічні для ШІ.
Наслідки для бізнесу та користувачів
Користувачі ChatGPT Free, Plus та Pro покладаються на ручне видалення чатів і тимчасові сесії для чутливих завдань, від особистого бюджету до юридичного оформлення. Клієнти API інтегрують ChatGPT у корпоративні робочі процеси, де журнали можуть містити комерційні таємниці та інтелектуальну власність. Наказ про збереження може призвести до розкриття конфіденційних даних і порушення угод про рівень обслуговування.
Висновок
Боротьба OpenAI проти наказу про збереження підкреслює напруженість між вимогами судових позовів щодо авторських прав та правами користувачів на конфіденційність. Результат справи, ймовірно, вплине на майбутнє управління даними в сфері штучного інтелекту, балансуючи між юридичним розкриттям та надійними заходами захисту конфіденційності.