Суд відхилив звинувачення в масовому стеженні у справі ChatGPT

У резонансній справі щодо виявлення доказів, магістрат суддя США Она Ванг відхилила твердження про те, що її наказ про збереження логів ChatGPT компанії OpenAI є “національною програмою масового спостереження”. Логи, які підлягають збереженню, містять видалені та анонімізовані чати мільйонів користувачів ChatGPT і зберігаються безстроково в очікуванні справи про порушення авторських прав, ініційованої провідними новинними організаціями.
Передумови наказу про збереження
5 травня 2025 року суддя Ванг видала наказ про збереження, який зобов’язує OpenAI зберігати всі логи розмов ChatGPT, включаючи ті, що були видалені користувачами під час звичайного використання. Мета наказу полягала в тому, щоб забезпечити можливі докази спроб третіх осіб відтворити повні опубліковані новинні статті за допомогою запитів до ChatGPT. Згідно зі стандартною практикою, веб-інтерфейс OpenAI автоматично видаляє сесії користувачів через 30 днів, зберігаючи лише короткострокові копії для налагодження та моніторингу зловживань.
Спроби втручання користувачів
- Перше втручання: Корпоративний користувач подав позов без юридичного представництва, але його було відхилено Ванг через відсутність правової підтримки.
- Друге втручання: Приватний користувач, Айдан Хант, подав клопотання про скасування або звуження наказу з посиланням на конституційні підстави. Він стверджував, що безстрокове збереження як введень користувачів, так і виходів моделі, які зберігаються в зашифрованих контейнерах Amazon S3, порушує захист від необґрунтованих обшуків, гарантований Четвертою поправкою.
Аргументація судді Ванг
У своїх детальних письмових висновках суддя Ванг підкреслила, що наказ обмежується збереженням для цілей судового розгляду, а не активним спостереженням. Вона зазначила:
“Наказ суду про збереження документів, який вимагає збереження, сегрегації та утримання певних приватних даних компанією для обмежених цілей судового розгляду, не є і не може бути національною програмою масового спостереження. Судова влада не є правоохоронним органом.”
Ванг також зазначила, що будь-які виклики щодо конфіденційності є вторинними стосовно основних питань авторського права, вважаючи, що втручання Ханта затягне справу.
Технічний аналіз архітектури логування ChatGPT
Дані ChatGPT проходять кілька етапів:
- Буферизація сесій на фронтенді: Тимчасове зберігання в пам’яті для миттєвої взаємодії користувача з моделлю.
- Шар збереження: Сховища AWS S3 з серверним шифруванням AES-256 для журналів аудиту, зберігання за замовчуванням становить 30 днів перед видаленням.
- Контроль сегрегації: Дані маркуються за ідентифікатором сесії та хешованим токеном користувача для ізоляції анонімізованих логів.
Відповідно до наказу про збереження, OpenAI повинна обійти свій процес збору сміття, зберігаючи як сирі введення, так і оброблені виходи моделі безстроково в холодному зберіганні. Хоча виходи зазвичай відображають часткові введення, вони можуть також містити унікальні токени або векторні представлення, які можуть бути використані для відновлення запитів.
Стандарти збереження даних та наслідки для конфіденційності
Експерти з цифрових прав застерігають, що безстрокове зберігання логів взаємодії з ШІ створює тривожний прецедент. Корінн МакШеррі, юридичний директор Фонду електронного фронту, прокоментувала:
“Цей наказ про виявлення справжньо ставить під загрозу конфіденційність користувачів і може надати правоохоронним органам підстави вимагати історії чатів так само, як вони роблять це з журналами пошукових систем або записами соціальних мереж.”
Основні занепокоєння щодо конфіденційності включають:
- Ризики повторної ідентифікації: Навіть анонімні чати можуть бути пов’язані з особами за допомогою метаданих та шаблонів часу.
- Виявлення чутливих даних: Користувачі часто діляться медичною, фінансовою або юридичною інформацією.
- Прецедент для широкого виявлення: Інші приватні позивачі можуть шукати подібні накази про збереження в справах, що не стосуються авторського права.
Перспективи правового та регуляторного середовища
У міру зростання популярності систем ШІ суди стикаються з викликом балансування потреб у виявленні та конфіденційності користувачів. Можливі подальші події включають:
- Законодавчі ініціативи: Федеральні або державні закони можуть встановити суворі обмеження на збереження даних ШІ та вимагати звіти про прозорість.
- Промислові стандарти: Можуть виникнути добровільні рамки від організацій, таких як Форум майбутнього конфіденційності, для регулювання практики логування ШІ.
- Еволюція прецедентного права: Рішення апеляційних судів можуть уточнити, чи кваліфікуються накази про цивільне виявлення як державні обшуки відповідно до Четвертої поправки.
Рекомендації експертів
Щоб зменшити ризики, захисники конфіденційності та технічні фахівці пропонують:
- Впроваджувати удалення без знань, щоб видалені сесії не залишали жодних слідів у системах резервного копіювання.
- Надавати сповіщення користувачам в реальному часі, коли збереження даних вимагається юридичним наказом.
- Публікувати регулярні звіти про прозорість, що деталізують кількість та обсяг вимог щодо даних.
Усні аргументи та наступні кроки
OpenAI запросила прискорене слухання, яке заплановане на 26 червня, щоб оскаржити або змінити наказ про збереження. Компанія стверджує, що безстрокове збереження може призвести до значних витрат на зберігання — оцінюваних у мільйони доларів на місяць — і підірвати довіру користувачів. Якщо слухання не принесе полегшення, користувачі можуть спробувати втрутитися після будь-якого розкриття інформації позивачам, на той момент дані вже будуть збережені.
На даний момент мільйони користувачів ChatGPT чекають роз’яснень своїх прав на конфіденційність, поки суди розбираються з цими новими юридичними та технічними складнощами.