Пауза в підсумках ШІ Wikipedia: Відгуки та думки спільноти

Генеративний штучний інтелект став невід’ємною частиною Інтернету, охоплюючи все — від чат-ботів до автоматизованих новинних резюме. Wikipedia, найбільша у світі енциклопедія, що редагується волонтерами, не стала винятком. На початку червня 2025 року Фонд Вікімедіа розпочав пілотний проект зі створення резюме статей за допомогою штучного інтелекту на мобільному сайті. Проте вже через кілька днів ініціативу призупинили через хвилю незадоволення з боку спільноти волонтерів-редакторів.
Передумови: Пілотний проект резюме на основі ШІ
Цей пілот, відомий всередині організації як «Прості резюме статей», стартував 2 червня на вибраних статтях у згорнутому вікні на верхній частині мобільних сторінок. Користувачі могли натиснути «Читати резюме», щоб розгорнути текст, створений ШІ, який був позначений помітним значком Неперевірено. Метою, як було зазначено на щорічній конференції Вікімедіа у 2024 році, було забезпечити швидкий контекст для читачів на ходу.
«Я відчуваю, що люди серйозно недооцінюють ризики для бренду, які несе подібне», — зазначив один із досвідчених редакторів. «Бренд Wikipedia асоціюється з надійністю, простежуваністю змін і принципом ‘кожен може виправити це’. ШІ є протилежністю цим речам.»
Технічна архітектура та специфікації моделі
У основі експерименту лежала вдосконалена велика мовна модель на базі архітектури Meta Llama 2. Основні технічні деталі включали:
- Розмір моделі: 13 мільярдів параметрів, оптимізованих для мобільного використання через 8-бітну квантизацію.
- Дані для тонкої настройки: Добірка з 50,000 якісних заголовків Wikipedia, з використанням
chain-of-thought
запитів для підкреслення нейтральності та стиснутості. - Затримка: Середній час відповіді — 300 мс на резюме, яке надавалося через глобальну мережу на AWS Lambda.
- Шар безпеки: Правила для фільтрації потенційно наклепницького або упередженого контенту, доповнені механізмами позначення з боку спільноти.
Довіра спільноти та механізми верифікації
Основна сила Wikipedia полягає в її прозорій історії редагувань та рецензії від людей. Впровадження генеративного ШІ порушує цю модель:
- Текст ШІ не має незмінного сліду редагування.
- Автоматизовані результати можуть містити вигадані факти або неправильно цитувати джерела.
- Волонтери-редактори побоюються зниження ручного контролю.
Один з редакторів зазначив: «Заголовки вже створюються десятками волонтерів. Подвоєння цього за допомогою ШІ є зайвим і ризикованим.» Фонд Вікімедіа визнав, що міг би краще залучити спільноту, піднявши питання в технічному форумі Village Pump за кілька місяців до запуску.
Порівняння з іншими платформами
Кілька платформ для контенту вже впровадили резюме на основі ШІ:
- Stack Overflow: Використовує резюме на основі GPT-4 для довгих обговорень, з обов’язковим етапом перевірки людиною.
- ArXiv Digest: Агентує та автоматично підсумовує нові наукові статті, використовуючи openai-api під контролем дослідників.
- Medium: Пропонує прев’ю статей, створених ШІ, але з чітким водяним знаком «AI Generated».
Ці моделі успішні, оскільки вони інтегрують людську перевірку. Модель Wikipedia не мала чіткої системи зворотного зв’язку для редакторів, щоб у реальному часі виправляти або відкликати контент, створений ШІ.
Шлях уперед: Збалансування ШІ та людської кураторської роботи
Незважаючи на непростий старт, Фонд Вікімедіа залишається відданим експериментам з ШІ. У майбутньому планується:
- Пропозиції щодо цитування з підтримкою ШІ — підкреслення відсутніх посилань з ймовірнісними оцінками.
- Автоматизоване виявлення вандалізму за допомогою класифікаторів на основі трансформерів.
- Машинно згенеровані підписи до зображень, створені за допомогою CLIP та DALL·E mini.
Кожна функція проходитиме процес спільного проектування з волонтерами-редакторами, щоб забезпечити прозорість та довіру. Як зазначив один з провідних інженерів: «Наша місія — доповнювати, а не замінювати людську експертизу.»
Перспективи експертів
Доктор Марія Фернандес, дослідниця етики ШІ в MIT, застерігає: «Впровадження генеративного ШІ у публічні бази знань вимагає суворих обмежень. Без чіткої метаданих про походження читачі не можуть відрізнити перевірені факти від вигадок моделей.»
Йонас Ріхтер, колишній розробник Вікімедіа, додає: «Модульна архітектура плагінів — де редактори можуть вмикати функції ШІ для кожного простору імен — може з’єднати інновації з редакційним контролем.»
Висновок
Короткий досвід Wikipedia з резюме на основі ШІ підкреслює напругу між швидким технологічним прогресом і стандартами якості, що керуються спільнотою. Призупинення пілота відкриває можливості для глибшої співпраці щодо прозорості моделей, простежуваності редагувань та майбутнього спільного створення між людьми та ШІ в найбільшій відкритій енциклопедії світу.