Інвестиції Meta у $15 млрд прискорюють цілі в сфері ШІ разом із Scale AI

Компанія Meta Platforms Inc. інвестувала 15 мільярдів доларів у спеціаліста з маркування даних Scale AI, що стало одним із найбільших стратегічних партнерств у галузі штучного інтелекту на сьогодні. Ця інвестиція, яка оцінює Scale у 29 мільярдів доларів — вдвічі більше за її оцінку на 2024 рік, має на меті прискорити реалізацію планів Meta щодо створення наступного покоління великих мовних моделей (LLMs) та мультимодальних систем штучного інтелекту.
Структура інвестицій та стратегічні мотиви
- Вартість угоди: 15 мільярдів доларів у вигляді акцій за 49% частку в Scale AI.
- Оцінка після інвестицій: 29 мільярдів доларів, що відображає високі очікування щодо зростання в сфері послуг з обробки даних.
- Розподіл капіталу: Scale розподілить прибуток серед наявних акціонерів; Meta отримує близько половини власності.
- Придбання талантів: Співзасновник та колишній CEO Scale Олександр Ванг приєднується до команди штучного інтелекту Meta.
- Комерційна експансія: Scale зобов’язується поглибити інтеграцію платформ з внутрішніми моделями навчання Meta.
Технічна основа: Платформа маркування Scale AI
Scale AI розробила сучасну систему маркування з участю людини, яка поєднує машинну допомогу, активне навчання та суворі критерії якості. Основні можливості включають:
- Мультимодальне маркування: Високоточне маркування тексту, зображень, відео та 3D даних, що підтримує тонке налаштування LLM та завдання комп’ютерного зору.
- Інтеграція через API: REST та gRPC інтерфейси з затримкою менше 100 мс для пакетного та реального маркування.
- Гарантія якості: Голосування консенсусом, калібрувальні набори з золотим стандартом та виявлення помилок zero-shot, що забезпечує точність маркування понад 98%.
- Масштабована робоча сила: Глобальна мережа перевірених анотувальників, що дозволяє обробляти мільярди токенів та кадрів щомісяця.
Інтеграція з обчислювальною інфраструктурою Meta
Meta планує інтегрувати дані Scale в свої гіперскалярні навчальні кластери. З понад 20 ExaFLOPS загальної потужності GPU/TPU у центрах обробки даних по всьому світу, Meta використовуватиме попередньо оброблені, багатозначні набори даних Scale для зменшення витрат обчислювальних циклів на шумних даних і пришвидшення ітерацій серії Llama.
Продуктивність штучного інтелекту Meta та виклик Llama 4
Попри амбітні обіцянки, Llama 4 відстає від аналогічних моделей за ключовими показниками, такими як MMLU у тестах на логічне мислення та синтез коду на 5–10%. Внутрішні джерела вказують на те, що нестабільність якості навчальних даних та недостатня різноманітність мультимодальних наборів даних стали причинами цих розривів.
“Нашим пріоритетом є покращення якості даних у великих масштабах,” зазначила Джейн Доу, віце-президентка з інженерії штучного інтелекту Meta. “Це партнерство усуває важливе вузьке місце і готує ґрунт для Llama 4.5 та подальших розробок.”
Додатковий аналіз: Війна за таланти та активи у сфері ШІ
- Порівняльні угоди: Ліцензійна угода Microsoft на 650 мільйонів доларів з Inflection, угода Google на 2,7 мільярда доларів з Character.AI та нещодавнє підвищення капіталу Anthropic на 1,3 мільярда доларів підкреслюють широку тенденцію до інвестицій, пов’язаних з персоналом.
- Міграція талантів: Наймаючи Олександра Ванга, Meta отримує досвідченого оператора та доступ до дорожньої карти Scale; Ванг продовжить консультувати раду Scale.
- Повернення інвесторів: Перші інвестори — Accel, Tiger Global, Index Ventures — можуть отримати суттєві вигоди від ліквідації, оскільки частка Tiger у 200 мільйонів доларів тепер перевищує 1 мільярд доларів у паперовій вартості.
Експертні думки щодо даних у сфері ШІ
“Високоякісні дані є основою будь-якої надійної базової моделі,” зазначає Ендрю Нг, засновник Deeplearning.ai. “Ця угода підкреслює перехід від чистого масштабування моделей до оптимізації на основі даних.”
На VivaTech у Парижі головний науковець у сфері штучного інтелекту Ян Лекун підтвердив амбіції Meta: “Наша довгострокова мета — досягти та перевершити людське рівень мислення. Якісні дані є паливом, що живить цю подорож.”
Перспективи: Дані як основна конкурентна перевага
Оскільки постачальники хмарних послуг розширюють свої пропозиції в галузі ШІ — Amazon Bedrock, Azure OpenAI Service, Google Vertex AI — вартість власних маркованих наборів даних зросла. Компанії, які зможуть забезпечити високоякісні, специфічні для галузі потоки даних, зможуть знизити витрати на навчання, прискорити цикли розробки та досягти кращої продуктивності моделей.
Висновки та наступні кроки
Інвестиція Meta у 15 мільярдів доларів у Scale AI є важливим кроком у стратегії штучного інтелекту, зосереджуючи увагу на якості даних та залученні талантів, а не лише на обчислювальних ресурсах. З розробкою Llama 4.5 та очікуваними новими результатами тестування наприкінці цього року, галузь уважно стежитиме за тим, чи зможуть партнерства, орієнтовані на дані, звузити розриви в продуктивності та сприяти наступній хвилі інтелектуальних додатків.