Google оголосила про 350 мільйонів користувачів щомісяця для своєї платформи Gemini, проте вона все ще відстає від ChatGPT.

На третьому дні судового процесу щодо антимонопольних заходів Міністерства юстиції США компанія Google оголосила, що її флагманська мовна модель Gemini досягла 350 мільйонів активних користувачів на місяць станом на березень 2025 року. Цю інформацію представила Сіссі Сяо, колишня керівниця споживчих продуктів Google AI, підкреслюючи швидкий ріст користувачів Google, незважаючи на те, що компанія все ще відстає від ChatGPT від OpenAI.
Історія та еволюція моделі
Gemini була вперше представлена наприкінці 2023 року, створена на основі новітньої інфраструктури Pathways Google. Спочатку модель мала десятки мільярдів параметрів, але з випуском Gemini 2.0 наприкінці 2024 року з’явилася модель з 120 мільярдами параметрів, оптимізованою для швидкого інференсу. На початку цього року Google представила Gemini 2.5, яка використовує шар маршрутизації з мішаними експертами (MoE) для динамічного розподілу обчислень, що дозволяє зменшити витрати на інференс до 30% для простих запитів, одночасно збільшуючи потужність для складних завдань.
Основні технічні характеристики Gemini 2.5 включають:
- Кількість параметрів: 140B (базова) + експерти MoE
- Вікно контексту: 128k токенів
- Середня затримка інференсу: 120мс (на TPU v4 Pods)
- Продуктивність: 200 токенів/сек на чип TPU v4
- Підтримка генерації з підсиленням запитів (RAG) через Vertex AI
Впровадження та масштабованість
Google поступово інтегрує Gemini у своєму екосистемі, включаючи Search Labs, Google Workspace (Docs та Gmail з інтелектуальним написанням) і Bard у бета-версії Android 15. Ці сервіси працюють на TPU v4 Google Cloud і використовують автоматичне масштабування Kubernetes на GKE для обробки непередбачуваного попиту. За внутрішніми оцінками, масштабування з 50 до 200 мільйонів щоденних запитів вимагає запуску додаткових 10 TPU pods протягом 30 секунд.
Порівняння з ChatGPT
Незважаючи на зростання Gemini, власний аналіз Google оцінює, що у ChatGPT від OpenAI близько 600 мільйонів активних користувачів на місяць станом на перший квартал 2025 року — це зростання з приблизно 400 мільйонів на початку року. Недавній реліз GPT-4 Turbo з вікном контексту 128k токенів і покращеною квантизацією ще більше підвищив привабливість ChatGPT для використання в корпоративних API.
Різниця в вимірах трафіку ускладнює прямі порівняння:
- Щотижневі активні користувачі: OpenAI вказує до 400 мільйонів (вибрані 7-денні періоди).
- Щомісячні активні користувачі: Більш консервативна метрика, що використовується в юридичних документах.
- API проти споживчого інтерфейсу: Слайд Google враховує як Bard, так і виклики API, тоді як OpenAI може акцентувати увагу на веб-використанні.
Економіка генеративного ШІ
Сервіси генеративного ШІ є обчислювально інтенсивними і несуть значні витрати. Поточні оцінки в галузі вказують на витрати на інференс близько $0.0006 за 1,000 токенів на TPU v4, тоді як постачальники на базі GPU повідомляють про $0.001–$0.002 за 1,000 токенів на обладнанні A100. Як Google, так і OpenAI визнають негативні маржі для високих обсягів:
- План “Pro” від OpenAI за $200 на місяць втрачає приблизно $50–$80 на користувача через витрати на обчислення.
- Google не розкриває деталі економіки підписки Gemini, але внутрішні документи вказують на доходи менше $0.10 на користувача на місяць у порівнянні з витратами на інфраструктуру.
Антимонопольні наслідки та правова стратегія
Ці дані про використання грають ключову роль у захисті Google від звинувачень Міністерства юстиції в тому, що Alphabet несправедливо об’єднує свої послуги ШІ з основними продуктами. Підкреслюючи швидке впровадження, Google стверджує, що користувачі вільно обирають Gemini на користь конкурентів. Однак регулятори можуть звернути увагу на глибоку інтеграцію — такі як стандартні підказки Bard у Search — як на потенційні бар’єри для входу для суперників.
Перспективи експертів та майбутнє
Спостерігачі за індустрією ШІ висловлюють різні думки щодо траєкторії Google. Доктор Емілі Бендер (Університет Вашингтона) зазначає: “Велике вікно контексту Gemini та дизайн MoE вражають, але справжні еталони ще формуються у порівнянні з GPT-4 Turbo в нульових завданнях.” Тим часом колишній дослідник OpenAI Андрій Карпати підкреслює, що “ефективність моделі та замикання в екосистемі визначать, яка платформа домінуватиме в наступній хвилі застосувань ШІ.”
У майбутньому Google планує ввести спеціалізовану модель Gemini Nano для інференсу на пристроях у Pixel 9, з метою зменшення затримки та вирішення проблеми конфіденційності. Конкуренція з OpenAI та Microsoft, яка інтегрувала GPT-4 в Office 365, обіцяє подальші інновації в архітектурах моделей, оптимізації витрат і регуляторному контролю.