Запуск Gemini 2.5 з підпискою Ultra за $250

20 травня 2025 року • Маунтін-В’ю, Каліфорнія — Після кількох місяців перебування на стадіях “експериментальної” та “попередньої” версії, компанія Google офіційно оголосила про доступність Gemini 2.5 у своєму AI-екосистемі. Цей реліз відбувається одночасно з запуском Gemini Ultra — нового підписного плану за $250 на місяць, орієнтованого на потужних користувачів та підприємства, які потребують надвисоких лімітів використання та раннього доступу до функцій агентного AI.
Від попередньої версії до продуктивності: Що нового в Gemini 2.5
Gemini 2.5 є значним кроком вперед в архітектурі та продуктивності в порівнянні з версією 2.0 завдяки поліпшенню структури моделі та ефективності висновків:
- Симульований механізм міркування: Мультимодальний процес міркування, який формує та оцінює до п’яти паралельних гіпотез перед тим, як надати відповідь. Попередні тести показали зменшення логічних помилок на 40% у задачах з програмування.
- Оптимізація токенів: Модель Flash 2.5 споживає на 20–30% менше токенів, ніж її попередниця, завдяки динамічному обрізанню контексту та адаптивним блума-фільтрам.
- MoE та розріджена увага: Інтеграція шарів змішаних експертів разом з розрідженими глобальними/локальними патернами уваги зменшує FLOPs на 25%, зберігаючи або покращуючи точність виходу в мультимодальних задачах.
- Мультимодальність та ввід/вивід: Нативна підтримка тексту, зображень та структурованих даних — завдяки крос-модальній відповідності векторів — дозволяє створювати багатші запити, а також здійснювати реальний час анотації зображень та API-виклики, що поєднують візуальні та мовні дані.
Глибоке мислення: Можливість багатогіпотезного міркування
Нова функція Глибоке мислення, яка наразі проходить обмежене тестування, розширює внутрішній бюджет міркування моделі. Для кожного запиту користувача Gemini 2.5 Pro може паралелізувати до восьми потоків міркування, кожен з яких досліджує різні шляхи вирішення. Наприкінці процесу підмодель-оркестратор оцінює вихід кожного потоку та синтезує найкращу відповідь. Внутрішні тести Google DeepMind показали зменшення арифметичних та логічних помилок до 60% у тестових наборах, таких як GSM8K та HumanEval.
Інтеграція в Google Cloud: Vertex AI, AI Studio та API
Gemini 2.5 тепер є стандартною моделлю в Vertex AI, AI Studio та окремих мобільних і веб-додатках Gemini. Основні точки інтеграції включають:
- Регульовані бюджети мислення: Розробники можуть налаштовувати обчислювальні бюджети у секундах vCPU або секундах TPU, обираючи між затримкою та глибиною міркування.
- Резюме слідів міркування: Кожна відповідь API може включати необов’язковий JSON-формат “слід думок”, що відкриває проміжні гіпотези для аудиту та налагодження.
- Gemini Code Assist: Плагін для IDE в реальному часі для VS Code та IntelliJ, який використовує Глибоке мислення для надання багатоступеневої генерації коду, автоматизованих пропозицій щодо рефакторингу та вбудованого тестування.
Підприємницькі бенчмарки та порівняльний аналіз
Незалежні тести MLPerf та LM Arena ставлять Gemini 2.5 Pro на перше місце у рейтингу за міркуванням, програмуванням та мультимодальними задачами. У порівнянні з GPT-4 Turbo, Gemini 2.5 Flash Lite показав на 1.8× вищу продуктивність токенів за секунду на одному GPU A100, досягнувши порівнянних оцінок якості в тестах на резюме та переклад.
Безпека та конфіденційність
Google підкреслює безпеку на рівні підприємств з використанням anthos-enabled приватних кінцевих точок, шифрування даних у спокої за допомогою Cloud KMS та відповідності стандартам ISO/IEC 27001, SOC 2 та HIPAA. Резюме “слідів думок” можуть бути налаштовані на видалення особистої інформації та відповідність внутрішнім політикам управління.
Gemini Live та агентні можливості
Раніше відомий як проект Astra, Gemini Live тепер широко доступний на Android та iOS. Додаток демонструє ранній “агентний” інтерфейс — під назвою Project Mariner — який може відкривати додатки, переходити до налаштувань, шукати локальні файли та навіть здійснювати дзвінки за вказівкою користувача. Хоча Google ще працює над вдосконаленням поведінки в крайніх випадках, компанія бачить агентних асистентів, які можуть обробляти складні робочі процеси, від бронювання подорожей до багатоступеневого аналізу даних.
Gemini у Chrome та крос-платформений доступ
Цього літа в кутку Google Chrome з’явиться новий значок Gemini, що відображає інтеграцію Copilot у Microsoft Edge. Користувачі зможуть запитувати вміст сторінки, генерувати резюме, витягувати таблиці та ставити додаткові запитання — все це в контексті браузера. Крос-платформені SDK також дозволяють вбудовувати Gemini у веб- та настільні додатки.
Представляємо план Gemini Ultra за $250
До цього часу Google пропонував один план за $20 на місяць для доступу до Pro-рівня AI. Новий підписний план Gemini Ultra, що коштує $250 на місяць, орієнтований на потужних користувачів та підприємства, яким потрібні:
- Необмежене використання моделі: Без жорстких обмежень на квоти токенів, зображень або відео.
- Пріоритетний доступ: Реальний доступ до нових моделей, включаючи агентні та експериментальні варіанти.
- Розширені SLA: Гарантії безперервної роботи на рівні 99.9% у глобальних регіонах, а також виділені канали підтримки.
- Ранній доступ до агентного API: Доступ до програмного контролю пристроїв користувачів через API Gemini в Project Mariner.
Google пропонує 50% знижку на перші три місяці, що знижує початкову вартість до $125 на місяць. Gemini Ultra вже доступний у США, а глобальний запуск заплановано на кінець цього року.
Gemini Diffusion: Майбутнє генеративного AI
На конференції I/O Google також представила Gemini Diffusion, новий підхід до генерації тексту та коду, що запозичує методи синтезу зображень на основі дифузії. Замість послідовного декодування токенів, Gemini Diffusion генерує блоки токенів одночасно, а потім поетапно вдосконалює їх через процес денойзингу. Основні показники продуктивності:
- У 2.5 рази швидший повний висновок у порівнянні з Flash Lite на аналогічному обладнанні
- Динамічні розміри блоків (до 64 токенів) з самокоригуючими механізмами для зменшення галюцинацій
- Обнадійливі результати в складній математиці (≥ точність Elicit) та завданнях синтезу коду на великі відстані
Gemini Diffusion наразі перебуває на закритому альфа-тестуванні з обраними партнерами Google DeepMind і може вийти в публічну попередню версію наприкінці 2025 року.
Перспективи
З виходом Gemini 2.5 в загальний доступ, нового підписного плану Ultra та передових досліджень, таких як Gemini Diffusion, Google робить ставку на AI як платформу. Підприємства та розробники отримують безпрецедентні інструменти для створення масштабованих застосунків, зосереджених на міркуванні, мультимодальності та агентності. Наступний етап полягатиме у тіснішій інтеграції між обробкою на пристрої та в хмарі, спеціалізації моделей для конкретних доменів та впровадженні функцій, що підвищують довіру, таких як перевірка обчислювальних слідів.
“Ми прагнемо зробити AI потужним і відповідальним,” говорить керівник Google Cloud AI д-р Прія Натарджан. “З Gemini 2.5 та Ultra ми підвищуємо планку можливого — надаючи підприємствам контроль, необхідний для масштабного впровадження.”
Розширюючи можливості Gemini на споживчому, розробницькому та підприємницькому рівнях, Google прагне започаткувати нову еру інновацій на основі AI.