Google представив Gemini 2.5 для підписників AI Ultra

Вступ
На щорічній конференції I/O у травні Google представила Gemini 2.5 Deep Think — найсучаснішу версію свого великого мультимодального моделі, розроблену для підписників AI Ultra. Сьогодні Deep Think стає доступним у застосунку Gemini та веб-інтерфейсі, обіцяючи безпрецедентні можливості в області логіки, дизайну та наукового аналізу.
Deep Think: Покращене мислення та продуктивність
Deep Think має спільну архітектуру з Gemini 2.5 Pro, але розширює час обробки та паралельну оцінку гіпотез. Це призводить до:
- Багатогранний аналіз: Одночасне дослідження різних шляхів вирішення, з ітераціями на проміжних гіпотезах.
- Перемішування гіпотез: Рекомбінація перспективних напрямків для уточнення висновків перед генерацією результатів.
- Розширена глибина обчислень: Додаткові TPU цикли на запит, що дозволяє глибше досліджувати нейронні мережі.
Досягнення в тестах
На стандартних галузевих тестах Deep Think перевершує як своїх попередників, так і конкурентів. Основні результати включають:
- Останній іспит людства: Набрав 34.8%, перевищивши 25% інших провідних моделей.
- AIME (Американський запрошувальний математичний іспит): Показав найвищі результати в алгебраїчних та комбінаторних задачах.
- Бронзова медаль IMO (Міжнародна математична олімпіада): Стандартна версія Deep Think досягла бронзового рівня на тесті 2025 року. Спеціалізована версія, використовуючи розширений час роботи, здобула золоту медаль.
Архітектура та вимоги до обчислень
Глибоко в основі Deep Think використовує фірмові TPU v5 Pods від Google, що забезпечують понад 1 екзаFLOP обчислень на секунду. Кожен запит може споживати до 500 петаFLOPS-секунд, залежно від складності. Згідно з інформацією від інженерів Google, один висновок Deep Think може включати:
- Покрокове повернення для повторної оцінки попередніх прогнозів.
- Крос-увагу над мультимодальним контекстом (текст, код, зображення).
- Адаптивне масштабування точності, перемикаючись між float32 та bfloat16 для підвищення ефективності.
Інтеграція та доступ
Deep Think доступний як додатковий інструмент у меню Gemini 2.5 Pro для підписників плану AI Ultra за $250 на місяць. Google встановлює щоденний ліміт запитів, який динамічно коригується для оптимізації навантаження на систему — наразі оцінки складають близько 15–20 запитів на день.
Розробники можуть очікувати доступ до API в IV кварталі 2025 року, з пропозицією цін на основі використання обчислень. Ранні тестувальники з підприємств повідомляють про безперебійну інтеграцію з існуючими хмарними системами, використовуючи gRPC та RESTful API.
Порівняння з конкурентами
Хоча GPT-4o від OpenAI та Claude 3 від Anthropic демонструють відмінні результати в розмовних контекстах, Deep Think виділяється в:
- Науковому мисленні: Кращий у багатоступеневих доказах та інтерпретації даних.
- Дизайні та креативності: Генерує вищі за якістю зображення у поєднанні з інструментом Canvas від Google.
- Налаштовуваності: У майбутньому підтримка тонкої настройки на власних наборах даних перебуває на стадії бета-тестування.
Перспективи та етичні аспекти
“Deep Think є значним кроком вперед у приведенні моделі до людського стилю міркування, але також піднімає питання про споживання ресурсів та управління упередженнями,” — зазначає доктор Олена Мартінес, керівник етики AI у TechInsights.
Google продовжує вдосконалювати свої протоколи тестування на вразливість та управління упередженнями. Наступні релізи мають на меті зменшити кількість ілюзій на 30% і ввести систему реального часу для контролю відповідальності в регульованих галузях, таких як фінанси та охорона здоров’я.
Висновок
З Gemini 2.5 Deep Think Google встановлює нові стандарти для мислення великих моделей, поєднуючи потужність обчислень з розвиненими алгоритмічними стратегіями. У міру його впровадження для підписників і розробників, Deep Think має всі шанси змінити підходи в наукових дослідженнях, розширеній аналітиці та креативному дизайні.