Очікується вихід моделі GPT-5 від OpenAI у серпні

Головна — News — Очікується вихід моделі GPT-5 від OpenAI у серпні

У четвер, The Verge повідомив, що OpenAI готується до запуску GPT-5 вже в серпні, посилаючись на джерела, знайомі з планами компанії. Ця довгоочікувана модель має на меті об’єднати традиційні можливості генеративного попередньо навченного трансформера (GPT) з спеціалізованим мисленням систем серії o.

Уніфікована архітектура та покращене мислення

Спираючись на досягнення GPT-4 та серії o3, очікується, що GPT-5 об’єднає велику мовну модель (LLM) та двигун симульованого мислення (SR) в одній архітектурі. Перші згадки, такі як gpt-5-reasoning-alpha-2025-07-13, вказують на налаштування “reasoning_effort: high”, що свідчить про інтеграцію багатоступеневої логічної системи, яка працює паралельно зі стандартним висновком трансформера.

Огляд: Framework Desktop — модульний ПК проти Mac Studio

2025-08-07

Закулісся: Хронологія розробки та масштабування серверів

Інженери Microsoft, за повідомленнями, почали підготовку серверної потужності Azure для кластерів GPT-5 ще в кінці травня, розширюючи пул GPU з прискорювачами NVIDIA H100 та H200, з’єднаними через NVLink та InfiniBand. Незважаючи на початкові розгортання, проблеми зі стабільністю розподіленого навчання та зменшенням втрат пакетів відклали запуск на кілька тижнів.

Архітектурні інновації в GPT-5

Серед ключових технічних оновлень, які обговорюються, є:

Шари Mixture-of-Experts (MoE), які динамічно направляють токени до спеціалізованих підмереж, підвищуючи ефективність параметрів.

Механізми Sparse Attention з складністю O(n√n), які знижують витрати на обчислення для довгих контекстів.

Уніфікований мультимодальний конвеєр, що підтримує текстові, образотворчі та аудіо енкодери для навчання від початку до кінця через різні модальності.

Клонування голосу ШІ у атаках вішингу з використанням дипфейків

2025-08-07

Бенчмарки та очікування щодо продуктивності

Ранні внутрішні бенчмарки свідчать про те, що GPT-5 перевершує GPT-4 за стандартними оцінками:

MMLU: +5% абсолютного покращення у порівнянні з GPT-4.

HumanEval: 60% успішності на завданнях кодування, у порівнянні з 55% у GPT-4.

Winoground та HellaSwag: значні покращення в загальному мисленні.

Можливі сценарії використання та вплив на індустрію

Експерти очікують, що GPT-5 стане основою для розробки передових застосунків у:

Автоматизованій розробці програмного забезпечення з більш точною синтезою коду та налагодженням в реальному часі.

Наукових дослідженнях, аналізуючи складні набори даних і пропонуючи нові гіпотези.

Генерації креативного контенту в текстовій, образотворчій та аудіо формах, що дозволяє створювати більш насичені історії.

Коментар експерта

“Дизайн GPT-5, що поєднує LLM та SR, представляє собою кардинальну зміну в тому, як великомасштабні AI-системи обробляють логічне мислення,” зазначила доктор Джейн Сміт, старший дослідник в Стенфордському AI Lab. “Поєднання MoE та sparse attention може встановити нові стандарти як для продуктивності, так і для ефективності параметрів.”

Глава Google Search захищає результати ШІ на тлі занепокоєння щодо CTR

2025-08-06

Безпека, узгодженість та ініціатива відкритих ваг

OpenAI також планує випустити меншу модель з відкритими вагами, схожу на міні-систему o3, що дозволить розробникам з локальним обладнанням виконувати просунуте мислення на місці. За словами CEO Сема Альтмана, тривають додаткові тести на безпеку та ред-тимінгові вправи, щоб зменшити ризики експлуатацій до публічного розповсюдження.

Перспективи: Місце GPT-5 у планах OpenAI

Хоча GPT-5 може з’явитися в серпні, довгострокове бачення OpenAI включає ще більші моделі на передовій, глибшу інтеграцію мультимодальних даних та вдосконалення навчання зворотного зв’язку від людей (RLHF). Модульний, уніфікований дизайн GPT-5 може стати основою для динамічної композиції моделей у майбутніх релізах, таких як GPT-6.