Google представляє нові AI-інструменти для YouTube Shorts та фото

Вступ
З сьогоднішнього дня Google починає впроваджувати функції генеративного штучного інтелекту у YouTube Shorts та Google Photos. Ці інструменти використовують модель Veo 2 для початкових випусків, а влітку цього року планується оновлення до більш потужної моделі Veo 3. Інтегруючи створення відео на основі ШІ безпосередньо в своїх основних додатках, Google прагне зробити виробництво контенту доступним для всіх та зберегти лідерство в сфері споживчого штучного інтелекту.
Відео з підтримкою ШІ на YouTube Shorts
Генеральний директор YouTube Ніл Мохан підтвердив раніше цього року, що Shorts отримає глибоку інтеграцію генеративного ШІ. У новій версії автори можуть:
- Перетворювати статичні фотографії на динамічні кліпи, створені ШІ (до 10 секунд у якості 720p).
- Використовувати готові генеративні ефекти—від стилізованих переходів до синтетичних фонів—безпосередньо в інтерфейсі камери Shorts.
- Досліджувати хаб AI Playground, який демонструє приклади, найкращі практики та аналітику використання.
Всі обчислення здійснюються на TPU v4 Pods Google у вибраних регіонах (США, Канада, Австралія, Нова Зеландія), із типовою затримкою рендерингу менше 8 секунд. Google планує розширити доступність у всьому світі та перейти на Veo 3—модель з приблизно 20 мільярдами параметрів, що підтримує 4K-вихід та детальнішу анімацію—до третього кварталу 2025 року.
Генеративні функції в Google Photos
Користувачі Google Photos у США тепер можуть перетворювати улюблені знімки на короткі анімації. Доступні два режими:
- Легкі Рухи—м’який паралакс та навколишній рух.
- Мені пощастило—випадкові стилістичні трансформації.
У серпні додаток отримає функцію Remix—палету стилів, розроблених дизайнерами, для швидкого створення відео одним дотиком. Новий розділ Створити з’явиться в нижній навігаційній панелі, що підвищить видимість функцій.
Технічні деталі моделей Veo
Архітектура Veo 2 є нейронною мережею на основі трансформерів з приблизно 10 мільярдами параметрів, оптимізованою для економічного хмарного обчислення. Вона використовує ієрархічний механізм уваги для прогнозування послідовностей кадрів на швидкості 24 кадри в секунду. У порівнянні з цим, Veo 3 масштабується до 20–30 мільярдів параметрів, вводить двопотоковий декодер для вищої роздільної здатності та використовує технології розрідженості для зменшення витрат на обчислення вдвічі на кадр.
“Генеративне відео є одним з найскладніших завдань у сфері ШІ,” говорить доктор Амелія Чен, дослідниця ШІ в Стенфордському університеті. “Крок Google у впровадженні цих моделей у споживчі додатки свідчить про впевненість у своїй інфраструктурі та заходах безпеки для водяних знаків.”
Питання конфіденційності, безпеки та етики
Усі відео, створені за допомогою ШІ, містять водяний знак SynthID від Google—міцний цифровий підпис, закодований у каналі яскравості, що запобігає непомітному підробленню. Google проводить постійні перевірки безпеки для фільтрації шкідливого контенту, але зловмисне використання залишається викликом. Партнери індустрії також розробляють відкриті детектори для виявлення синтетичних артефактів відео.
Вплив на ринок та перспективи
Інтегруючи генеративний ШІ в масові додатки, Google прискорює прийняття технології серед непрофесійних користувачів. Конкуренти, такі як Meta та TikTok, намагаються додати подібні можливості, розширюючи межі мобільного ШІ. Аналітики прогнозують, що інструменти споживчого відео на базі ШІ можуть генерувати понад 5 мільярдів коротких кліпів щомісяця до 2026 року, що стимулює нові формати реклами та стратегії монетизації для творців контенту.
Висновок
Впровадження інструментів відео на основі ШІ в YouTube Shorts та Photos від Google є важливим кроком до загального використання генеративних медіа. Хоча Veo 2 пропонує перші враження, майбутнє оновлення Veo 3 обіцяє ще більшу реалістичність та швидкість. З розширенням цих функцій у світі, як творці, так і звичайні користувачі отримають безпрецедентний доступ до генерації відео на вимогу.