Google Photos святкує 10 років: оновлення редактора з ШІ

Цього місяця ми святкуємо 10-річчя Google Photos — однієї з найбільших платформ для управління зображеннями у світі. Запущена у травні 2015 року на основі Google Plus, ця служба зросла до понад 1,5 мільярда активних користувачів щомісяця та зберігає понад 9 трильйонів фотографій і відео. На честь ювілею Google представляє значне оновлення своїх інструментів редагування, нові можливості для обміну та докладну інформацію про масштабну хмарну інфраструктуру сервісу.
Відзначаємо десятиріччя візуальних спогадів
Google Photos змінила ринок, пропонуючи необмежене зберігання зображень високої якості з моменту свого запуску. У 2021 році модель змінилася, і користувачі отримали 15 ГБ безкоштовного місця, яке ділиться між Gmail, Drive і Photos, що сприяло переходу на платні підписки Google One. Сьогодні доступні тарифи від 100 ГБ до 30 ТБ, а корпоративні клієнти можуть скористатися індивідуальними планами. Незважаючи на зміни, користувачі виконують понад 370 мільйонів пошукових запитів щомісяця, щоб знайти фотографії за об’єктами, місцями чи тегами осіб.
- Оригінальне необмежене безкоштовне зберігання для стиснених зображень
- Перехід на 15 ГБ спільного зберігання у 2021 році
- Актуальні підписки Google One до 30 ТБ
Новий редактор з елементами штучного інтелекту
Центральним елементом оновлення до ювілею став перероблений редактор, що об’єднує всі інструменти в єдиний інтерфейс. Використовуючи мультимодальний штучний інтелект Gemini, редактор може одночасно пропонувати кілька покращень і надавати контекстуальні підказки, коли ви торкаєтеся або обводите об’єкти на зображенні.
- Об’єднаний хаб інструментів з пропозиціями в реальному часі від ШІ
- Режим переосмислення для генеративних змін вибраних областей
- Авторамка для переробки композиції з допомогою ШІ
- Локалізовані покращення через вибір за допомогою торкання або ласо
Покращений обмін за допомогою QR-кодів
Обмін альбомами довгий час ґрунтувався на можливості ділитися посиланнями та контактами. Починаючи з цього літа, користувачі зможуть створювати динамічні QR-коди для надання доступу до перегляду або внесення змін. Роздрукуйте чи покажіть код на заходах, щоб зібрати фотографії — це ідеально підходить для сімейних зустрічей, весіль або конференцій.
Технічний аналіз: ШІ та інфраструктура
Під капотом Google Photos працює на флоті TPU v5 та графічних процесорах Titan у Google Cloud. Завантажені зображення попередньо обробляються за допомогою Cloud Dataflow і маршрутизуються через мережу Kubernetes. Новий редактор використовує трансформер з 2 мільярдами параметрів з родини Gemini, навчений на наборах даних Imagen3 та Parti для композиції сцен, з eDiffi, що забезпечує інпейнтинг на рівні пікселів.
Масштабованість та архітектура зберігання
Зберігання понад 9 трильйонів медіа-об’єктів вимагає розподіленого сховища об’єктів, підтримуваного хмарними сховищами з регіональною реплікацією. Метадані та індекси пошуку зберігаються у Spanner, що дозволяє виконувати глобальні запити за мілісекунди для групування осіб, виявлення об’єктів та пошуку геотегів. Автоматизоване управління життєвим циклом переміщує менш використовувані активи до Nearline і Coldline, оптимізуючи витрати без втрати доступності.
Конфіденційність, безпека та відповідність
Усі фотографії та відео шифруються під час зберігання за допомогою AES256 і під час передачі з використанням TLS. Google Photos застосовує диференційовану конфіденційність для агрегування аналітики пошуку та інтегрується з Privacy Sandbox для вимірювання реклами. Користувачі зберігають повний контроль над налаштуваннями автоматичного резервного копіювання, групуванням осіб та метаданими місцезнаходження. Платформа також підтримує відповідність GDPR, CCPA та HIPAA через корпоративні угоди.
Думка експерта
На думку Емми Чжан, провідного програмного інженера Google Cloud AI, це оновлення є важливою віхою у поєднанні масштабного машинного навчання з робочими процесами редагування фотографій для споживачів, надаючи кожному користувачеві креативну силу на дотик.
Перспективи
Google планує розширити сегментацію відеосцен, використовуючи Gemini Pro, впровадити інференцію на пристроях Android з Coral Edge TPU та інтегрувати генеративні підказки в Google Lens для редагування об’єктів у реальному часі. У той час як конкуренти, такі як Adobe Creative Cloud та нові стартапи у сфері ШІ, впроваджують інновації, Google Photos використовує свої масштаби хмари та лідерство у дослідженнях ШІ, щоб залишатися попереду.
Доступність
Оновлений редактор з’явиться на Android у червні та на iOS у четвертому кварталі. Обмін альбомами через QR-коди розпочнеться в липні. Підписники Google One з тарифами на 2 ТБ або вище отримають доступ до попереднього перегляду розширених генеративних фільтрів без додаткових витрат.