Робот DaVinci на базі ШІ успішно виконав видалення жовчного міхура автономно

Вступ
З кінця 1990-х років платформа DaVinci компанії Intuitive Surgical стала справжньою революцією в галузі малоінвазивної телеперевіреної хірургії. Досвідчені хірурги керують роботизованими руками та мікроінструментами через головні консолі, спираючись на відеопотоки високої чіткості з ендоскопів. Наразі дослідницька команда Університету Джонса Хопкінса розширила цю парадигму, інтегрувавши AI-моделі на основі трансформерів — подібні до тих, що використовуються в ChatGPT — безпосередньо в систему DaVinci, що дозволило виконувати повністю автономні холецистектомії на екс-віво свинячих тканинах.
Еволюція телеперевіреної хірургії
Перші експерименти з автоматизації хірургії ґрунтувалися на попередньо запрограмованих рухах, подібно до промислових роботів Kuka на конвеєрах:
- Жорсткі, прописані процедури
- Обмежена адаптивність до змін у м’яких тканинах
- Залежність від механічних маркерів або кольорових позначок
STAR (Smart Tissue Autonomous Robot), представлений у 2022 році, покращив адаптивність, налаштовуючись на неструктуровану анатомію за допомогою зворотного зв’язку з зображеннями в реальному часі. Однак STAR вимагав спеціального обладнання та маркерів для точного визначення меж тканин.
Автономія на основі AI з архітектурами трансформерів
У новітньому дослідженні команда на чолі з Джі Вунгом Кімом замінила спеціалізоване обладнання STAR на стандартну промислову систему DaVinci Xi, використовуючи її чотири руки з 7 ступенями свободи, 3D-ендоскоп (1920×1080 при 60 кадрах на секунду) та власні змінники інструментів.
Архітектура системи
Програмне забезпечення складається з двох взаємопов’язаних модулів трансформерів:
- Трансформер високого рівня: обробляє послідовні відеокадри та кінематику інструментів для створення динамічного хірургічного плану — сегментація анатомічних орієнтирів, прогнозування напруги тканин та планування ключових дій (встановлення кліпс, дисекція, коагуляція).
- Трансформер низького рівня: перетворює виходи політики в реальні траєкторії руху суглобів, оптимізуючи уникнення зіткнень, обмеження сили (<0,5 Н точність) та орієнтацію інструментів (±2° допуск).
“Відокремивши синтез плану від виконання траєкторії, ми досягаємо як стратегічної гнучкості, так і субміліметрової точності,” зазначає Аксель Крігер, асистент професора механічної інженерії в Університеті Джонса Хопкінса.
Дані та навчання
Більше 17 годин синхронізованого відео (ендоскоп + камери на руках при 60 кадрах на секунду), кінематика (дані в декартовій та суглобовій системах координат при 500 Гц) та анотації хірургів (описи кроків природною мовою) стали основою для навчання. Розширення даних — випадкове освітлення, легка деформація тканин та симульоване закриття димом — підвищило надійність системи.
Навчання через імітацію для холецистектомії
Холецистектомія — видалення жовчного міхура — є однією з найпоширеніших абдомінальних процедур (приблизно 700,000 щорічно в США). Команда розділила її на 17 окремих підзавдань (наприклад, фенестрація трикутника Калота, кліпсування цистичного протоку, перерізання цистичної артерії), кожне з яких має критерії успіху на основі сили, кута та просторових допусків.
Під час оцінювання на невідомих свинячих трупах система DaVinci, керована AI, досягла 100% успіху, повторюючи точність експертних хірургів (<1 мм залишкової тканини), хоча з 20% перевищенням часу — що можна пояснити обережними запасами безпеки в плануванні шляху.
Регуляторні виклики та етичні аспекти
Перехід від трупного до живого тваринного та, зрештою, до людських випробувань вимагає дотримання шляхів Дозволу на дослідницькі пристрої (IDE) FDA та затвердження Комітету з догляду за тваринами (IACUC). Основні проблеми включають:
- Моніторинг у реальному часі та можливість втручання людини-хірурга
- Протоколи безпеки на випадок кровотечі або несподіваних властивостей тканин
- Конфіденційність даних та безпека відео та кінематики пацієнтів
Етики попереджають, що повністю автономні хірургічні системи повинні забезпечувати прозорість у прийнятті рішень та включати надійну валідацію проти рідкісних анатомічних варіантів.
Майбутні напрямки: інтеграція реального зображення та тактильного зворотного зв’язку
Наступні дослідження інтегрують:
- Інтраопераційне ультразвукове дослідження для картування судин
- Оптичну когерентну томографію (ОКТ) для характеристики підповерхневих тканин
- Тактильні зворотні зв’язки за допомогою датчиків деформації на інструментах для динамічного регулювання сили захоплення
Ці вдосконалення спрямовані на зменшення необхідності повернення до телеперевірки та подальше звуження часової різниці між AI та експертною людською діяльністю.
Порівняння з іншими автономними хірургічними платформами
Окрім STAR та SRT-H, кілька ініціатив прагнуть до автономії в хірургії:
- Raven II від CMU: Платформа з відкритим кодом, що зосереджується на завданнях швів з контролем напруги на основі зору.
- Роботизований ендомікроскоп Університету Токіо: Поєднує клітинну візуалізацію для оцінки меж.
Хоча кожна система орієнтується на конкретні підпроцедури, підхід трансформерів Університету Джонса Хопкінса пропонує єдину структуру, що адаптується до різноманітних операцій з м’якими тканинами.
Висновок
- Автономія на основі трансформерів розширює можливості DaVinci за межі телеперевірки.
- Комплексний збір даних (відео + кінематика + мова) є основою 100% успіху на свинячих моделях.
- Наступні кроки включають випробування на живих тваринах, отримання регуляторних дозволів та інтеграцію багатофункціональних сенсорів.