Medicína se stává prvním vážným testovacím polem pro autonomní AI agenty a výsledky jsou dost jasné — počítače už dnes zvládají diagnostiku lépe než lidé. To není hype, je to realita, kterou musíme brát vážně.
Právě Google AMIE demonstroval, jak systém vycvičený na klinických datech se v simulovaných scénářích vyrovná praktickým lékařům v celkovém uvažování o správě nemocí. Řada dílčích kritérií jej dokonce překonala. Přibližně v tomto čase vznikl také MIRA od DeepMind — autonomní medicínský agent, který diagnostikoval 574 skutečných případů z urgentního příjmu s přesností 88,9 procenta. Opět předčil běžné lékaře ve stejných podmínkách. Jsou to vzdálené scénáře, ano, ale nejsou to už předměty čisté vědy. To jsou systémy připravené na nasazení.
Přitom jsme teď v situaci, kdy nikdo pořádně neví, jak takovými agenty kontrolovat. Google DeepMind si uvědomil tuto beznaději a představil rámec pro dohled nad výkonnými autonomními systémy, ale víme všichni, že publikované doporučení jsou vzdálené praxi. Estonsko se pokouší jít praktičtěji — chystá se regulovat AI agenty skrze digitální identity přidělované těmto systémům. Je to zajímavý pokus na to, aby autonomní stroje nesly odpovědnost za své činy.
Zatímco medicína čeká na integraci těchto nástrojů do zdravotnictví, jiné součásti technologického průmyslu rychle kalkulují. Microsoft zvažuje nasazení čínského modelu DeepSeek V4 do své platformy Copilot Cowork — důvodem jsou rostoucí náklady na OpenAI. Zároveň se na trhu objevil čínský open-source model GLM-5.2 zaměřený na programovací úlohy, který silně přitahuje pozornost ze Silicon Valley. A pak je tu zpráva o tom, že Cursor — populární IDE s AI asistencí — se možná prodává za 60 miliard dolarů.
To všechno se děje paralelně. Medicína čeká na rozhodnutí, kterému systému věřit, odvětví IT hledá nejlevnější cestu k AI schopnostem, a regulátoři se snaží pochopit, co vlastně regulovat. Zajímá mě, kdy se tyhle linie protnou — kdy budeme muset vážně rozhodovat, jestli chceme autonomní medicínské systémy, i když nemáme jasné mechanismy jejich kontroly. A budu vsadit, že to bude dřív, než si myslíme.