Inference je nové pole bitvy v AI. Zatímco všichni sledují, jak se zvětšují modely a roste jejich vědomost, skutečná práce se děje na straně, kde se ty modely skutečně spouštějí. Peking University a DeepSeek právě uvolnily DSpark, framework, který zrychluje provoz jazykových modelů o 60 až 85 procent. To není cosmetická úprava – to je změna v tom, co se economicky dá dělat s technologií, kterou už máme.
Apropos praktickému dopadu: Anthropic zveřejnila výsledek, který by měl všem, kdo stavějí AI systémy, zatančit oči. Claude Opus 4.7 naprogramoval fyzického robota za devět minut. Lidských týmů s AI pomocí trvalo tři hodiny. Devět minut versus tři hodiny. To není jen o rychlosti – to vypovídá o kvalitě rozhodnutí a schopnosti systému iterovat bez frustrace, kterou člověk pociťuje. Anthropic sám tomu říká zlomový bod pro fyzické AI, a podotýkám, že když to řekne Anthropic, stojí to za seriózní pozornost.
Tyto dva pohyby – zrychlení inference a robotické programování – se sčítají. AGIBOT právě překročil patnácti tisícovku vyrobených robotů. Nejde už o prototypy v laboratoři. Jde o sériovou výrobu, která se přesunula do reálného provozu. Pokud máte rychlejší inference a můžete programovat robota v minutách místo hodin, ekonomika se mění.
Musím ale zmínit jednu věc, která mi v tom všem vadí. Čím více se posouvá AI do autonomních agentů a praktických systémů, tím více vidím články o injection útocích a bezpečnostních chybách v těch designech. Prompt injection není teoretická hrozba – to jsou live problémy v korporátních RAG pipeline a routovacích systémech. Máme velmi efektivní modely, máme roboty, které se umí rychle programovat, ale máme zastaralé bezpečnostní postupy. To je kombinace, která mě trošku znepokojuje.
Předpokládám, že příštích šest měsíců budeme sledovat, jestli průmysl rychleji vyřeší bezpečnost, nebo jestli se bude snažit růst rychleji než rizika. Historie říká, že obvykle to je druhá varianta. Uvidíme.