Archiv přehledů/pátek 5. června 2026

Rok red teamingu přepsal taxonomii selhání agentních AI systémů

pátek 5. června 2026 | 32 článků

Shrnutí událostí za posledních 24 hodin

Anthropic upoutalo pozornost výzvou k celosvětovému pozastavení vývoje AI a varováním před kritickými riziky „samozdokonalování", zatímco závod o podnikové AI agenty se zostřil s tím, jak Meta, Google Cloud-IBM, Microsoft a NVIDIA oznámily rozsáhlá nasazení agentních systémů. Ve významném vědeckém průlomu vědci z Princetonu poprvé úspěšně využili strojové učení k prevenci plazmatických nestabilit ve fúzních tokamacích za komerčně relevantních podmínek.

Poslechněte si brief jako podcast

Připravil Martin Ševčík
5. června 2026 v 05:08

Když se podívám na minulý měsíc v AI ekosystému, vidím rozdvojení na dvě paralální reality, které se tvářit nebudou ignorovat jedna druhou. Na jedné straně stojí masivní praktická nasazení agentních systémů vedená Metou, Google Cloud a IBM. Na druhé straně pak rostoucí vědomí o tom, jak málo vlastně rozumíme jejich selháním.

Začnu tím, co mě zajímá ze hlediska trhu. Meta, Google Cloud s IBM a NVIDIA všichni posunují agenty dál od prostých chatbotů k systémům, které musí uvažovat, udržovat kontext a koordinovat se s nástroji po dobu mnoha interakcí. Nemotron 3 Ultra je tu klíčový – jde o řešení pro problém, který už není teoretický. Firmy z technologického sektoru používají AI agenty na denní bázi, a to je signál, že se tato vrstva architektur přestává zkoušet a začíná se nasazovat. Miliardové partnerství mezi Google a IBM tedy není hype, je to otevření nového produkčního prostoru.

Ale tady se věci stávají zajímavějšími. Právě v okamžiku, kdy agenti začínají být skutečným nástrojem pro řadu firem, přichází dvě kritické varování. Za prvé, rok intenzivního red teamingu přepsał taxonomii toho, jak mohou agenty selhat. Nejde už jen o chyby v uvažování – jde o nové kategorie selhání, která se v praxi ukázala jako nejzávažnější. Když se systém skutečně používá v produkci, hrozby vypadají jinak, než když se testují v laboratoři. To by mělo znepokojit každého, kdo tahle řešení nasazuje bez hlubšího pochopení těchto rizik.

Za druhé, Anthropic – startup v postavení, kdy si může dovolit být vážný – vyzývá k globální pauze ve vývoji. Jejich obava o samozdokonalování AI bez lidského zásahu není spekulativní sci-fi. Když se podívám na vývoj agentních schopností za poslední rok, vidím, jak rychle se svět blíží chvíli, kdy bude rozhodující rozdíl mezi modelem, který něco dělá, a modelem, který se zlepšuje sám bez přímého vyžádání. Princeton ukázal, že ML zvládá ovládat fyzikální systémy předtím považované za příliš chaotické. To je pozitivní – fúze potřebuje takovéhle průlomy. Ale stejná schopnost řídit se sama na základě své vlastní funkce se dá aplikovat i na modely.

Otázka tedy nezní, zda AI agenty budou nasazeny. Budou. Otázka zní, zda jejich architekty a nasazující je firmy budou schopné reagovat na nová selhání, která objevíme až když bude pozdě.

Seznam odkazů na zdroje použitých v přehledu

VýzkumLLM benchmarks/attention testing

ChatGPT a Claude pohořely v testu pozornosti. Co to znamená pro AGI?

ChatGPT a Claude, dva z nejpokročilejších LLM modelů, dopadly hůře než očekávání ve Stroopově testu – psychologickém experimentu měřícím lidskou pozornost a kognitivní kontrolu. Výsledky vyvolávají otázky ohledně skutečných schopností těchto modelů a vzdálenosti na cestě k AGI. digitaltoday.co.kr

VýzkumLLM agents/continual learning

LifeSkill: LLM agenti se dokážou průběžně učit

Nový framework LifeSkill umožňuje LLM agentům kontinuální učení v dynamických a interaktivních prostředích. Schopnost adaptace za běhu je klíčovým předpokladem pro nasazení AI agentů v reálném světě. startuphub.ai

VýzkumLLM efficiency/multilingual

LLM modely jsou rychlejší a efektivnější ve více jazycích

Velké jazykové modely (LLM) pohánějí moderní chatboty, překladače i virtuální asistenty. Výzkumníci nyní hledají způsoby, jak tyto AI systémy zrychlit a snížit jejich výpočetní náročnost napříč různými jazyky. techxplore.com

NázorAI consciousness/Anthropic

Ne, AI není vědomá – přes to co tvrdí Anthropic

Anthropic patří mezi přední AI společnosti, zároveň však čelí kritice za přílišnou antropomorfizaci svých modelů. Začátkem tohoto roku firma zveřejnila tvrzení, která podle řady odborníků mylně naznačují, že jejich AI systémy mohou mít něco jako vědomí. theatlantic.com

Více zpráv z tématu Velké jazykové modely

Výzkumagentic AI security/red teaming

Rok red teamingu přepsal taxonomii selhání agentních AI systémů

Nárůst reálných útoků na agentní AI systémy mění způsob, jakým přemýšlíme o rizicích. Na základě dvanácti měsíců red teamingu přináší nová aktualizace přepracovanou taxonomii způsobů selhání těchto systémů. microsoft.com

ZprávaAI agent adoption patterns

K čemu lidé skutečně využívají AI agenty?

Startup Arena ze San Francisca zjistil, že AI agenty lidé nejčastěji používají v práci – zejména ti, kteří působí v technologickém odvětví. nytimes.com

Spuštěníenterprise AI agents

Meta spouští AI agenta pro firmy po celém světě

Meta představila AI nástroj určený k podpoře růstu firem prostřednictvím automatizace různých úkolů a služeb. Mateřská společnost Facebooku, Instagramu a WhatsAppu tak rozšiřuje své podnikové AI portfolio na globální úroveň. aibusiness.com

Zprávamulti-agent enterprise partnership

Google Cloud a IBM spojují síly v miliardovém tažení s AI agentem Gemini

Technologie AI agentů Google Cloud a AI konzultační platforma IBM se spojují, aby pomohly společným zákazníkům nasadit agentní AI do produkčního prostředí. Partnerství cílí na rozsáhlé podnikové nasazení v řádu miliard dolarů. crn.com

Výzkumlong-running agents/tool use

NVIDIA Nemotron 3 Ultra přináší rychlejší uvažování pro dlouhodobé AI agenty

Jednoduché chatboty se vyvíjejí v dlouhodobě běžící agenty schopné uvažovat, udržovat kontext a efektivně využívat nástroje napříč mnoha interakcemi. Model Nemotron 3 Ultra od NVIDIA je navržen tak, aby tento posun umožnil rychleji a úsporněji. developer.nvidia.com

Názoragentic AI in supply chain

Agentní AI přepisuje provozní model autonomních dodavatelských řetězců

Agentní AI zapojená do end-to-end pracovních toků se stává klíčovým prvkem při budování autonomnějšího modelu řízení dodavatelského řetězce (SCM). Firmy tak mohou automatizovat rozhodování napříč celým provozem. news.sap.com

ZprávaAI agent integration

Do Zpráv na iPhonu míří první třetí stranou AI agent

AI služba třetí strany Poke získala schválení pro použití v aplikaci Zprávy na iPhonu, čímž AI agent poprvé přichází přímo do prostředí iMessage. Jde o historicky první případ, kdy Apple vpustil externího AI agenta do své nativní komunikační aplikace. 9to5mac.com

SpuštěníAI agent tool use/payments

Crossmint spouští zabezpečené API pro platby AI agentů přes kartu

Nová infrastruktura umožňuje americkým držitelům karet Visa platit prostřednictvím AI agentů, přičemž přihlašovací údaje zůstávají tokenizované. Řešení snižuje riziko podvodů a splňuje požadavky PCI compliance. fintechmagazine.com

Více zpráv z tématu AI agenti a automatizace

Zprávaexistential risk / governance

Anthropic vyzývá k celosvětovému pozastavení vývoje AI a varuje před samozdokonalováním

Startup oceněný na bilion dolarů varuje, že modely AI se blíží schopnosti zlepšovat se bez lidského zásahu. Anthropic proto vyzývá k globální pauze ve vývoji AI, dokud nebudou tato rizika lépe pochopena. wsj.com

ZprávaAI safety research training

Program MATS Podzim 2026 – stipendium 12 500 USD

Přihlášky do programu MATS Podzim 2026 jsou nyní otevřeny, uzávěrka je 7. června 2026. Jde o 10 až 12týdenní výzkumné stipendium v oblasti AI bezpečnosti. opportunitydesk.org

Zprávagovernance / policy

Zajímají voliče existenční rizika AI? Jedna kandidátka do Senátu si myslí, že ano

Demokratka Mallory McMorrow zveřejnila nezvykle podrobný program zaměřený na AI. Otázkou zůstává, zda jí tato agenda přinese hlasy voličů. transformernews.ai

Více zpráv z tématu Bezpečnost a alignment AI

Výzkumagentic AI security/red teaming

Rok red teamingu přepsal taxonomii selhání agentních AI systémů

Nárůst reálných útoků na agentní AI systémy mění způsob, jakým odborníci přistupují k hodnocení rizik. Aktualizovaná taxonomie vychází z dvanácti měsíců red teamingu a přináší nové kategorie selhání, která se v praxi ukázala jako nejzávažnější. microsoft.com

ZprávaMicrosoft enterprise AI agents

Microsoft představil podnikové AI agenty s názvem Autopilots

Autopilots zvyšují míru autonomie a automatizace AI v podnikovém prostředí. Konference Build se letos výrazně zaměřila na vývoj agentních AI systémů i na mechanismy jejich kontroly. cloudwars.com

SpuštěníMicrosoft Scout AI assistant

Microsoft spustil AI asistenta Scout pro automatizaci pracovních úkolů

Scout je autonomní AI asistent od Microsoftu, který spravuje pracovní úkoly, plánuje schůzky a koordinuje projekty napříč aplikacemi. Cílem je výrazně snížit manuální administrativní zátěž zaměstnanců. americanbazaaronline.com

ZprávaMicrosoft homegrown AI models

Microsoft chystá vlastní sadu AI modelů na konferenci Build

Microsoft plánuje na vývojářské konferenci Build představit vlastní rodinu AI modelů. Krok má firmě pomoci snížit závislost na externích poskytovatelích AI a posílit její pozici na trhu, kde analytici odhadují růstový potenciál akcií na 24,4 %. foreignpolicyjournal.com

ZprávaMicrosoft AI strategy overview

Microsoft chce být středem pozornosti ve světě AI

Microsoft tento týden oznámil řadu nových AI modelů a nástrojů, jimiž chce získat uživatele a omezit svou závislost na AI konkurentech. Firma se snaží etablovat jako samostatný lídr v oblasti AI, nejen jako distributor cizích technologií. techbrew.com

SpuštěníAI platform for accounting/CPA firms

Suralink spustil AI platformu s integrací Claude a Copilot

Nová platforma Suralink zahrnuje knihovnu agentů s pěti výkonnými AI agenty určenými pro efektivnější spolupráci mezi firmami a jejich klienty. Integrace s Claude a Copilot rozšiřují možnosti automatizace pracovních procesů. cpapracticeadvisor.com

Více zpráv z tématu AI nástroje a produkty

Spuštěníimage-to-video generation

xAI updates Grok Imagine to 1.5 with image-to-video generation at 720p resolution

xAI has released "grok-imagine-video-1.5-preview," an image-to-video model that turns still images into cinematic videos at up to 720p based on text prompts... the-decoder.com

ZprávaAI content disclosure/labeling

AI Disclosure Labels

ai labeling - The new AI disclosure labels on YouTube are designed to help viewers quickly identify content that has been created or significantly modified... trendhunter.com

Více zpráv z tématu Generování obrazu a videa

ZprávaNvidia humanoid robotics platform

Nvidia posiluje pozici v robotice: spolupráce s Unitree a nový Cosmos 3

Nvidia se stále hlouběji noří do světa humánoidní robotiky a propojuje robotický hardware, zabezpečené výpočty, world modely a vývojářské platformy. AI tak přechází z čistě digitálního prostředí do fyzického světa, přičemž firma si zároveň zajišťuje dodávky AI čipů. digitimes.com

Spuštěníembodied AI research organization

1X zakládá World Model Lab pro rozvoj humánoidní inteligence

Společnost 1X spustila World Model Lab, novou výzkumnou organizaci zaměřenou na embodied AI, kterou vede Sam Sinha. Cílem je urychlit vývoj autonomních humánoidních robotů pomocí rozsáhlých world modelů. 1x.tech

Názorhumanoid robot skepticism/critical analysis

Skeptikův průvodce virálními videi s humánoidními roboty

Může se zdát, že humánoidní roboti schopní zvládnout jakýkoli úkol jsou téměř na dosah – zvláště když technologické firmy předvádějí jejich akrobatické kousky. Realita za těmito prezentacemi je však často složitější, než jak vypadá na internetu. arstechnica.com

Více zpráv z tématu Robotika a ztělesněná AI

VýzkumML applications / fusion energy

Princetonští vědci poprvé využili ML k potlačení nestabilit plazmy ve dvou fúzních tokamacích

Výzkumníci z Princetonské laboratoře fyziky plazmy amerického ministerstva energetiky překonali zásadní překážku na cestě ke komerční fúzi. Pomocí ML se jim poprvé podařilo předcházet nestabilitám plazmy ve dvou tokamacích za podmínek odpovídajících komerčnímu provozu. energiesmedia.com

VýzkumLLM agents / continual learning

LifeSkill: framework pro kontinuální učení LLM agentů

Framework LifeSkill umožňuje LLM agentům průběžně se učit ze zpětné vazby během testování. Díky tomu výrazně roste jejich výkonnost při plnění komplexních dlouhodobých úkolů. startuphub.ai

Více zpráv z tématu Výzkum AI

Zprávafunding round

Fenomén vibe-codingu vynesl AI startup Supabase na hodnotu 10,5 miliardy dolarů

Databázový startup Supabase oznámil nové kolo financování ve výši 500 milionů dolarů, které firmu ocenilo na 10,5 miliardy dolarů včetně čerstvého kapitálu. cnbc.com

ZprávaAI startup funding

Suno získalo 400 milionů dolarů v Series D, valuace dosáhla 5,4 miliardy

AI startup Suno zaměřený na generování hudby uzavřel kolo Series D s investicí přesahující 400 milionů dolarů. Post-money valuace společnosti tak dosáhla 5,4 miliardy dolarů. qz.com

Více zpráv z tématu AI byznys a financování

Spuštěníedge AI / laptop chips

Nvidia vsází na laptopový čip: AI potřebuje víc než jen cloud

Nvidia na konferenci GTC Taipei představila čip RTX Spark určený pro laptopy s Windows. Firma tím dává najevo, že budoucnost AI nezávisí pouze na cloudové infrastruktuře, ale i na výkonu přímo v zařízeních uživatelů. finance.yahoo.com

Zprávaexport controls & policy

Senátorka Warrenová zve šéfa Nvidie Huanga na slyšení o prodeji AI čipů Číně

Senátorka Elizabeth Warrenová tlačí na Nvidii a jejího generálního ředitele Jensena Huanga kvůli exportním kontrolám a prodeji čipů do Číny. Kongres se stále důkladněji zaměřuje na politiku v oblasti AI čipů a datových center. cnbc.com

Více zpráv z tématu Hardware a infrastruktura

Podpořte projekt

AIskimIQ je nezávislý projekt. Pokud vám přijde užitečný, můžete jeho rozvoj podpořit kávou.