Jak si postavit vlastní LLM
Přední AI modely jsou stále častěji ohroženy přísnými exportními omezeními nebo rostoucími náklady na API. Provoz vlastního LLM se tak stává lákavou alternativou pro firmy i jednotlivce. towardsdatascience.com
35 článků
Uvedení čipu 'Jalapeño' od společností Broadcom a OpenAI v rámci infrastrukturní investice ve výši 200 miliard dolarů představuje zásadní milník v oblasti hardwaru, zatímco spuštění Anthropic Claude Science Beta přináší multi-agentní platformu pro reprodukovatelné vědecké výzkumné pipeline. Microsoft zároveň sloučením spotřebitelské a podnikové verze aplikace Copilot signalizuje významnou konsolidaci na trhu nástrojů pro produktivitu poháněných umělou inteligencí.
Infrastruktura AI se právě rozděluje na dvě velmi odlišné cesty a vidím v tom zásadní napětí, které bude formovat průmysl příští roky. Na jedné straně Broadcom a OpenAI sázejí na vlastní silikon – jejich nový čip Jalapeño je součástí gigantického projektu za 200 miliard dolarů zaměřeného na inference velkých modelů. Na druhé straně firmy masivně budují interní kapacity a hledají způsoby, jak se zbavit závislosti na API velkých hráčů. Nejde jen o techniku, jde o moc a kontrolu.
Ten druhý trend je pravděpodobně zajímavější. Rozmach vlastních LLM není už záležitostí jen mega-korporací – jednotlivci a střední firmy si dnes mohou pořídit modely, které fungují bez přístupu na veřejné API. Exportní omezení a rostoucí náklady to dělají přitažlivým, ale za cenu složitější infrastruktury. Appropos, Microsoft právě slučuje konzumenta a enterprise verzi Copilotu do jedné aplikace do srpna – signál toho, že hranice mezi těmito světy se rozmazávají.
Kde se to stává kritické, je v manažerské rovině. Gartner tvrdí, že průměrná velká korporace bude do roku 2028 provozovat více než 150 tisíc AI agentů, oproti 15 v letošním roce. Není to jen nárůst čísla – je to exponenciální komplikace bezpečnosti, auditu a kontroly. Právě proto Čína vydala první praktický bezpečnostní standard pro nasazování AI agentů. Není to ideologický krok; je to pragmatická odpověď na chaos, který přichází. Když firmy spustí statisíce agentů, potřebují rámec. Antropic zase představil Claude Science, multi-agentní platformu pro výzkum, která si sama ověřuje citace a spouští komplexní pipeline. I to je příklad toho, jak se agenti stávají mainstream částí reálného pracovního toku.
Otázka, kterou si kladu: budeme schopní spravovat a bezpečnostně kontrolovat systémy v takto masivním měřítku? Nebo se sebeničíme spíš chaosem než bezpečnostní přehledností? Infrastrukturní sázka Broadcomu a OpenAI má smysl – potřebujeme efektivní hardware – ale bez paralelního posunu v architektuře, auditu a správě dat bude to jako stavět небoskreb bez dodržování stavebních předpisů.
Přední AI modely jsou stále častěji ohroženy přísnými exportními omezeními nebo rostoucími náklady na API. Provoz vlastního LLM se tak stává lákavou alternativou pro firmy i jednotlivce. towardsdatascience.com
Model GLM-5.2 od Z.ai se přímo měří s předními americkými AI modely v oblastech programování a kybernetické bezpečnosti. Jeho uvedení odráží rostoucí konkurenční tlak v čínském AI prostředí. thehindu.com
Jihokorejští výzkumníci zjistili, že AI agenti spotřebují na jeden dotaz až 136,5krát více energie než běžné generativní AI systémy. Studie upozorňuje na zásadní problém udržitelnosti při masovém nasazení agentních AI řešení. mbiz.heraldcorp.com
Výzkumný tým profesora Minsoo Rhua z KAIST School of Electrical Engineering provedl první kvantitativní analýzu výpočetních nákladů AI agentů. Výsledky odhalují dosud přehlíženou energetickou zátěž spojenou s jejich provozem. eurekalert.org
Mistral AI, nabízející některé open source AI modely, od svého vzniku v roce 2023 získal značné investice. Ambicí společnosti je zpřístupnit špičkové AI modely co nejširšímu okruhu uživatelů. techcrunch.com
Jihokorejský technologický gigant Naver zúročil 27 let zkušeností s vyhledáváním při vývoji vlastního LLM a SLM modelů. Součástí strategie jsou i multimodální schopnosti postavené na hluboce zakořeněné vyhledávací infrastruktuře. biz.chosun.com
Podle Gartneru by průměrný globální podnik ze žebříčku Fortune 500 mohl do roku 2028 provozovat více než 150 000 AI agentů – oproti méně než 15 v roce 2025. Jde o dramatický nárůst, který klade nové nároky na správu a bezpečnost podnikové AI infrastruktury. letsdatascience.com
Anthropic vydal Claude Science, beta verzi multi-agentního AI pracovního prostředí určeného pro výzkumné pipeline v oblasti genomiky, proteomiky a chemoinformatiky. Platforma dokáže spouštět celé výzkumné pipeline od začátku do konce a automaticky ověřuje každou citaci. marktechpost.com
Čínský výbor TC260 zveřejnil praktického průvodce standardy kybernetické bezpečnosti – bezpečnostní směrnice pro nasazení a používání AI agentů. Dokument stanovuje pravidla pro bezpečné provozování AI agentů v podnikové i veřejné sféře. geopolitechs.org
BNB Chain uvedl Agent Studio na mainnet své Smart Chain, vývojáři díky tomu mohou nasadit autonomního AI agenta jediným promptem za pouhých 15 minut. Platforma výrazně snižuje technickou bariéru pro tvorbu decentralizovaných AI aplikací. cryptobriefing.com
Generativní AI tvoří obsah – text, obrázky, kód nebo audio – jako odpověď na zadaný prompt. Agentní AI naproti tomu samostatně plní úkoly a dosahuje cílů, aniž by vyžadovala průběžné instrukce od uživatele. hostinger.com
Firemní AI už běží v produkci, ale architektura, datová strategie a správa dat stále nestačí tempu vývoje. Průvodce mapuje, jak se AI systémy budují a nasazují v praxi. mshale.com
Firemní AI již funguje v produkčním prostředí, avšak architektura systémů, datová strategie a řízení za ní stále zaostávají. Průvodce přehledně popisuje, jak se AI řešení navrhují, budují a spravují v reálném provozu. snowflake.com
Microsoft plánuje do srpna 2026 sloučit spotřebitelskou a podnikovou verzi AI chatbota Copilot do jedné super aplikace. Krok má zvýšit laťku AI nástrojů napříč všemi segmenty trhu. cryptobriefing.com
Microsoft zdražil firemní a podnikové plány Microsoft 365 až o 43 % a přidal do nich AI funkce jako Copilot a Security Copilot. Změna zásadně ovlivní rozpočty IT oddělení po celém světě. msn.com
Lidé s nápady na aplikace naráželi na technické bariéry – to se ale mění díky AI nástrojům typu Copilot. Vývoj vlastních řešení je dnes dostupný i bez hlubokých programátorských znalostí. goodmenproject.com
ASUS na akci ISTE+ASCD 2026 představil kompletní ekosystém AI zařízení pro vzdělávání poháněných procesory Intel. Nabídka zahrnuje odolné laptopy i stolní počítače s podporou Copilot Plus. simplywall.st
Zahrnutí AI a bezpečnostních funkcí přímo do základních SaaS licencí mění způsob, jakým firmy počítají náklady na uživatele. IT a AI týmy musí přehodnotit dosavadní nákupní strategie. letsdatascience.com
Microsoft chystá na srpen 2026 sloučení spotřebitelských a firemních nástrojů Copilot do jediné sjednocené aplikace. Interní memo zároveň odhaluje rušení funkcí jako Copilot Podcasts, což naznačuje problémy s placeným přijetím služby. techtimes.com
Google zpřístupnil personalizované generování obrázků v Gemini zdarma pro způsobilé americké uživatele. Funkce Personal Intelligence a Nano Banana využívají uživatelská data k vytváření personalizovaných vizuálů. techmymoney.com
Platit zvlášť za generování obrázků, videa i audia přestalo dávat ekonomický smysl – jen samotná předplatná vyjdou na stovky dolarů měsíčně. Všechno pod jednou střechou se stává novým standardem. pctechmag.com
OpenAI chystá ukončení provozu Sory, na trhu ale existuje řada jiných nástrojů pro generování AI videa. Ne všechny jsou ovšem zdarma. mashable.com
Nově vydaný model Nano Banana 2 Lite vygeneroval obrázek k oslavě 250. výročí vzniku USA. Týdenní přehled shrnuje nejvýznamnější novinky ze světa AI. patmcguinness.substack.com
Nejnovější recenze CapCut Video Studio ukazuje, že AI video v roce 2026 spolehlivě poslouží pro tvorbu testovacích reklamních konceptů, storyboardů a variant pro sociální sítě. Nástroj získal hodnocení 8,1/10, avšak lidský vkus a kreativitu stále plně nenahradí. wyomingnews.com
Model od MiniMax si získává tvůrce obsahu díky špičkové fyzikální simulaci, vysoké rychlosti generování a příznivé ceně. Červencová recenze 2026 hodnotí, proč se Hailuo řadí mezi přední AI video nástroje. mycarrollcountynews.com
Japonský vývojový tým představil humanoidního AI robota vybaveného technologií rozpoznávání gest, kterou označil za světový unikát. Robot svůj průlomový systém předvedl během studiové demonstrace. newsonjapan.com
BMW nasadilo humanoidní roboty od Figure AI ve svém závodě v Spartanburgu po 11měsíčním testování. Během něj roboti pomohli vyrobit přes 30 000 vozů X3 a přemístili 90 000 dílů. cryptobriefing.com
BMW Group oznámilo 25. června 2026, že humanoidní roboty Figure 03 zahájí provoz v oblasti logistického sekvenování v závodě Plant Spartanburg. Jde o rozšíření spolupráce s firmou Figure po úspěšné pilotní fázi. letsdatascience.com
Největší světová konference o ML se poprvé v 43leté historii International Conference on Machine Learning koná v Soulu v Jižní Koreji. Letošní ročník láme rekordy v počtu příspěvků, přičemž dominantním tématem je agentní AI – systémy schopné samostatného rozhodování a jednání. Enormní nárůst submitted prací zároveň výrazně zatěžuje proces peer review. techtimes.com
Anthropic uzavřel investiční kolo Series H ve výši 65 miliard dolarů při celkovém ocenění 965 miliard dolarů. Tím se firma vyšvihla na vrchol žebříčku v rozjitřeném závodě o AI financování. yellow.com
Mistral AI nabízí některé open source AI modely a od svého vzniku v roce 2023 získal značné financování. Ambicí společnosti je zpřístupnit špičkové AI co nejširšímu publiku. techcrunch.com
Londýnská AI hlasová společnost ElevenLabs vede předběžná jednání s investory o prodeji sekundárních akcií, která by firmu ocenila na přibližně 22 miliard dolarů. Jde o dramatický nárůst oproti předchozímu kolu financování před pouhými pěti měsíci. techfundingnews.com
Broadcom a OpenAI odhalili vlastní AI čip s názvem 'Jalapeño', navržený pro inferenci velkých LLM modelů. Partnerství je součástí ambiciózního projektu s výkonem 10 gigawattů. msn.com
Micron spustil rozšíření své výrobní haly v Japonsku, kde bude v masovém měřítku vyrábět špičkové polovodiče pro generativní AI a další aplikace. Investice dosahuje výše 9,3 miliardy dolarů. benzinga.com
Čínská firma Dongfang Suanxin hledá cestu kolem amerických exportních kontrol pomocí technologie 3D stackingu čipů. V čele společnosti stojí Wei Shaojun, který je zároveň viceprezidentem Čínské asociace polovodičového průmyslu. scmp.com