Vítejte u 37. dílu podcastu AI ta Krajta, kde se Prokop, Petr, Šimon a Pavol za podpory DX Heroes ponořili do hlubin moderního vývoje softwaru. Hlavním tématem této epizody je fenomén long-running agentů a otázka, která pálí každého technologického lídra: Kolik autonomních agentů dokáže jeden člověk efektivně spravovat, aniž by se zbláznil?
O čem byla řeč? Hlavní kapitoly epizody
- 0:04 – Úvod a novinky týdne
- 1:05 – Bezpečnostní hrozba jménem Moldbot
- 2:08 – Kimi 2.5: Čínský vyzyvatel s obrovským kontextem
- 3:23 – Cursor a standardizace AI „skills“
- 8:50 – Long Running Agenti: Týdenní vývoj prohlížeče
- 25:25 – Kontroverzní statement: 10 paralelních agentů na vývojáře?
- 33:04 – Realistický pohled na škálování v týmu
- 38:19 – Proč jsou metriky počtu řádků kódu u AI cestou do pekel
Hloubková analýza: Agenti, bezpečnost a efektivita
Od Cloudbota k Moldbotovi: Pozor na vaše API klíče
Prvním velkým tématem byl hype kolem nástroje Cloudbot (nově Moldbot). Přestože jde o fascinující „personal infrastructure“ ovládanou přes WhatsApp či Telegram, kluci varují před obrovským bezpečnostním rizikem. 1:05 – Šimon zmiňuje, že na internetu už existují tisíce veřejně přístupných instancí, které útočníkům doslova servírují API klíče majitelů.
Cursor a nová éra „Subagentů“
Populární editor Cursor přišel s podporou subagentů a dovedností (skills). 3:23 – Petr vysvětluje, že dochází ke standardizaci toho, jak AI přistupuje k externím nástrojům. Pokud už máte nastavené skilly pro Cloud Code, Cursor je dokáže využít. Cílem je, aby vývojář nemusel AI „vodit za ručičku“ u každého kroku, ale mohl mu přiřadit ucelenou roli (např. účetní mozek).
Long-running agenti: Realita vs. marketingový hype
Diskuse se stočila k experimentu Cursoru, kde nechali agenta běžet víc než týden, aby postavil prohlížeč od nuly. 8:50 – Petr však upozorňuje, že výsledek je sice funkční, ale kód o objemu 1,6 milionu řádků v Rustu je v podstatě „clusterfuck“, který si stejně natahal externí knihovny. Oproti tomu komunitní pokusy dosáhly podobného výsledku s pouhými 20 tisíci řádky díky lepší interakci člověka s AI (Human-in-the-loop).
Kolik agentů dokáže řídit jeden senior?
Nejkontroverznějším bodem epizody byl výrok Zaka Jacksona, který tvrdí, že by vyhodil každého, kdo neřídí alespoň 10 agentů paralelně. 25:25 – Hosté tento přístup rozebírají z pohledu kognitivní zátěže.
- Kognitivní limit: Člověk v pracovní paměti udrží cca 8 věcí. Řídit 10 agentů vyžaduje extrémně pokročilou „Agentic Experience“.
- Realita dneška: 33:04 – Pavol odhaduje, že v současnosti je realistické číslo spíše 0,3 agenta na seniora, pokud má jít o skutečně kvalitní a bezpečný kód.
Verifikační smyčky jsou základ
Aby long-running úkoly dávaly smysl, musí existovat přísné automatizované kontroly. 18:25 – Petr popisuje své workflow, kde nespoléhá jen na lintery, ale zapojuje separátního agenta, který kontroluje, zda vygenerované testy nejsou jen „bullshit“ pro formu, ale mají reálnou hodnotu.
Závěr
Éra autonomních agentů mění definici seniorního vývojáře na „manažera AI kolegů“. Důležité však není množství vygenerovaných řádků kódu (které lze snadno zneužít jako špatnou metriku), ale reálný dopad na produkt a adopci uživateli.
Kolik AI agentů už dnes zapojujete do svého workflow a věříte, že jeden člověk může efektivně řídit celý „digitální tým“? Napište nám do komentářů! Nezapomeňte odebírat podcast AI ta Krajta a sdílet tento článek dál. Podívejte se taky na další epizody aby vám neunikla žádná zajímavá informace.

Komentáre