Orchestrátor není Claude
Hned v druhý den jsem narazil na zásadní architekturu rozhodnutí: orchestrátor musí být oddělený od modelu, který kóduje. Claude (nebo jakýkoli jiný jazykový model) je nástroj orchestrátoru — ne orchestrátor samotný.
Orchestrátor je logická vrstva, která drží stav projektu, plánuje kroky, volí správný model pro konkrétní úkol a kontroluje výsledky. V praxi to znamená, že orchestrátor může přepnout z Claude na jiný model bez toho, aby se změnilo cokoliv v pracovním procesu.
Toto rozhodnutí se ukázalo jako klíčové ve čtvrtém dni — ale to předbíhám.
Fáze 0: než agent začne kódovat
Každý pracovní cyklus začíná fází 0. Agent nepřejde rovnou ke kódu — nejdříve si přečte kontext: relevantní soubory, existující testy, architektonická rozhodnutí. Teprve pak navrhne plán.
Tato fáze je drahá na tokeny, ale levná na chyby. Agent, který přeskočí fázi 0 a rovnou píše kód, vytváří věci, které nerespektují existující konvence. Čištění je pak dražší než samotná fáze 0.
15 minut AI, 45 minut člověk
Reálný poměr druhého dne byl překvapující: agent aktivně pracoval zhruba 15 minut z každé hodiny. Zbytek času jsem strávil já — revizí výstupu, rozhodnutími o architektuře, psaním kontextu pro další krok.
To není selhání agenta. Je to správné rozdělení práce. Agent je rychlý na implementaci konkrétních kroků — vzory, boilerplate, transformace dat. Pomalý je na rozhodnutí, která vyžadují obchodní kontext nebo pohled na celou architekturu. Tam je člověk nenahraditelný.
Pokud počítáte produktivitu, nepočítejte jen čas agenta. Počítejte celkový čas na featur — a ten byl výrazně nižší než bez AI.
Git jako kontrolní bod
Druhý den jsem zavedl pravidlo: každý dokončený krok agenta = commit. Ne na konci dne, ne po dokončení featury — po každém logickém bloku práce.
Důvod je prostý: agent může šlápnout vedle. S granulárními commity je rollback triviální. Bez nich se vracíte k ručnímu procházení diffu a přemýšlíte, co vlastně agent změnil.
Kompletní repozitář projektu je k dispozici na: https://lnkd.in/dutnJmBQ
Co přineslo validaci
Na konci každého pracovního cyklu agent spustil sadu testů. Ne kompletní test suite — to by trvalo příliš dlouho. Cílené testy pokrývající části kódu, které právě upravil.
Výsledek: tři z pěti cyklů prošly napoprvé. Dva vyžadovaly opravu. V obou případech agent sám identifikoval problém a opravil ho bez mé intervence. Tohle je moment, kdy agentní smyčka začíná dávat smysl.
Chcete vidět, jak jdou automatizovat firemní procesy? Domluvte si konzultaci — naše řešení začíná tam, kde vibe-coding končí.
V dalším díle
Den 3 přinese čísla, která vás možná překvapí: kolik agentní AI vývoj skutečně stojí a jak to srovnat se seniorním vývojářem.