Jak vás můžou jazykové modely zabít

V posledních týdnech v příspěvcích na LinkedIn neustále čtu, jak ten který jazykový model nefunguje, jak dává špatné odpovědi, jak halucinuje lépe než Jim Morrison ve svých nejlepších momentech. Lidé se loučí s modely od OpenAI (udělal jsem totéž) a přecházejí k Anthropicu (zkouším, ale moc mi nevyhovuje) nebo ke Googlu (aktuálně zkouším, ale je to peklo). Ale že by někoho mohly zabít?

Výchozí situace

Ačkoliv dost věcí v tomto článku píšu s nadsázkou, je zřejmé, že slepé následování rad od umělé inteligence může dost pošramotit zdraví. Můj text je vlastně popis vlastní zkušenosti.

Nejprve uvedu trochu kontextu: Od listopadu loňského roku přemýšlím o tom, že se koncem června zrubu na CINGLÉS DU VENTOUX. Vycházel jsem z toho, že když jsem za rok 2025 strávil skoro 500 hodin v sedle kola a vyšlapal v souhrnu 17krát Mount Everest, tak Mont Ventoux může být vhodný vrchol roku 2026.

Od ledna jsem tedy s AI (to bylo ještě s nejmodernějším modelem GPT od OpenAI) průběžně ladil tréninkový plán, výživu a další nesmysly s tím spojené. Jenže jeho odpovědi mi stále více a více připadaly stejně hodnotné jako koncert Rammstein přehrávaný v koupelně na plastových reprácích za dvě pětky, navíc napůl ponořených v umyvadle. Něco plechového a blbě ozvučeného z dálky sice zaznívalo, ale prostě to nebylo ono.

Tak jsem začal experimentovat s modely od Anthropicu (Claude) a posléze Googlu (Gemini). Jeden dotaz jsem dával všem třem nejlepším modelům a porovnával si odpovědi. V té době mi nejrozumnější připadal Gemini, a tak jsem postupně přestal používat ostatní a zůstal u tohoto „jediného“.

Gemini mi vyhodnocoval jednotlivé jízdy, říkal, co by šlo zlepšit, co naopak nedělat. Vše vypadalo růžověji než světlé zítřky režimu minulého. Jenže ouha. Jednoho dne jsem místo naplánované pětihodinovky slezl z kola už po dvou hodinách s celkem jasným výsledkem: přetrénovanost.

Hledání chyb

Nebudeme si nic nalhávat, byl jsem nas…štvanej jak brigadýr. Nadával jsem modelu, co to do mě hustil za nesmysly, nesnášel jsem ho, protože nesledoval historicky, co jsme si už povídali, nenáviděl jsem ho za to, že nezohledňoval ostatní znalosti a vědomosti, které přeci zcela prokazatelně „musí mít“.

Variabilita srdečního tepu (průměr a noc)

Jenže chyba byla na obou stranách. U modelu, že si nevyžádal všechna možná data (pokyny k tomu dostal), a u mě, že jsem mu ta data nevnucoval. Řešili jsme aktuální jízdu, řešili jsme další dny a týdny, ale jazykové modely potřebují historická data. Moje chyba byla, že jsem mu nedal ze Stravy export celého roku 2025 a že jsem ho nenutil zohledňovat to. Moje chyba byla, že jsem mu nedal exporty z Garminu, Withings, Whoopu a dalších bazmeků, které tak či onak měří tisíce nesmyslů. Vždyť přeci chytré hodinky hlídají každý prd, tak proč by si k nim (samozřejmě myšleno k datům) nemohl čuchnout i jazykový model?

A tak jsem si udělal exporty z kdečeho, co jsem měl po ruce, a odpověď modelu? Uvádím několik ukázek.

Jinými slovy: ač já sám na školeních říkám: „Nesmíte modelům naprosto nic věřit, ale musíte mít znalosti, abyste si vše ověřili,“ skončil jsem téměř doslova v pangejtu s nohama nahoře jako naprosto nezkušený začátečník.

Nový začátek

Moje trápení s jazykovými modely se tím posunulo o úroveň… nevím, zda výš, dál, nebo vedle, ale prostě jinam. Připravil jsem si jednak novou verzi asistenta (robota Gema) a jednak maximální automatizaci pravidelného stahování dat z měřáků a jejich nahrávání na Google Drive, aby je mohl Gemini model používat. A tady nastal další problém.

Vyrozuměl jsem, že si Gemini může (když to nastavím) brát data z Google Drive. Tak jsem to celé nastavil a data se tam pravidelně nahrávají. Jenže ani po dvoudenním boji jsem nedonutil Gemini model tato data používat. Jednou je vidí, pak je nevidí, pak vidí jen některá nebo to nečte celé. To pak vede k tomu, že dostávám např. následující odpovědi poté, co mu v míře vysoké frustrace vynadám:

Aktuálně to propojení vzdávám. Sice bych to mohl dávat do Google dokumentů (robot je občas vidí, ale nečte je celé), ale raději historii dávám do definice robota a aktuální záznamy vždy přiložím do chatu. Je to jistější. Buďme rádi, že dneska funguje z poloviny aspoň něco. Intuice a uživatelská přívětivost už jsou dávno zakázaným pojmem, funkčnost se jím brzy stane také.

Jak to skončí?

Osobně se domnívám, že na svého trenéra se brzo vykašlu. Jakmile bude venku tepleji, přestanu to celé řešit a budu si jezdit jako loni. Pocitově a na pohodu. Využiju pár věcí, co jsem se naučil, ale budu se držet toho jasného, co mi řekl model při mém selhání. Tedy že už Cinglés ujedu už dneska. Jen to holt bude náročnější.

A poučení? Člověk se poučí málokdy. Hodně jsem se naučil, hodně jsem poznal. Zabrousil jsem do oblastí, o kterých jsem dříve netušil. Poznal jsem spousty Z3P (Zkratek ze 3 Písmen), ujasnil si mnoho souvislostí, dozvěděl se o mnoha tématech. Ale že bych se poučil? Nevím. Možná přijde úplně jiná oblast, kde zase modelu skočím na špek a nechám se přizabít.

Tip na závěr

Pokud si povídáte v jednom chatu více dnů a je důležité rozlišovat dnes/zítra/včera či denní dobu, do pokynů můžete zadat např.:

Vždy se podívej na systémové datum a čas mé zprávy (timestamp) a použij ho jako kotvu. Pokud napíšu ‚dnes’, myslím datum odeslání dané zprávy. Jestliže napíšu ‚včera‘, myslím datum odeslání mínus 1 den. Pokud konverzace trvá více dní, ignoruj relativní pojmy z předchozích dní a přepočítej je na fixní kalendářní data. Vždy si v hlavě sestav chronologickou osu událostí podle dat, nikoliv podle pořadí zpráv, a ověřuj dny v týdnu. Totéž platí i pro čas. Pokud se budeme bavit dopoledne a budeme řešit např. jídlo, tak asi bude nejdříve oběd a až pak večeře.

Dovětek k tipu pro fajnšmekry: Je to složitější. Běžná webová rozhraní modelů časově přesný „timestamp“ (hodinu a minutu) často neodesílají a model si ho může domýšlet. Datum většinou zvládne bez problémů, ale pokud se bavíte dopoledne, je nejjistější mu denní dobu napsat rovnou: „Je úterý 10:00 dopoledne, dal jsem si svíčkovou se šesti a stále mám hlad.“

Článek vyšel i na LinkedIn.

Buďte první kdo přidá komentář

Napište komentář

Vaše e-mailová adresa nebude zveřejněna.


*