Pyramida DIKW je poměrně známý koncept, který popisuje hierarchii zpracování dat a porozumění jim. DIKW je zkratka z počátečních slov Data (data), Information (informace), Knowledge (znalost) a Wisdom (moudrost). Ačkoliv se pojem používá především v řízení informací a znalostním inženýrství, výsledky slouží pro rozhodování na taktické i strategické úrovni organizace.

DIKW: Data
Vysvětleme si nejprve jednotlivá slova. Data jsou základnou pyramidy a představují surová, nezpracovaná fakta či symboly bez kontextu (např. čísla, obrázky). Sama o sobě nejsou užitečná, dokud je někdo řádně neinterpretuje. Je to tedy polotovar.
Příklad (surová data): „Teplota = 15 °C“, „Vlhkost = 60 %“, „Rychlost větru = 5 km/h“.
Data mohou být strukturovaná (tabulky, čísla) i nestrukturovaná (text, obrázky, video).
DIKW: Informace
Druhou úrovní pyramidy jsou informace. Vznikají organizací, strukturalizací a interpretováním dat tak, že získáváte význam a přiřazujete kontext. Jde o základní vyhodnocení poskytnutých dat.
Informace mají vyšší hodnotu než data (nicméně bez dat není informací).
Příklad, pokračování (dodáváme kontext a vyhodnocení dat): Dnes je venku 15 °C, vlhkost vzduchu je 60 % a fouká slabý vítr.
DIKW: Znalost
Znalost vzniká analýzou informací a aplikací získaných výsledků k řešení problémů, rozhodování nebo pochopení širších souvislostí. Výstupem analýzy bývají typicky nalezené či pochopené vzorce, vztahy a souvislosti mezi informacemi (např. vzorce chování zákazníků).
Díky znalosti dokážeme aplikovat informace na praktickou situaci.
Příklad, pokračování (poskytneme vhodné alternativy pro rozhodování): Uvedená kombinace teploty a vlhkosti znamená, že dnes je chladnější den, ale příjemný na procházku nebo svižnější projížďku na kole.
DIKW: Moudrost
Moudrost využíváme k efektivnímu rozhodováním a řešení problémů, která mají praktický dopad. Představuje schopnost vědět, jak se na základě znalostí zachovat, a to nejen na základě znalostí jako takových, ale i dalších faktorů, jako je např. etika či intuice. Stejně tak obsahuje schopnost vidět důsledky výsledného rozhodnutí či řešení.
Příklad, pokračování (doporučení): Vzhledem k tomu, že počasí je chladnější, je vhodné vzít si na procházku triko, mikinu a lehkou bundu či na kolo tři tenčí vrstvy prádla. Když to neudělají, mohou onemocnět (a tedy muset zůstat doma, a tedy…).
Příklady DIKW
Příklad 1: Marketingové kampaně

Představte si, že Vám přišla SMS s marketingovou kampaní slibující 15% slevu na nákup v kavárně, kolem které pravidelně chodíte, ale ještě jste v ní nebyli. Jak je možné, že „někdo“ ví, kudy chodíte, a ještě k tomu pravidelně?
Data
Mobilní operátor sbírá (nejen) data o pohybu mobilních telefonů (např. GPS souřadnice, ID telefonu, časové značky apod.). Tato data sama o sobě nemají význam.
Informace
Váš telefon se každý pracovní den mezi 8:00-8:15 nachází v blízkosti uvedené kavárny na trase do práce. Jedná se o výstup analýzy dat, který má smysl v marketingu.
Znalost
Analýzou pohybových vzorců lze identifikovat Vaše pravidelné trasy a Vaše návyky (pravidelně procházíte kolem kavárny, ale nevstupujete do ní, do jiných kaváren ale chodíte). Gratuluji, právě jste se stali potenciálním zákazníkem zmíněné kavárny, což umožňuje cílený marketing.
Moudrost
Operátor by měl využívat lokalizační data etickým způsobem, získat Váš explicitní souhlas a nabízet skutečnou hodnotu. Vy jakožto zákazník byste měli porozumět tomu, jaká data o Vás operátor sbírá, jak to využívá a jaké to má důsledky pro Vaše soukromí. Díky tomu se můžete rozhodnout, které služby budete využívat a jaká oprávnění aplikacím na telefonu udělíte.
Příklad 2: Určení výše pojistného

Některé pojišťovny nabízejí slevu na povinném ručení a havarijním pojištění na základě toho, jakým způsobem jezdíte.
Data
Speciální zařízení v autech sbírá surová data o jízdě, jako je rychlost, zrychlení, brzdění, čas, poloha, počet najetých kilometrů a další. Opět, tato data jsou nezpracovaná a sama o sobě nemají žádný význam.
Informace
Analýzou dat lze např. zjistit, že:
- Řidič pravidelně jezdí rychlostí v souladu s povolenými limity.
- Řidič často prudce brzdí a zrychluje.
- Řidič nejčastěji jezdí na krátké vzdálenosti ve městě během dopravní špičky.
Tyto informace vyhodnocují jízdní chování.
Znalost
Určení stylu jízdy a rizikovosti řidiče. Řidič, který jezdí plynule, bez prudkého brzdění a zrychlování, je vyhodnocen jako nízce rizikový. Řidič, který často překračuje rychlostní limity a prudce brzdí, je označen jako vysoce rizikový. Tato znalost slouží k přizpůsobení pojistných podmínek konkrétnímu řidiči.
Moudrost
Pojišťovna by měla tato data a znalosti využívat eticky, transparentně a spravedlivě. Měla by řidiče motivovat k bezpečnější jízdě, například nabídkou slevy za nízkorizikové chování. Řidič by měl chápat, že jeho údaje mohou být použity nejen pro jeho výhody (např. sleva), ale mohou mít i důsledky (např. vyšší pojistné při rizikové jízdě). Na základě tohoto pochopení se může rozhodnout, zda s takovým monitorováním souhlasí.
Poznámka: Zlé jazyky tvrdí, že v České republice by byla moudrost tento typ pojištění nezavádět, protože by ho nikdo nechtěl. Přesto ho již některé pojišťovny mají.
Příklad 3: Tréninky a tréninkové plány

Pokud máte potřebu mít na sobě spousty senzorů a sledovat se (případně své sportovní výkony), pak bude znát aplikace typu Strava, Garmin Connect a další. Jak použít pyramidu DIKW v tomto případě? Ukážu to na cyklistice, jediném sportu, který mi dává smysl (a plně respektuji, že vy dáte raději přednost třeba jízdě na kole nebo vyjížďce na bicyklu).
Data
Na kole i na sobě můžete mít speciální senzory, které sbírají surová data během jízdy, např.:
- výkon ve wattech (měřený wattmetrem),
- kadence šlapání (počet otáček za minutu),
- aktuální rychlost (km/h),
- srdeční tep (údery za minutu),
- nadmořská výška (m.n.m.),
- GPS souřadnice,
- teplota okolí,
- čas strávený v jednotlivých zónách výkonu/tepové frekvence.
Opět a znovu, tato data jsou sama o sobě jen čísla bez kontextu, a tedy bez přímé využitelnosti.
Informace
Informace získáme typicky po dokončení jízdy analýzou dostupných dat, např:
- Průměrný výkon během tréninku byl 230 wattů.
- Maximální výkon během sprintu dosáhl 850 wattů.
- Srdeční tep se 65 % času držel v aerobní zóně (130-150 tepů/min).
- Cyklista strávil 20 minut ve stoupání s průměrným sklonem 6 %.
- Průměrná kadence byla 85 otáček za minutu.
- Normalizovaný výkon (NP) byl 245 wattů, což naznačuje variabilitu úsilí.

To jsou věci, které právě např. Strava ukazuje. Tady však většina amatérských sportovců končí. Jsou rádi, že mají nějaké grafy, obrázky, čísla. Jenže znalost může dokázat přinést větší užitek než chvilková radost typu „Jo! Dalších 100 km!“
Znalost
Analýzou informací z více jízd a jejich porovnáním můžeme získat zajímavé výsledky:
- Cyklistovi klesá výkon při delších stoupáních nad 20 minut.
- Při kadenci pod 80 otáček za minutu dochází k výraznému nárůstu srdeční frekvence.
- Poměr výkonu k hmotnosti (W/kg) je výrazně nižší než u cyklistů stejné výkonnostní kategorie.
- Schopnost zotavení po intenzivních intervalech se postupně zlepšuje.
- Určit funkční prahový výkon (FTP) cyklisty na 245 wattů.
- Pochopit, že cyklista má dobré sprinterské schopnosti, ale nedostatečnou vytrvalost.
Tyto znalosti už identifikují vzorce, silné a slabé stránky a umožňují porozumět výkonnosti cyklisty v širším kontextu. To je vlastně první krok k tomu, abychom mohli zlepšit své výlety na kole.
Moudrost
Na základě znalostí můžeme cyklistovy sestavit či změnit tréninkový plán s ohledem na jeho cíle, např.:
- Personalizovaný tréninkový plán zaměřený na rozvoj aerobní kapacity pomocí delších intervalů v cílových zónách.
- Zařadit specifická cvičení na zvýšení kadence pro zlepšení efektivity šlapání.
- Upravit stravu a složení tréninku pro zlepšení poměru výkonu k hmotnosti.
- Zahrnout dostatečný odpočinek a regeneraci pro prevenci přetrénování.
- Přizpůsobit plán mentálním preferencím cyklisty, aby trénink byl udržitelný z dlouhodobého hlediska.
Moudrost zde znamená nejen optimální tréninkový plán založený na datech, ale i pochopení, jak tento plán integrovat do života cyklisty (jinými slovy je zde velmi silné zaměření na kontext). Zahrnuje i etické aspekty, jako je respektování zdraví cyklisty nad krátkodobými výkonnostními cíli a vyvážení tréninkových ambicí s osobním životem.
Kvalitní trenér využívající moudrost nebude jen slepě následovat data, ale bude tento kontext zohledňovat. Pochopí například, kdy je vhodné zařadit náročnější trénink a kdy naopak nařídí odpočinek, i když data mohou naznačovat opak.
Kde se DIKW pyramida vzala?

Pokud je Vám blízká poezie T. S. Eliota, tak určitě budete znát jeho báseň The Rock, kde mj. píše:
Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?
Každopádně T. S. Eliot nepracoval s konceptem dat, informací, znalostí a moudrosti jako s formální teorií nebo modelem. Byl to výborný básník a troufám si tvrdit, že ve své době měl na svém telefonu možnost sledování polohy zakázanou a věrnostní aplikaci neměl nainstalovanou ani jednu.
Pyramida DIKW se objevila až později, přičemž autorství je nejasné. Při podrobnějším zkoumání jistě najdete jména jako Michael Polanyi (zkoumal, jak lidé přecházejí od informací ke znalostem) či Zeno B. Miller (použil princip DIKW, aniž by jej takto explicitně pojmenoval). Za formálního autora je považován Russell Ackoff, který v textu From Data to Wisdom vysvětlil přerod dat na moudrost.
Důležité však je, že nejde o techniku, kterou by si někdo patentoval a my ji nemohli bez řádných poplatků použít.
Má smysl DIKW pyramidu používat?

Člověk, který se v oblasti velkých dat, datových skladů, tržišť a dalších pohybuje, by rozdíly znát měl. Minimálně sám pro sebe by si v tom pořádek měl mít už jenom proto, že business v tom nerozlišuje. Pro business jsou všechno data (<sarkasmus>a proto máme informační systémy, na rozdíl od datových skladů</sarkasmus>). Když bude umět rozlišovat mezi vrstvami DIKW pyramidy, dokáže lépe pro zvolenou vrstvu použít vhodné techniky pro analýzy a zpracování.
Na druhou stranu, ani pyramida DIKW není stoprocentní. Mezi vrstvami nejsou jasné hranice, ne vždy je zřejmý přerod informací na znalosti. Pyramidě je i vyčítán chybějící důraz na iterativní proces učení a nezohledňování komplexnějších iterací mezi úrovněmi.
Nevýhodou může být i kulturní a kontextuální relativita (co funguje v jedné zemi, nemusí fungovat v jiné). Stejně tak se špatně zohledňují implicitní znalosti (implicitní, též tacit znalosti jsou ty znalosti, které máme „v hlavě“, ale neumíme je snadno formalizovat – typické u expertů.).
Asi nejvýraznějším kritikem DIKW je David Weinberger, který pyramidu v dnešní době považuje za zastaralý model (znalosti jsou nyní více propojené, síťové a méně hierarchické), viz např. jeho článek The Problem with the Data-Information-Knowledge-Wisdom Hierarchy.
Co tedy s tím? Pro mě osobně je DIKW neformální technika, která mi pomáhá uvědomit si, kam zařadit to, co jsem zjistil, a jak s tím pracovat. Pro data budu jistě používat něco jiného než např. pro hledání vzorců chování. V dokumentech či při hovorech s businessem však na lpění na přesném používání pojmů netrvám.
Rychlý přehled částí DIKW místo závěru
Data
- Jsou objektivní (představují nezpracovaná fakta, ovšem i při sběru může docházet ke zkreslení vinou způsobu sběru, viz např. výběrové zkreslení).
- Nemají význam (nejsou zasazena v kontextu).
- Nejsou zpracovaná (je to surový materiál).
- Nechají se kvantifikovat.
- Můžeme jimi být zahlceni.
Informace
- Měly by být objektivní (pozor na subjektivní zkreslení při interpretaci).
- Mají význam (protože jsou zasazena do kontextu).
- Jsou zpracovaná (tj. např. organizovaná, analyzována, interpretována).
- Nechají se kvantifikovat.
- Můžeme být jimi zahlceni.
- Návodné otázky: Co se děje? Co to znamená?
Znalost
- Jsou subjektivní (vycházejí z pochopení a zkušeností jednotlivce či skupiny, mohou zahrnovat i intuici).
- Mají význam pro konkrétní situaci (v daném kontextu).
- Jsou zpracovaná a pochopena.
- Nelze ji kvantifikovat.
- Znalostmi se můžeme zahltit (už to ale bývá o maličko těžší a méně časté než u informací a dat).
- Návodné otázky: Proč se to děje? Jak se to děje?
Moudrost
- Jsou subjektivní (závisí na hodnotách, zkušenostech, intuici a úsudku).
- Má význam nad rámec daného kontextu (zahrnuje širší pochopení dlouhodobých důsledků).
- Zahrnuje etické a hodnotové rozhodování.
- Nelze ji kvantifikovat (neexistuje metrika moudrosti).
- Nemůžeme jí být zahlceni.
- Návodné otázky: Jak bych se měl chovat? Co mám udělat?
Perlička na závěr
Zjednodušeně řečeno, anglická slova data, information, knowledge ani wisdom nemají množné číslo, jsou považována za nepočitatelná podstatná jména.
Přesněji: data sama o sobě je množné číslo (z latinského datum, tj. jeden údaj), v moderní angličtině i v té technické se však používá jednotné číslo: The data is accurate. V tradiční angličtině bychom použili The data are accurate.
Ostatní tři pojmy jsou už však plnohodnotně nepočitatelné. Proto se v literatuře setkáte v případě potřeby kvantifikace se spojeními jako „piece(s) of information“, „area(s) of knowledge“ apod.
Buďte první kdo přidá komentář