Přejdi na obsah Přejdi na navigaci

ÚvodBlogInformační evoluce

Informační evoluce

V roce 1966 formuloval americký psycholog Abraham Maslow Zákon nástroje: „Pokud je jediným nástrojem, který máte, kladivo, svádí to považovat vše za hřebík“. Pro řadu profesionálů z oboru Business Intelligence je univerzálním kladivem datový sklad a reportingové aplikace, pro většinu „bežných“ uživatelů zase Microsoft Excel. Pravda je jako obvykle někde mezi. Vybudovat datově řízenou firmu by měl být evoluční, spíše než revoluční, proces a konečné moderní řešení bude často obsahovat celou řadu komponent.

Evoluce

Evoluční kroky

Plnění excelů

Automatizace plnění Excelů

 

Prvním evolučním krokem může být automatizace plnění Excelů, které dosud bylo potřeba vytvářet ručně. Excely je možné pomocí PowerPivot, PowerQuery a dalších technik připojit přímo k databázím informačních systémů a automaticky načítat až miliony řádků dat. Ze systémů, k jejichž databázím se přímo připojit nelze, bývá možné automaticky generovat extrakty a teprve ty k plnění Excelů použít. Nad systémy, v jejichž databázích se uživatelé nevyznají, je zase možné připravit srozumitelnou vrstvu databázových pohledů a teprve tu uživatelům zpřístupnit. V případě nízkého počtu informačních systémů a menšího objemu dat může být sada automaticky plněných Excelů jediným Business Intelligence řešením, které firma ve skutečnosti potřebuje. Časová náročnost implementace přitom znamená maximálně jednotky měsíců.

DWH

Data lake

 

Pokud je informačních systémů obsahujících zajímavá data hodně, obsahují desítky milionů (až stovky miliard) záznamů, nebo chceme pracovat i nestrukturovanými daty, nastává čas na druhý evoluční krok, kterým může být vytvoření data lake. Data lake je úložiště, do které se pravidelně v nezměněné formě automaticky nahrávají data ze všech systémů společnosti. Excely pak stačí z původních systémů přepojit k data lake a nechat spojení dat a náročnější výpočty na něm. Data lake může opět vzniknout v řádu jednotek měsíců a poskytovat data nejen Excelům, ale v dalším kroku hlavně pokročilejším reportingovým aplikacím. V dnešní době většina z nich obsahuje nějakou formu integrované in-memory databáze (Power BI, QlikSense, Tableau..) a ta u menších řešení může zcela postačovat i pro skvělé Business Intelligence řešení bez datového skladu.

Lake House

Lake house

 

Pokud jsme vybudovali data lake, ale zjistili jsme, že je navíc potřeba sledovat historii dat, kterou informační systémy neukládají, složitě integrovat data z různých systémů (často například několik zdrojů klientů), provádět komplexní operace (například alokace nákladů), nebo data optimalizovat pro rychlou analýzu a reporting, můžeme vybranou podmnožinu dat z data lake integrovat do další vrstvy a vytvořit tak lake house. Ten se pak z pohledu uživatelů chová jako klasický datový sklad nebo data mart a nabízí jim předzpracovaná data ve srozumitelné podobě. Lake house můžeme opět budovat postupně – pro data, která v něm ještě nejsou, si uživatelé stále mohou chodit do data lake.

DWH model

Datový sklad

 

Pokud od začátku víme, že platí požadavky zmíněné výše, data máme v objemech maximálně desítek terabytů a nedává byznysový smysl pracovat s nestrukturovanými daty, můžeme budování data lake a lake house nahradit vybudováním datového skladu. Ten bychom ale měli stavět agilním způsobem po jednotlivých byznysových oblastech tak, aby co nejdříve sloužil uživatelům – první užitečné výsledky by měly být k dispozici v řádu jednotek měsíců, nikoliv let, jak se v případě některých společností děje.

reportingové nástroje

Reportingové nástroje

 

Kdykoliv v průběhu výše popsaného procesu můžeme z Excelů minimálně částečně přejít na pokročilejší reportingové technologie (např. již zmíněné Power BI, QlikSense, Tibco Spotfire, Tableau a další). Pokud máme relativně málo dat (jednotky milionů záznamů), nepotřebujeme je složitě čistit, integrovat a historizovat, mohou tyto nástroje v menších firmách data lake, lake house i datový sklad zcela nahradit. I reportingové nástroje lze implementovat evolučně – nejdříve nad zdrojovými systémy, pak je přepnout na data lake, lake house nebo datový sklad, podle potřeby. Reportingové nástroje dnes umožňují jak vývoj statických, automaticky distribuovaných reportů, tak i jednoduchou tvorbu analýz uživateli bez nutnosti znalosti programování.

data science

Data science

 

V okamžiku, kdy máme jednoduše k dispozici data a pokryté základní reportingové a analytické potřeby, můžeme přistoupit k další a aktuálně nejpokročilejší fázi práce s daty - aplikování pokročilých statistických a data miningových algoritmů k tomu, abychom v nich hledali informace, které na první pohled nejsou patrné. Může jít například o predikci poruch výrobních zařízení na základě dat ze senzorů výrobních linek, identifikaci klientů, u kterých je nejvyšší šance na prodej dalších služeb a produktů, analýzu nákupního koše, optimalizaci logistických procesů, personifikovaný marketing, analýzu rizik a další oblasti.

BI v cloudu

Business Intelligence v cloudu

 

Masový rozmach cloudových služeb možnosti informační evoluce dále akceleruje. Již nemusíme složitě vybírat hardware, instalovat, konfigurovat a spravovat servery a všechny potřebné aplikace. Cloudové služby můžeme v režimu SAAS (software jako služba) začít využívat prakticky okamžitě a vybudovat pomocí nich kteroukoliv nebo všechny z výše popsaných komponent. Platformy jako Microsoft Azure nebo Amazon Web Services nám poskytnou jak potřebné databáze, tak i nástroje pro datovou integraci, reporting a data science. Případně můžeme využít alternativních SAAS nástrojů přímo  specializovaných na Business Intelligence, jako je Keboola nebo Alteryx.

Vzdělávání

Vzdělávání

 

Hodnota, jakou je možné z jakéhokoliv Business Intelligence řešení dostat, nakonec vždy z největší míry závisí na lidech, kteří jej vyvíjejí a na samotných uživatelích. Obě skupiny by se měly neustále vzdělávat – ta první v konceptech a technologiích, ta druhá v analytickém myšlení a identifikaci užitečných informací, které lze z dat získat. Kromě různých externích školení by se měli vzájemně vzdělávat i lidé uvnitř firmy, sdílet své znalosti a zkušenosti a vybudovat postupně akční komunitu datových nadšenců.

 

Závěr

Osobně jsem přesvědčený, že úroveň informační kultury firmy nezáleží na tom, jaký software mají uživatelé nakoupený, nebo na existenci či absenci datového skladu. Důležité je pouze to, jaké informace je firma ze svých dat schopná získat a využít pro své řízení a kolik jí to stojí úsilí. Pokud tedy po kterékoliv z evolučních fází zjistíte, že z dat celkem snadno získáváte maximum.. gratuluji, máte skvělé Business Intelligence řešení vybudované s nejnižšími možnými náklady a k dalšímu evolučnímu kroku nemusíte přistoupit vůbec, nebo kdykoliv ve vzdálené budoucnosti, pokud taková potřeba nastane.

Pokud byste proces informační evoluce chtěli odstartovat ve vaší firmě a nevíte jak začít, neváhejte se nám ozvat, rádi vám nezávazně poradíme a ukážeme, jak to v jiných společnostech funguje v praxi.

 

autor: Jakub Holubec

Jakub

 

Zpět na výpis rubriky