Konferenci zahájil research manager software, IDC CEMA, Mark Child přehledem rychlosti růstu objemu dat. V roce 2012 jsme vygenerovali celosvětově 2,27 ZB, v roce 2015 to má být 7,91 ZB a 2020 až 40 ZB. To odpovídá zhruba 247 GB dat na každou osobu na Zemi. Přitom 40 % informací potřebuje podle IDC nějaký druh ochrany.
Okdud se všechna data berou? Z firemních aplikací, webu, mobilních aplikací, sociálních sítí, SaaS, připojených zařízení, internetu věcí, digitálních bezpečnostních systémů, simulací při výzkumu a vývoji či z dopravních systémů.
Objem dat podle IDC roste 44x v porovnání s úložišti, jejichž kapacita roste jen 30x, což vytváří problém v efektivitě ukládání dat. Technologickým řešením jsou samozřejmě deduplikace a komprese, tiering, tenký provisioning, virtualizace apod.
Růstu datových objektů však podle IDC zcela neodpovídá navyšování personálních sil v IT. Navíc jim schází vědomosti, jak využívat analytický software, upozorňuje Mark Child.
Vysvětlil také odlišnost mezi velkými daty a tradičním business analytics – objem dat roste podstatně rychleji, big data pomáhají získat hodnotu i ze zcela nestrukturovaných a různě ukládaných dat, a to pokud možno v reálném čase.
Jaké jsou kategorie velkých dat?
IDC dělí datové zdroje velkých dat na procesní (transakční, tabulky, relační, metadata, provozní, strukturovaná, spravovaná, regulovaná, systémová), generovaná stroji (senzory, logy, strukturovaná, spolehlivá, rychlá, internet věcí) a generovaný lidmi (sociální sítě, multimédia, nestrukturovaná, neregulovaná, subjektivní, nemusí být spolehlivá, ale velmi přínosná, vyžadují standardizaci)
K čemu jsou zákazníkovi big data?
Celosvětový trh velkých dat se podle IDC loni pohyboval kolem 7 miliard dolarů. IDC tvrdí, že big data by měla sloužit především ke zvýšení obratu, zlepšení cash flow, snížení provozních nákladů, zvýšení produktivity zaměstnanců, zvýšení spokojenost nebo loajality zákazníků a zlepšení agilita firmy.
Z průzkumu IDC v regionu střední a východní Evropy vyplynulo, že firmy od zavedení big data očekávají především optimalizaci interního provozu, lepší analýzu zákazníků, správu finančních dat a analýzu ziskovosti.
Výzvy velkých dat
Hlavní výzvou big data z pohledu CIO jsou vysoké nároky na zvládnutí klasifikace a správy velkého objemu dat. V dnešním „novém prostředí“ mohou být hodnotná data schována v e-mailech, dokumentech, prezentacích či spreadsheetech.
Navíc to komplikuje nutnost extrakce dat před tím, než mohou být standardizována, říká Mark Child. Firmy také potřebují vytvořit týmy odborníků, kteří dokážou pracovat s velkými daty.
Hlavními požadavky na úspěšné zavedení big data jsou podle IDC použití kvalitních dat, ale také vedení firmy ve smyslu datově orientované organizace a rozhodování a ovlivňování procesů podle získaných informací.
Jak zavádět řešení pro velká data podle IDC
- Před zaváděním jakýchkoliv iniciativ v oblasti velkých dat si nastavte mety a cíle.
- Testujte a dělejte pilotní projekty (ne všechny uspějí) dokud nenaleznete správné nástroje a datové modely, které přinesou potřebnou hodnotu.
- Stále se posouvejte vpřed – až první iniciativa ve velkých datech přinese ovoce, budou ostatní ve firmě nakloněnější k vyřešení dalších výzev.
- Big data zahrnují komplexní technologie, ale jejich provádění není technologický problém – strategická rozhodnutí závisí na byznysu.
- Zapojte a vzdělávejte obchodní pracovníky, zapojte i IT a hledejte roli datového odborníka.
Jak zkrotit big data podle IBM
Jiří Slabý, business solution architect v IBM velká data popsal jako rozsáhlá, různorodá (strukturovaná i nestrukturovaná), v pohybu (rozhodování v co nejkratším čase) a nejasná (nejistá kvalita zpracovávaných dat).
Můžeme se na ně dívat jako na data interní vs. externí (sociální sítě, marketingové průzkumy, data bank či obchodnílů), analytická vs. v reálném čase, strukturovaná vs. nestrukturovaná a zákaznická vs. okolní.
Jak podle IBM analýza a využití velkých dat funguje, popisuje diagram níže. Vybraná data z transakčních systémů jdou do datových skladů a provozních datových úložišť, odsud jsou zpracovávána analytickými nástroji, které již dokážou zjistit buď hledané, nebo opakující se pravidla/závislost či vzory chování. Pokud s nimi spolu s daty z transakčních systémů dokážete pracovat v reálném čase, jde o big data analýzu.
Diagram: Fungování analýzy velkých dat
Zdroj: IBM
Z reálných použití velkých dat Jiří Slabý jako příklady uvedl marketing (zjišťování názorů zákazníků; analýzy externích zdrojů dat jako sociální média či diskuzní fóra), analýzu dat v kontaktních centrech (možnosti up-sellu/cross-sellu podle sdělení zákazníků), odhalování pojistných podvodů či prediktivní údržbu strojů ve výrobě (predikce možných následných dopadů aktuální chyby).
Zdroj: IDC, IBM, ChannelWorld