Poznej datovou analýzu
V poslední době kolem sebe stále častěji můžeš slyšet slovo “data”, používané v různých kontextech. A to ať už jde o jejich ochranu či bezpečnost, jejich získávání nebo analýzu. Proč ale tento boom nastává zrovna dnes?
V poslední době kolem sebe stále častěji můžeš slyšet slovo “data”, používané v různých kontextech. A to ať už jde o jejich ochranu či bezpečnost, jejich získávání nebo analýzu. Proč ale tento boom nastává zrovna dnes?
Datový boom
Odpovědět bychom si mohli jedním slovem: technologie. Právě díky technologiím se dnes data získávají o mnohem jednodušeji. Nejjasněji to vidíme na online aktivitě. Každé kliknutí, stáhnutí, lajknutí a každé vyhledávané či napsané slovo za sebou zanechává stopu a firmy jsou ochotny zaplatit neuvěřitelné sumy, aby měli k těmto stopám, neboli datům, přístup. Navíc se díky stále klesajícím cenám paměťových úložišť a všudypřítomným cloudovým řešením stalo ukládání i většího množství dat dostupnou záležitostí.
Na co potřebují firmy data?
Získání dat je ale jen základním krokem a samo o sobě nemá žádnou výraznou hodnotu. Kvanta nasbíraných údajů zatím jen nečinně sedí v databázi, či v horším případě trčí v roztroušených spreadsheetových souborech. Na to, aby taková data začala mít pro firmu reálný přínos, musí být nápomocná při rozhodování a plánování. Mezi typické otázky manažerů při plánování budoucí strategie patří například: Kdo jsou naši zákazníci? Jak je nejlépe oslovíme? Který produkt propagovat? Jak se budou naše tržby vyvíjet příští rok?
Řešení jménem datový analytik
A právě v tuto chvíli přichází na řadu datový analytik, který z množství dat, které má k dispozici, začne dolovat cenné odpovědi. Data je třeba nejprve vyčistiť, což v praxi znamená nastavit správný formát, vymazání nepotřebného či nahrazení nekorektních záznamů. Následně je datový analytik začne prohledávat, otáčet, spojovat, nacházet v nich souvislosti a hlavně vytvářet modely, ze kterých vznikají predikce. Nakonec musí být také schopný svoje poznatky v co nejsrozumitelnější formě odprezentovat. Ovšem i to nejjednodušší číslo může mít ve finále velký význam a ušetřit firmě miliony.
Co je potřeba umět
Když už víme, proč se firmy bez datového analytika neobejdou, pojďme se zaměřit na to, co všechno ke své práci potřebuje umět. I když to pro mnohé nejspíše nezní lákavě, bez základních matematických a statistických znalostí se analytik neobejde. Nezoufej – na začátek si stačí zopakovat základní pojmy jako průměr, medián či odchylka. Dále je potřeba umět používat SQL databáze a vybrat si vhodný nástroj, ve kterém můžeme tyto poznatky aplikovat. Jedním z nejpoužívanějších nástrojů pro datovou analýzu je v současnosti Python. Navzdory tomu, že je to plnohodnotný programovací jazyk a nebyl primárně budovaný k statistickým a matematickým účelům, dokáže ostatním nástrojům hravě konkurovat. Má k dispozici vyspělé knihovny pokrývající všechno od základních datových operací (Numpy, Pandas, matplotlib…) až po machine learning (scikit-learn, NLTK…). Vzhledem k tomu, že se jedná o open source projekt, knihovny se neustále vyvíjejí a pokrývají tak nejnovější trendy a postupy datové analýzy.
Jak mám začít?
Pokud si chceš vyzkoušet datovou analýzu nanečisto, doporučujeme si na začátek stáhnout volně dostupný dataset, například na data.gov.cz, který se týká tvých koníčků. Pro analýzu je totiž důležité mít vedle technických a matematických znalostí i takzvanou domain knowledge, tedy pochopení problematiky, jejíž data analyzuješ. Pokud tě například baví sport, stáhni si výsledky tvého oblíbeného fotbalového týmu za poslední roky a zkus pomocí Pythonu najít nejsilnějšího soupeře, nejhodnotnějšího hráče či stadion, kde “zaručeně” vyhrává.
Pokud ti je Python zatím cizí, přihlas se do ENGETO Python Akademie, kde získáš potřebný programovací základ a zorientuješ se na praktických příkladech v možnostech tohoto jazyka. Navázat potom můžeš na specializovanou, job-ready Datovou Akademii, kde tě naučíme vše, co potřebuješ umět, abys získal práci datového analytika.
Kariéra v datové analytice?
Pokud jsi od přírody zvědavý, baví tě objevovat skryté informace a zároveň se nebojíš zabrousit i do techničtějších znalostí, datová analýza může být právě pro tebe. Jestli se rozhodneš věnovat se analýze profesionálně, můžeš s ní začít experimentovat už ve tvé současné práci (bez dat se dnes obejde jen málokdo) nebo koukat pod ruce datovým analytikům. Juniorských pozic je u datové analýzy dostatek, jelikož celé odvětví dlouhodobě roste. Pokud se rozhodneš pro pozici ve větším týmu, tvoje práce bude nejspíš specializovaná na něco konkrétního (např. nastavení databází, získávání dat, čištění, modeling, analýza, vizualizace). V menších firmách pak budeš mít šanci vyzkoušet si všechny tyto dílčí kroky.
Pusť se do toho!
Datová analýza je skutečně prací budoucnosti, protože množství dat neustále roste a počet specialistů, kteří s nimi umí pracovat, je dnes už nedostatečný. Navíc se jedná o skutečně různorodé a stále se vyvíjející odvětví, takže nikdy nebudeš mít pocit, že už se nemáš co dalšího učit a kam se posouvat. Pokud ještě váháš, dovolíme si dodat, že právě datová analýza je skvělým odrazovým můstkem do odvětví umělé inteligence.