Svatý grál jménem datová analýza
Poznej obor datové analýzy a zjisti, na jakých pozicích se můžeš uplatnit a co musíš umět.
Za každým důležitým rozhodnutím hledej data. Grafy, reporty, trendy… Úkolem je dobře předpovědět chování cílové skupiny a díky tomu předběhnout konkurenci. Datová analýza se stává středobodem tohoto procesu – a zkušený datový specialista zase čím dál cennějším kolegou.
Data, data a zase data
V datech jsou uložené informace a právě informace jsou jednou z nejcennějších komodit dnešní doby. Množství generovaných dat využíváním nových technologií (používání sociálních sítí, odesílání e-mailů, online nakupování, sledování videí apod.) každým rokem rapidně roste.
Odhaduje se, že celkové množství vytvořených, zachycených, zkopírovaných a spotřebovaných dat globálně v roce 2020 dosáhlo 64,2 zettabytů. Předpověď pro rok 2025 odhaduje až 180 zettabytů. (Zdroj: Statista)
Podle nejnovějších statistik:
- Každý den uživatelé na internetu vytvoří 328,77 milionů terabajtů dat.
- Přibližně 53,72 % internetového datového provozu je vytvářeno prostřednictvím videí.
- Uživatelé na Twitteru denně sledují 2 miliardy videí.
- V roce 2024 se každý den odešle kolem 361 miliard e-mailů.
Datová analýza jako obor budoucnosti
Čím lépe dokáže firma analyzovat data, tím víc kvalitních informací získá a využije ke zlepšení svých služeb nebo produktů. Možná díky tomu jako první vyřeší nějaký zákaznický problém nebo dobře investuje. V každém případě bude o krok napřed – a to je nezbytná součást úspěchu.
Je pochopitelné, že firmy a další instituce chtějí sbírat čím dál víc dat a těžit z nich relevantní informace. To dnešní technologie umožňují. Problémem je však nedostatek odborníků, kteří nasbíraná data kvalitně zpracují a vyhodnotí. Ty nám totiž samy o sobě nic neřeknou. Ale takový datový analytik, to už je jiná. Je zodpovědný za podrobnou analýzu, návrh řešení daného problému nebo predikcí.
Paradoxem je, že řešení představuje i velké nebezpečí: špatně provedenou analýzu. Stačí málo a firma najednou pracuje s nerelevantními nebo nepravdivými informacemi a provádí chybná rozhodnutí, která zvyšují náklady a nepřinášejí výsledky.
Jak se tomu vyhnout? Logicky je potřeba někdo, kdo si umí poradit s daty – a tak se zvyšuje poptávka po lidech s odpovídajícími schopnostmi. Jenže experti se těžko hledají a udržet si je ve firmě je ještě větší oříšek.
Datová analýza = příslib žádané a dobře placené práce
Podle Světového ekonomického fóra – Future of Jobs 2023 – se odhaduje, že do roku 2027 vzroste poptávka po:
- specialistech na umělou inteligenci a strojové učení o 40 %,
- datových analyticích, vědcích, inženýrech, BI analyticích a dalších specialistech zaměřených na big data a databáze o 30–35 %.
Toto tvrzení podporuje i Americký Úřad pro statistku práce, podle jehož odhadů počet míst datových specialistů v letech 2022 až 2032 vzroste o 35 % (tedy mnohem rychleji než průměr).
Z reportu o trhu práce No Fluff Jobs z roku 2022 vyplývá, že nejvyšší platy v IT mají právě specialisté z oblasti Big Data. Firmy jim v zaměstnaneckém poměru nabízejí rozpětí 73 700 – 119 985 Kč. Na volné noze by si mohli přijít na 103 582 – 140 854 Kč hrubého.
Server Glassdoor uvádí, že si průměrný datový specialista v ČR přijde na 70 000 Kč měsíčně.
Nejnovější průzkum z roku 2024 – The Data Scientist Job Market in 2024 – znázorňuje výši výdělků datových specialistů v USA v následujícím grafu.
💸 Přečti si podrobné srovnání platů napříč IT oborem v článku: Kolik si vydělá ajťák v Česku? |
Datový křižák
Cesta k datové analýze je mnohem jednodušší než k vývoji softwaru (na druhou stranu cesta k vývoji SW může vést vícero cestami – jako třeba testování SW nebo kodérství UI). Pro získání první práce v oboru na pozici datového analytika klidně stačí půl roku intenzivního studia. Pro začátek musí člověk splňovat tři obecné předpoklady: mít motivaci, ochotu se učit a být připravený na časovou investici. Ještě je potřeba trochu angličtiny a umět se (běžně) domluvit s počítačem. To z datové analýzy dělá přístupnou oblast, která nevyžaduje žádné nadpřirozené schopnosti.
Po technické stránce je nutné znát základy SQL, protože je to nejpoužívanější dotazovací jazyk pro manipulaci s daty. Dál se hodí zkušenosti s VBA v Excelu, Tableau nebo znalosti určitých Python knihoven (třeba Pandas, Numpy nebo Matplotlib), které se naučíš i na našem Python kurzu. SQL je ale klíčem k datům. Se vším ostatním se člověk v práci postupně seznámí, když každý den řeší praktické úkoly.
Z toho vyplývá, že datový analytik by měl být silný v především v matematice a statistice. Kromě toho musí umět pracovat s databázemi, analyzovat a vizualizovat data.
Co datový analytik vlastně dělá?
Datový analytik převádí data do srozumitelné podoby. Dokáže získat informace ze shromážděných dat, ty dále analyzuje a používá k plánování strategického růstu. Využívá je pro podporu rozhodování (např. o směru vývoje produktu či služby).
Předkládá výsledky obchodníkům v podobě, které rozumí. Nedílnou součástí každodenní práce datového analytika je převádět analýzy do zpráv, grafických vizualizací a prezentací.
Zpracovávat data můžete na různých pozicích.
- Analytik začátečník může reportovat, tedy transformovat data do přehledných tabulek a grafů.
- Pokročilejší analytici pak využívají data k vyhodnocování matematických a statistických modelů, které představují nějaký problém.
- Specialisté se pak můžou úzce zaměřit například na zpracování velkých dat (Hadoop, Spark), jejich automatizaci nebo vizualizaci.
Možnosti pro uplatnění jsou prakticky neomezené. Finanční sektor, zdravotnictví nebo třeba lingvistika. Analýza dat se využívá skoro ve všech známých oborech a její nástroje jsou univerzální. Všechna zaměření a úrovně datových analytiků však spojuje odpovědnost za kvalitu zpracovaných dat. Analytik si vždy musí být jistý, že používá relevantní data k řešenému problému.
Další data science pozice – datový vědec a datový inženýr
Jak už jsme zmínili – možnosti uplatnění pro lidi se znalostí datové analýzy jsou prakticky neomezené a s tím souvisí i obrovské množství pozic v oboru data science.
Pojďme si posvítit na rozdíly mezi dalšími 2 nejrozšířenějšími pozicemi z hlediska potřebných znalostí a náplně práce:
- Datový věděc
- Datový inženýr
Datový analytik a datový vědec jsou příbuzné profese a mají mnoho společného. Obě se zabývají Business Intelligence (BI), liší se ovšem v používaných nástrojích a metodách.
Zatímco datoví analytici získávají výsledky s využitím dotazovacího jazyka SQL a nástrojů jako například Tableau nebo Power BI, datoví vědci používají zcela jiné metody, technologie a přístupy. Třeba JupyterLab, kde se připojují k datům, na nichž provádí výzkum nebo trenují datové modely.
Společné mají i to, že nepracují se surovými daty, častokrát k nim ani nemají přístup. Pracují v prostředí s již předzpracovanými daty, která pro ně připravuje datový inženýr. Ovšem datoví vědci mohou mít přístup k surovým datům, aby mohli provádět pokročilé analýzy a vytvářet modely strojového učení. V praxi ale často spolupracují právě s datovými inženýry.
Jedině datový inženýr totiž dokáže data uspořádat do použitelného formátu, se kterým následně mohou pracovat datoví vědci či analytici.
Datový vědec data interpretuje
Úkolem datového vědce je extrahovat informace ze surových dat a interpretovat je tak, aby našel odpovědi na různé otázky (například proč e-shop krachuje).
Musí ovládat nejen programovací jazyky (Python, SQL), ale také musí umět sestavovat reporty a jednat s vedením podniku. Měl by také znát Git rozšířený při vývoji softwaru a sledování změn v kódu, ale také nástroje pro strojové učení.
Může také vytvářet algoritmy schopné předpovídat budoucí vývoj. Díky tomu dokáže předvídat nadcházející trendy: spotřebitelské chování, nákupní zvyklosti, růst určitého odvětví a s ním související příležitosti a podobně.
Datový inženýr přezdívaný big data technik
Datový inženýr má oproti datovému vědci techničtější profil. Provádí analýzu dat prostřednictvím programů a následně přichází s prostředky, jak data využívat.
Má za úkol postarat se o to, aby třídění, shromažďování a ukládání dat a nakládání s nimi probíhalo hladce a plynule, čímž umožňuje datovým vědcům zjišťovat aktuální či budoucí trendy.
Ovládá programovací jazyky (např. Python, Java nebo Scala), ví, jak rychle získávat data a optimalizovat proces jejich shromažďování. Vedle populárního Pythonu je důležitý také jazyk SQL.
Musí mít zkušenosti s ukládáním či zpracováním velkých dat. Díky tomu dokáže data vyčistit, aby bylo možné je snáz číst. A v neposlední řadě by měl také umět pracovat s frameworky a databázovým softwarem jako Snowflake, BigQuery apod. A rozhodně se bude hodit i základní zkušenost s cloudem, který válcuje lokální řešení.
A nejsou v tom lepší stroje?
Dá se očekávat, že se některé úkoly datových analytiků (například reporting) budou postupně automatizovat. Hlavním úkolem datového analytika je však pochopit zadaný problém, dodat kvalitně zpracovaná data a interpretovat je tak, aby problém vyřešil nebo pomohl se strategickým rozhodnutím. A tuto schopnost si v blízké budoucnosti ponechají jen lidé.
Stroje budou skvělým pomocníkem, který nás ale kompletně nenahradí. Dá se to říct i jinak – datová analýza je asi z 85 % technická činnost a zbylých 15 % je kreativní práce (poměr se liší pozice od pozice). A ta kreativní část je přesně to, co rozlišuje člověka od stroje a dobrého analytika od špatného.
Líbila by se ti kariéra datového experta?
Můžeš začít s námi – Datová Akademie je 12týdenní prezenční kurz, který tě připraví na první zaměstnání v oboru. Stejně jako už připravil naše absolventy. O jejich cestě do IT si můžeš přečíst u nás na webu:
- Kurz datovky byl jen rozehřívačka, denně pracuji až s miliardou záznamů, říká Jakub
- Do kurzu jsem dala maximum a bleskurychle se mi to vrátilo, popisuje Míša
- Práci v IT jsem měla jistou ještě před dokončením kurzu, líčí Verča