Data Science

Data Science

#datascience #forecasting #machinelearning #datamining

To všechno jsou v dnešní době již velmi dobře známé pojmy. Slýcháte je asi často a dokážete si udělat představu, jak IT giganti jako Google nebo Facebook tyto nejmodernější technologie využívají. Možná jste se ale ještě nesetkali s praktickým konceptem, který by seděl na vaši firmu. V následujících pár odstavcích si tyto pojmy znovu představíme a podíváme se na několik reálných a univerzálních příkladů, které by vaší firmě mohly vyhovovat.

Image titleObrázek 1 - Data Science koncept od Oguz Kayra, zdroj: https://mymasterdesigner.com/2020/12/29/data-science-exercises/

Data Science je, ve zkratce, oblast spojující matematiku, IT a znalost businessu k extrakci znalostí ze strukturovaných (např. finanční čísla ze SAPu) a nestrukturovaných (např. OCR, neboli extrakce informací z textu) dat. Nejlépe tyto vztahy shrnuje následující obrázek.

Image title

Obrázek 2 - Data Science koncept od Mojeed Abisiga, zdroj: https://www.kdnuggets.com/2020/08/top-10-lists-data-science.html

Jak si dále můžete na obrázku všimnout, mezi Computer Science a Matematikou a Statistikou se nachází Machine Learning, neboli strojové učení. Pod tímto pojmem si v tuto chvíli představte sadu metod a nástrojů, pomocí kterých vyřešíte nějaký váš Business požadavek na zpracování dat. Například potřebujete zjistit, jestli jako banka máte půjčit klientovi peníze na základě jím předložených údajů a na základě historických údajů o podobných klientech. Vytvoříte si matematický model (např. Logit model), který na základě těchto dat vypočítá pravděpodobnost, že daný klient zapůjčenou částku nesplatí. Stroj (počítač) se tedy naučil na základě předložených dat klasifikovat klienty => Strojové učení.

Jaké jsou ale další různé praktické příklady, které lze využít napříč různými odvětvími?

  • Korelace a regresní analýza jsou základními statistickými nástroji pro vyhodnocování vztahů a dopadů mezi vybranými ukazateli. Nejčastějším využitím jsou odhady/simulace, jak se změní nějaký ukazatel v závislosti na změně jiného ukazatele (např. jak se zvýší tržby, když snížíme cenu některého produktu). Více na toto téma lze nalézt například na [1].
  • Analýza nákupního košíku je data miningový nástroj pro získávání informací o skladbě nákupních košíků jednotlivých zákazníků. Řekněme, že máme pokladní systém, který digitalizuje každou transakci/účtenku z nákupu a na základě těchto údajů dokážeme z dat vydolovat, jaké produkty zákazníci nakupují nejčastěji společně. E-shopy mohou tuto analýzu využít k vytvoření recommendation enginu, který bude na základě položek v košíku nabízet další položky k zakoupení. Kamenné prodejny mohou tyto informace využít například při rozvrhování umístění položek na prodejně. Dalším využitím může být například tvorba kampaní. Více lze nalézt například na [2] nebo na [3].
  • S cenotvorbou produktů se potýká každá firma, která své produkty uvádí na trh. Jak nastavit cenu produktu, aby odpovídala aktuálnímu stavu trhu, ročnímu období nebo konkurenci? Toto je asi denní chléb každého marketingového/obchodního oddělení a produktového manažera. Proč ale celé rozhodování řešit manuálně, když dnes již existují nástroje, které tento proces usnadní, zpřesní a zrychlí? Na úvod je při využití strojového učení k cenotvorbě potřeba zajistit data, pomocí kterých budeme cenu určovat. Do modelu může vstupovat historický vývoj ceny daného produktu a jeho příslušná poptávka, počasí, sezóna, ceny stejného produktu u konkurence, speciální události/svátky, makroekonomické ukazatele a mnohé další. Na základě těchto vstupů se následně sestaví model, který bude dynamicky predikovat, jaká by byla vhodná cena daného produktu při zvolené strategii. Více se lze dočíst například na [4].
  • Predikce a plánování nalezneme dnes všude. Každý chce vědět, co bude zítra, za týden, měsíc nebo rok. Nikdo nezná budoucnost, ale dokážeme na základě historického vývoje a zkušeností s určitou pravděpodobností budoucí vývoj plánovat. Manuální plánování je však velmi časově náročné a náchylné na lidskou chybovost.  Při splnění určitých předpokladů však můžeme sáhnout po různých statistických modelech, které se v posledním desetiletí velmi posunuly. Nejdůležitějším předpokladem je samozřejmě kvalitně připravená a udržovaná databáze. Pokud z dat dokážeme vytvořit časovou řadu a máme také k dispozici další proměnné, které mají vliv na vývoj dané časové řady, tak jsme schopni podle povahy dat zvolit vhodný model a predikovat budoucí vývoj daného ukazatele. Tímto následně odpadá mnoho manuální práce a lidských chyb. Predikce mohou sloužit jako stavební kámen při sestavování plánu, nebo pro kontrolu predikcí s plánem. Velmi často se ve firmách například setkáváme s predikováním prodejů, tržeb, výdajů a ztrát. Díky těmto modelům můžeme dopředu počítat s nějakou událostí, která teprve nastane (např. vysoké ztráty z důvodu silných dešťů) a lépe se ni připravit a reagovat. Více důvodů, proč je forecasting důležitý, se můžete dočíst například zde [5].
  • Nakonec bychom také neměli opomenout oblast zvanou Data Mining. Data mining se ve zkratce zabývá dolováním zajímavých vztahů z dat. Představit si pod tím můžeme například situaci, kdy máme velikou databází dat, kterou již nelze analyzovat ručně v excelech nebo BI nastrojích a je zapotřebí k jejich analýze využít robustnějších metod a pomůcek. Může nás například zajímat, proč zákazníci nekupují naše produkty tak, jako v minulém čtvrtletí. Nástroj na základě předložených dat a zvoleného algoritmu data prohledá a například zjistí, že se snížilo hodnocení daného produktu a při zapojení NLP (Natural Language Processing) algoritmu jsme i schopni vydolovat, jaké byly důvody k nízkému hodnocení. Tyto informace pak můžeme využít ke customizaci produktu na potřeby zákazníka. Dalším příkladem data miningu je také již zmíněná analýza nákupního košíku. Více informací a příkladů na toto téma se lze dočíst na [6].

Podobných příkladů je nepřeberné množství a nelze je všechny vyjmenovat v jednom článku. Co mají ale tyto příklady společné je, že všechny pomáhají firmám v jejich rozhodování, šetří čas a náklady a často vedou ke zvýšení tržeb. Schopnost práce s daty, jak sami určitě uznáte, je v dnešním digitálním světě nedílnou součástí téměř každého businessu a nástroje od SAP Vám v tomto ohledu mohou pomoci.

Pokud vás náš článek zaujal a měli byste zájem o konzultaci využití některých zmíněných metod ve vaší firmě, kontaktujte nás a domluvíme si společnou schůzku.

Zdroje:

[1] https://www.researchoptimus.com/article/what-is-correlation.php

[2] https://tryolabs.com/blog/price-optimization-machine-learning/#:~:text=Machine%20Learning%20models%20can%20take,t%20have%20to%20be%20programmed

[3] https://searchcustomerexperience.techtarget.com/definition/market-basket-analysis

[4] https://www.appier.com/blog/what-is-a-recommendation-engine-and-how-does-it-work/

[5] https://www.baass.com/blog/why-forecasting-is-important-for-business-success

[6] https://www.getapp.com/resources/what-is-data-mining-small-business/