Nebyly nalezeny žádné výsledky

Vašemu vyhledávání neodpovídají žádné výsledky.

Abyste našli to, co hledáte, doporučujeme vyzkoušet následující postup:

  • Zkontrolujte pravopis vašich klíčových slov ve vyhledávání.
  • Použijte synonyma pro klíčové slovo, které jste zadali, například zkuste „aplikace“ místo „software“.
  • Vyzkoušejte jedno z populárních vyhledávání uvedených níže.
  • Zahajte nové hledání.
Časté otázky

Definice datové vědy

Žena dívající se na displej tabletu

Zde je jednoduchá definice datové vědy:

Datová věda kombinuje několik oblastí, včetně statistiky, vědeckých metod a analýzy dat, tak aby se z dat získaly hodnotné poznatky.

Osoby, které se zbývají datovou vědou, jsou označovány jako datoví vědci. Ti kombinují různé znalosti, s jejichž pomocí analyzují data získaná z webu, chytrých telefonů, od zákazníků, ze senzorů a dalších zdrojů.

Datová věda: Nevyužitý zdroj pro strojové učení

Datová věda je dnes jedním z nejzajímavějších oborů. Ale proč je tak důležitá?

Protože společnosti sedí na pokladech v podobě mnoha dat. Protože moderní technika umožnila vytvářet a ukládat stále větší množství informací, objemy dat prudce rostou. Odhaduje se, že v posledních dvou letech bylo vytvořeno 90 procent dat celého světa. Uživatelé Facebooku například nahrají každou hodinu 10 milionů fotografií.

Tato data jsou však často jen uložená v databázích a datových jezerech, většinou nedotčená.

Množství dat, které tyto technologie shromažďují a uchovávají, může přinést průlomový přínos organizacím a společnostem po celém světě, ale pouze pokud je budeme schopni interpretovat. A k tomu slouží datová věda.

Datová věda odhaluje trendy a vytváří poznatky, které mohou podniky využít k lepšímu rozhodování a vytváření většího počtu inovativních produktů a služeb. Snad nejdůležitější je, že umožňuje modelům strojového učení (ML) učit se z obrovského množství dat, které jim jsou předkládána, spíše než se spoléhat na obchodní analytiky, aby zjistili, co lze z těchto dat získat.

Data jsou základem inovace, ale jejich užitečnost vychází z informací, které z nich datoví vědci vytěží a na které následně reagují.

Jaký je rozdíl mezi datovou vědou, umělou inteligencí a strojovým učením?

Jaký je rozdíl mezi datovou vědou, umělou inteligencí a strojovým učením?

Pokud chcete lépe porozumět datové vědě a umět ji využít naplno, je stejně důležité znát další pojmy související s oborem, jako je umělá inteligence (AI) nebo strojové učení. Tyto výrazy se poměrně často zaměňují, přesto se ale přece jen vzájemně liší.

Nabízíme jednoduché rozdělení:

  • Umělá inteligence (AI) znamená, že počítač nějakým způsobem napodobuje lidské chování.
  • Datová věda je podmnožinou AI a týká se více překrývajících se oblastí statistiky, vědeckých metod a analýzy dat – to vše se používá k extrahování významu a poznatků z dat.
  • Strojové učení je další podmnožinou AI a skládá se z technik, které počítačům umožňují z dat zjišťovat různé informace a poskytovat aplikace umělé inteligence.

A pro jistotu přidáme jednu definici navíc:

  • Hluboké učení, což je podmnožina strojového učení, která umožňuje počítačům řešit složitější problémy

Jak datová věda transformuje podnikání

Datová věda a narůst objemu dat

Organizace používají datové vědce k tomu, aby svá data proměnily na konkurenční výhodu prostřednictvím vylepšených produktů a služeb. Následují případy využití datové vědy a strojového učení:

  • Určení spokojenosti zákazníků pomocí analýzy dat shromážděných z call center, aby marketing mohl podniknout kroky k jejich udržení
  • Lepší efektivita pomocí analýzy modelů silničního provozu, povětrnostních podmínek a dalších faktorů, aby logistické společnosti mohly zlepšit rychlost dodání a snížit náklady
  • Lepší diagnostika pacientů díky analýze údajů z lékařských vyšetření a hlášených příznaků, aby lékaři mohli diagnostikovat onemocnění dříve a účinněji je léčit
  • Optimalizace dodavatelského řetězce díky předpovídání, kdy se zařízení pokazí
  • Odhalování podvodů ve finančních službách rozpoznáváním podezřelého chování a neobvyklých akcí
  • Vylepšení prodejů vytvořením doporučení pro zákazníky na základě předchozích nákupů

Mnoho společností považuje datovou vědu za svou prioritu a mohutně do ní investuje. V nedávném průzkumu společnosti Gartner mezi více než 3 000 vedoucích pracovníků v oblasti informačních technologií respondenti označili analýzu dat a metody business intelligence za klíčové technologie ve svých organizacích. Dotazovaní generální ředitelé považují tyto technologie za strategicky důležité pro své společnosti a podle toho do nich investují.

V čem spočívá práce datového vědce

V čem spočívá práce datového vědce

Proces analýzy dat a přijímání opatření na základě dat je spíše iterativní než lineární, nicméně v projektech modelování dat se obvykle používá tento životní cyklus zpracování dat:

Plánování: Definuje se projekt a jeho potenciální výstupy.

Vytvoření datového modelu: Datoví vědci často používají k vytváření modelů strojového učení různé open source knihovny nebo nástroje v databázi. Uživatelé budou často chtít, aby rozhraní API pomohla se sběrem, profilováním a vizualizací dat nebo s vytvářením funkcí. Budou potřebovat správné nástroje a také přístup ke správným datům a jiným zdrojům, jako je výpočetní výkon.

Vyhodnocení modelu: Datoví vědci musí dosáhnout vysokého procenta přesnosti svých modelů, aby měli jistotu, že budou moci být bezpečně nasazeny. Vyhodnocení modelu obvykle vygeneruje komplexní sadu metrik a vizualizací pro vyhodnocení výkonu modelu proti novým datům a také je roztřídí v čase tak, aby to umožnilo optimální chování při výrobě. Vyhodnocení modelu jde nad rámec hrubého výkonu, aby se zohlednilo očekávané základní chování.

Vysvětlení modelů: Možnost vysvětlit vnitřní mechaniku výsledků modelů strojového učení srozumitelně pro laika nebyla vždy snadná – každopádně však získává čím dál více na významu. Datoví vědci požadují automatická vysvětlení relativní váhy a důležitosti faktorů, které vedou ke generování predikce, a vysvětlující podrobnosti specifické pro modelové předpovědi.

Nasazení modelu: Převzetí naučeného modelu strojového učení a jeho začlenění do správných systémů je často obtížný a pracný proces. To lze usnadnit tím, že se modely budou provozovat jako škálovatelné a zabezpečené rozhraní API, případně pomocí modelů strojového učení v databázi.

Monitorování modelů: Nasazením modelu to bohužel nekončí. Modely musí být po nasazení vždy sledovány, aby se zajistilo jejich správné fungování. Data, na která byl model zapracován, nemusí být pro budoucí předpovědi po určité době relevantní. Například při detekci podvodů zločinci stále přicházejí s novými způsoby napadání účtů.

Nástroje pro datové vědce

Nástroje pro datové vědce

Vytváření, vyhodnocování, nasazení a monitorování modelů strojového učení může být složitý proces. Proto se stále rozrůstá počet nástrojů pro datovou vědu. Datoví vědci používají mnoho druhů nástrojů. Jedním z nejběžnějších jsou aplikace typu „zápisník“ s otevřeným zdrojovým kódem. Jsou to webové aplikace pro psaní a spouštění kódu, vizualizaci dat a zobrazení výsledků – vše ve stejném prostředí.

Mezi nejoblíbenější aplikace typu „zápisník“ patří Jupyter, RStudio a Zeppelin. Aplikace typu „zápisník“ jsou velmi užitečné pro provádění analýzy. Mají však svá omezení, když datoví vědci potřebují pracovat jako tým. K vyřešení tohoto problému byly vytvořeny platformy pro datovou vědu.

Chcete-li zjistit, který nástroj pro datovou vědu je pro vás nejvhodnější, je důležité položit si následující otázky: Jaké jazyky používají vaši datoví vědci? Jaké pracovní metody upřednostňují? Jaké zdroje dat používají?

Někteří uživatelé například upřednostňují službu nezávislou na datovém zdroji, která používá open source knihovny. Jiní dávají přednost rychlosti algoritmů strojového učení v databázi.

Kdo dohlíží na proces datové vědy?

Kdo dohlíží na proces datové vědy?

Ve většině organizací jsou projekty v oblasti datové vědy obvykle pod dohledem tří typů manažerů:

Obchodní manažeři: Tito manažeři pracují s týmem datových vědců, aby definovali problém a vyvinuli strategii analýzy. Mohou zastávat funkci vedoucího oddělení, jako je marketing, finance nebo prodej, a tým datových vědců je jim podřízen. Úzce spolupracují s manažery pro datovou vědu a manažery IT, aby zajistili splnění projektů.

Manažeři IT: Vedoucí pracovníci IT odpovídají za infrastrukturu a architekturu, která bude podporovat operace datové vědy. Průběžně monitorují operace a využívání zdrojů, aby zajistili efektivní a bezpečné fungování týmů datových vědců. Mohou také odpovídat za vytváření a aktualizaci prostředí IT pro týmy datových vědců.

Manažeři pro datovou vědu: Tito manažeři dohlížejí na tým datových vědců a jejich každodenní práci. Jejich úkolem je sestavit tým a dokážou nalézt rovnováhu mezi rozvojem týmu a plánováním a monitoringem projektů.

Nejdůležitějším hráčem v tomto procesu je však datový vědec.

Kdo je datový vědec?

Kdo je datový vědec?

Datová věda jakožto specializace je novou záležitostí. Vznikla z odvětví statistické analýzy a dolování dat. Časopis Data Science Journal zahájil svou činnost v roce 2002 a vydává jej Mezinárodní vědecká rada: výbor pro data pro vědu a techniku. V roce 2008 se objevil pojem datového vědce a obor se začal prudce rozvíjet. Od té doby je datových vědců nedostatek, i když stále více a více vysokých škol začalo nabízet studium datové vědy.

Mezi úkoly datových vědců může patřit rozvoj strategií analýzy dat, příprava dat pro analýzu, studium, analýza a vizualizace dat, budování modelů s daty pomocí programovacích jazyků, jako jsou Python a R, a zavádění modelů do aplikací.

Datový vědec nepracuje sám. Ve skutečnosti se data vědecky zkoumají nejlépe v týmech. Vedle datového vědce může tým zahrnovat obchodního analytika, který definuje problém, datového inženýra, který připravuje data a přístup k nim, architekta IT, který dohlíží na základní procesy a infrastrukturu, a vývojáře aplikací, který promítá modely nebo výstupy analýzy do aplikací a produktů.

Problematika implementace projektů datové vědy

Problematika implementace projektů datové vědy

I přes slibné vyhlídky datové vědy a obrovské investice do týmů datových vědců mnoho společností nezíská ze svých dat maximální užitek. Ve své honbě po talentech a vytváření programů datové vědy zaznamenaly některé společnosti neefektivní týmové pracovní postupy, kdy různí lidé používali různé nástroje a procesy, které společně nefungují dobře. Bez dalšího disciplinovaného centralizovaného řízení existuje riziko, že se vedení nevrátí všechny investice.

Toto chaotické prostředí představuje mnoho výzev.

Datoví vědci nemohou efektivně pracovat. Protože přístup k datům musí být udělen správcem IT, datoví vědci často dlouho čekají na data a zdroje, které potřebují analyzovat. Jakmile mají přístup, může tým datových vědců analyzovat data pomocí různých – a možná nekompatibilních – nástrojů. Například určitý vědec může vyvinout model v jazyce R, ale aplikace, ve které se bude používat, je napsána v jiném jazyce. Z tohoto důvodu může trvat týdny – nebo dokonce i měsíce –, než lze modely nasadit do užitečných aplikací.

Vývojáři aplikací nemají přístup k použitelnému strojovému učení. Někdy nejsou modely strojového učení, které vývojáři obdrží, připraveny k nasazení v aplikacích. A protože přístupové body mohou být nepružné, nelze modely nasadit ve všech scénářích a škálovatelnost je ponechána na vývojáři aplikace.

Správci IT stráví příliš mnoho času podporou. Vzhledem k šíření open source nástrojů může mít oddělení IT stále se rozšiřující seznam nástrojů, které je třeba podporovat. Například datový vědec v oboru marketingu může používat různé nástroje než datový vědec v oboru financí. Týmy mohou mít také různé pracovní postupy, což znamená, že oddělení IT musí prostředí neustále přepracovávat a aktualizovat.

Obchodní manažeři jsou z datové vědy příliš vyloučeni. Pracovní postupy datové vědy nejsou vždy integrovány do firemních procesů a systémů rozhodování, což stěžuje obchodním manažerům možnost kvalifikovaně spolupracovat s datovými vědci. Bez lepší integrace obchodní manažeři jen těžkou chápou, proč to trvá tak dlouho převést prototyp do produkčního prostředí – a je proto méně pravděpodobné, že podpoří investice do projektů, které považují za příliš pomalé.

Platforma pro datovou vědu přináší nové možnosti

Platforma pro datovou vědu přináší nové možnosti

Mnoho společností si uvědomilo, že bez integrované platformy by byla práce datových vědců neefektivní, nezabezpečená a obtížně měřitelná. Toto poznání vedlo k rozvoji platforem pro datovou vědu. Tyto platformy jsou softwarové uzly, kolem kterých probíhá veškerá datová věda. Dobrá platforma zmírňuje mnoho výzev v oblasti implementace datové vědy a pomáhá podnikům rychleji a efektivněji přeměňovat data na poznatky.

S centralizovanou platformou strojového učení mohou datoví vědci pracovat v kolaborativním prostředí se svými oblíbenými open source nástroji, přičemž veškerou jejich práci synchronizuje systém pro správu verzí.

Výhody platformy pro datovou vědu

Výhody platformy pro datovou vědu

Platforma pro datovou vědu snižuje nadbytečnost a podporuje inovace tím, že umožňuje týmům sdílet kód, výsledky a zprávy. Odstraňuje překážky v pracovním procesu tím, že zjednodušuje řízení a zahrnuje osvědčené postupy.

Cílem nejlepších platforem datové vědy je obecně:

  • Zvýšit produktivitu datových vědců tím, že jim pomůžete zrychlit a dodávat modely rychleji a s menšími chybami
  • Usnadnit datovým vědcům práci s velkými objemy a nejrůznějšími daty
  • Poskytnout důvěryhodnou umělou inteligenci na úrovni podniku, která je bez předsudků, auditovatelná a reprodukovatelná

Platformy pro datovou vědu jsou vytvořeny pro spolupráci řady uživatelů včetně odborníků datové vědy, civilních datových vědců, datových inženýrů a inženýrů nebo odborníků strojového učení. Například platforma pro datovou vědu může datovým vědcům umožnit nasazení modelů jako aplikačních rozhraní API, což usnadňuje jejich integraci do různých aplikací. Datoví vědci mají přístup k nástrojům, datům a infrastruktuře, aniž by museli čekat na pracovníky IT.

Poptávka po platformách pro datovou vědu na trhu prudce narostla. Ve skutečnosti se v příštích několika letech očekává růst trhu s platformami s kumulovaným ročním ukazatelem růstu vyšším než 39 % a předpokládá se, že do roku 2025 dosáhne hodnoty 385 miliard USD.

Co očekává datový vědec od platformy

Co očekává datový vědec od platformy

Pokud jste připraveni prostudovat možnosti platforem pro datovou vědu, je třeba zvážit některé klíčové funkce:

Zvolte uživatelské rozhraní založené na projektech, které podporuje spolupráci. Platforma by měla umožnit lidem spolupracovat na modelu, od koncepce až po konečný vývoj. Každému členovi týmu by měla poskytnout samoobslužný přístup k datům a zdrojům.

Upřednostněte integraci a flexibilitu. Ujistěte se, že platforma zahrnuje podporu nejnovějších open source nástrojů, poskytovatele společné správy verzí, jako jsou GitHub, GitLab a Bitbucket, a těsnou integraci s dalšími zdroji.

Zvolte platformu, která zahrnuje funkce podnikové třídy. Ujistěte se, že platforma může růst s vaší firmou a vaším týmem. Platforma by měla mít vysokou dostupnost, měla by mít robustní řízení přístupu a měla by podporovat velký počet souběžných uživatelů.

Zajistěte, aby byla datové věda více samoobslužná. Zvažte platformu, která zbavuje povinností pracovníky IT a techniky a usnadňuje datovým vědcům, aby okamžitě zprovozňovali prostředí, sledovali veškerou svou práci a jednoduše nasazovali modely do produkčního prostředí.

Zajistěte snazší nasazení modelu. Nasazení a provoz modelu je jedním z nejdůležitějších kroků životního cyklu strojového učení, ale často se na něj nebere ohled. Ujistěte se, že zvolená služba usnadňuje provozování modelů, ať už poskytuje rozhraní API, nebo zajišťuje, aby uživatelé vytvářeli modely umožňující snadnou integraci.

Když je platforma pro datovou vědu správným krokem

Vaše organizace by mohla být připravena na platformu pro datovou vědu, pokud jste si všimli následujícího:

  • Produktivita a spolupráce vykazují známky napětí
  • Modely strojového učení nelze auditovat ani reprodukovat
  • Modely se nikdy nedostanou do výroby.

Platforma pro datovou vědu může vaší firmě přinést skutečnou hodnotu. Platforma pro datovou vědu společnosti Oracle zahrnuje širokou škálu služeb, které poskytují komplexní prostředí od začátku do konce navržené k urychlení nasazení modelů a zlepšení výsledků datové vědy.