Základní info
Tento kurz určený pro datové analytiky zabývající se kvalitou dat, kteří chtějí získat přehled o možnostech čištění dat pomocí aplikace DataFlux dfPower Studio verze 8.2.
Přínos pro účastníka
V kurzu se naučíte:
- pracovat s prostředím dfPower Studio 8.2
- profilovat data
- vylepšovat data aplikováním různých technik čištění dat
- definovat a používat přiřazovací kódy integračních metod
- kontrolovat proces čištění dat pomocí trendové analýzy a nastavení business pravidel pro monitoring
- využívat různé uzly (nódy) a techniky pro dfPower Architect
Obsah kurzu
Úvod do metodiky a nástroje DataFlux
- cyklus DataFlux metodologie
- cíle kurzu
Přehled o dfPower Studio
- instalace a architektura produktů DataFlux
- prostředí dfPower Studia
- datové přístupy (ODBC)
DataFlux metodologie: Analýza
- co je profilování dat/metadat?
- profilování s dfPower Explorer
- profilování s dfPower Profile
Úvod do dfPower Architect
- co je dfPower Architect
- práce s dfPower Architect
DataFlux metodologie: Kvalita
- techniky datové kvality
- vytváření a aplikace standardizačních schémat pro standardizaci dat
- práce s parsingem
- techniky identifikační analýzy
DataFlux metodologie: Integrace
- techniky datové integrace
- práce s match kódy
- tvorba match reportů
- různé techniky eliminace duplikací
DataFlux metodologie: Obohacování
- techniky datového obohacování
- možnosti ověřování adres
- vyhledávání adres a validační techniky
DataFlux metodologie: Kontrolní fáze
- přehled kontrolní fáze
- trendová analýza a upozornění
- monitoring business pravidel
Další možnosti dfPower Studio
- práce s dalšími uzly dfPower architekta
- tvorba a práce s dfPower Architect templaty jobů
- dávkové zpracování
- práce s makro proměnnými
- práce s vlastními metrikami