Základní info
Tento půldenní workshop je určený pro datové analytiky, kteří chtějí získat zkušenost s čištěním dat pomocí aplikace DataFlux. Pro účast na workshopu stačí mít zkušenost se základním ovládáním PC, prací v MS Word a MS Excel a webovými prohlížeči.
Přínos pro účastníka
V tomto půldenním kurzu se naučíte:
- přistupovat k datovým zdrojům a zkoumat je
- profilovat data
- vytvářet a aplikovat standardizovaná pravidla
- provádět rozpoznávání významů
- provádět rozpoznávání pohlaví
- identifikovat duplikované záznamy
- verifikovat adresy
Obsah kurzu
Úvod do datové kvality a nástroje DataFlux
- úvod do práce s DataFlux dfPower Studio
- metodologie datové kvality
Profilování dat
- co je profilování dat
- práce s dfPower Eplorer
- práce s dfPower Profile
Techniky číštění dat
- vylepšování dat
- standardizace dat
- rozpoznávání významů a pohlaví
- porovnávání dat
- verifikace adres