Čištění dat pomocí technologie DataFlux v kostce

Kurz na míru

Základní info

Tento intenzívní pětidenní kurz je určen zájemcům o získání praktických informací v oblasti DataFluxu a data managementu. Účastníci se naučí jak pomocí DataFlux dfPower Studio zlepšit svá data pomocí metod zkvalitňování, integrace a obohacování dat. Probírán bude také DataFlux Integration Server, obzvláště vzdálené zpracování jobů a zřízení real-time služeb. Dále bude použit nástroj dfPower Customize pro zkoumání Quality Knowledge Base (QKB) komponentů, typů dat a definicí. Jedná se o zrychlený kurz poskytující velké množství informací v krátkém čase (pro zájemce o velmi detailní a pomalejší poznání konkrétních DQ nástrojů jsou k dispozici specializované kurzy).


Přínos pro účastníka

V kurzu se naučíte:

  • profilovat data
  • vylepšovat data aplikováním různých technik čištění dat
  • provádět verifikaci adres
  • kontrolovat proces čištění dat pomocí trendové analýzy a nastavení business pravidel pro monitoring
  • konfigurovat DataFlux Integration Server
  • zpracovávat joby vzdáleným přístupem
  • zřídit real-time služby
  • rozumět komponentům QKB
  • používat editor QKB komponentů
  • rozumět různým definicím

Obsah kurzu


Přehled o dfPower Studio

  • instalace a architektura produktů DataFlux
  • dfPower Studio
  • další komponenty a datové přístupy

DataFlux metodologie: Analýza

  • co je profilování dat/metadat?
  • profilování s dfPower Explorer
  • profilování s dfPower Profile

Úvod do dfPower Architect

  • co je dfPower Architect
  • práce s dfPower Architect

DataFlux metodologie: Kvalita

  • přehled technik datové kvality
  • detaily technik datové kvality
  • standardizace
  • další techniky

DataFlux metodologie: Integrace

  • přehled technik datové integrace
  • detaily technik datové integrace
  • techniky přiřazování

DataFlux metodologie: Obohacování

  • přehled technik datového obohacování
  • detaily technik datového obohacování
  • verifikace adres

DataFlux metodologie: Kontrolní fáze

  • přehled kontrolní fáze
  • trendová analýza a upozornění
  • monitoring business pravidel

Další možnosti dfPower Studio

  • práce s dalšími uzly dfPower architekta
  • dávkové zpracování (samostudium)
  • práce s makro proměnnými (samostudium)
  • práce s vlastními metrikami (samostudium)

Úvod do DataFlux Integration Server

  • příklady využití DataFlux Integration Server
  • konfigurace

Vzdálené zpracovávání jobů

  • dfPower Architekt job
  • uploadování jobů na DataFlux Integration Server
  • zpracování na dalším DataFlux Integration Server

Real-time služby

  • vytvoření služby
  • interakce mezi službami

Úvod do přizpůsobování QKB

  • úvod
  • struktura QKB
  • editory komponent

Definice

  • "parse" definice
  • "match" definice
  • standardizované definice

Další definice

  • "case" definice
  • "gender analysis" definice
  • "identification" definice
  • "pattern analysis" definice

Tvorba nového typu dat (samostudium)

Čištění dat pomocí technologie DataFlux v kostce

Kontakt na dodavatele získáte po registraci

Tento kurz je pořádán dodavatelem, který nevyužívá placenou prezentaci na portálu Abravito.

Kontaktní údaje na dodavatele získáte po registraci.

Nebo použijte poptávkový formulář.