Základní info
V tomto kurzu účastníci získají klíčové znalosti o výkonnosti a možnostech procesů pro načítání dat (ETL procesů) a způsobech jejich ladění a zefektivnění v systému SAS 9 a v aplikaci SAS Data Integration Studio. V kurzu jsou probrány principy ETL procesů a s pomocí názorných příkladů jsou detailně rozebrána témata související s efektivitou při načítání dat.
Před přihlášením by účastníci měli:
- znát základy programování v SAS (v rozsahu školení PRG1)
- ovládat práci s aplikací SAS Data Integration Studio (v rozsahu školení DIS)
- výhodou je znalost makro jazyka SAS (školení MAC1)
Přínos pro účastníka
V kurzu se naučíte:
- analyzovat a odlaďovat ETL procesy
- jednoduše a rychle zvýšit výkonnost načítání
- nakonfigurovat systémové prostředí
- využívat pokročilé techniky pro zvýšení výkonu
Obsah kurzu
Monitorování výkonnosti ETL procesů
- úvod do SAS Intelligence Platform
- základní koncepce aplikace SAS Data Integration Studio
- měření výkonnosti
Základní techniky pro zvýšení výkonnosti ETL procesů
- práce s mezivýstupy
- pohledy (views) versus fyzické tabulky v ETL procesech
- otázka kvality dat
- transformace a nepotřebné sloupce
- kontrola stavu načítání a návratových kódů
Práce s daty
- klíče
- indexy
- datové funkce
- počítání řádků
- techniky plnění
Třídění a spojování
- přehled úloh náročných na zpracování
- zefektivnění procesu třídění
- optimalizace výkonu při spojování (joins)
Dimenzionální modely
- co je star schema
- definice dat nepodléhajících častým změnám (Slowly Changing Dimensions)
- vytvoření dimenzí
- vytvoření faktových tabulek
Práce s relačními databázemi
- optimalizace zpracování dat z relačních databází
Optimalizace prostředí
- úvod
- optimalizace hardwaru a paměti
- sledování výkonu