Quali sono i compiti fondamentali di ETL?

July 11

"ETL" sta per Extract, Transform and Load - i tre compiti fondamentali di ETL. Estratto coinvolge l'estrazione dei dati da fonti esterne che si desidera portare nelle vostre basi di dati. Trasformare consiste nel manipolare i dati esterni in un formato che corrisponderà con il formato dei dati attualmente nei database. Il carico è per l'importazione dei dati trasformati nel database finale o sistema in cui risiederà. Alcuni hanno trovato più facile per caricare il priot dati trasformandolo, ed è possibile vedere il termine scritto come "ELT". Ogni attività di per sé può essere complessa e ci sono strumenti software e sistemi costruiti appositamente per l'elaborazione ETL.

Estratto

Il "Extract" compito comporta la raccolta di dati da fonti esterne che si desidera portare a sistemi e database. In una società, i dati possono essere trovati nei database stand-alone o fogli di calcolo che non sono integrati con qualsiasi database master. I dati potrebbero anche essere cartaceo o potrebbero essere i dati acquistati da un fornitore di dati. L'obiettivo di questo compito è quello di comprendere il formato dei dati, valutare la qualità complessiva dei dati e di estrarre i dati dalla sorgente in modo che possa essere manipolato nel prossimo compito.

Trasformare

Nella fase "Transform", è possibile utilizzare una varietà di strumenti software e programmazione anche su misura per manipolare i dati in modo che si integra con i dati che hai già. Ad esempio, si consideri un sistema che identifica i maschi con una "M" e le femmine con una "F" Se sono stati estratti i dati da una fonte esterna che identifica i maschi con un "1" e femmine con un "2", è necessario trasformare i dati convertendo il "1" a una "M" e il "2" a una " F "in modo che corrisponda con i dati che attualmente risiede nei database e sistemi.

Caricare

Dopo aver trasformato con successo i dati necessari per caricare fisicamente nel vostro sistema o database. Prima di caricare i dati, assicurarsi di avere una copia di backup del vostro sistema corrente o che si può ripristinare o annullare l'importazione se non riesce. Dopo il caricamento dei dati, è comune per eseguire report di controllo in modo da poter esaminare i risultati dei database e sistemi unite per assicurarsi che i nuovi dati non ha causato eventuali errori o problemi.

ELT

Quando l'attività "Transform" di per sé è grande e complesso, si consiglia di estrarre i dati, caricarlo in una tabella temporanea all'interno del database dove sarà permanentemente risiedere ed eseguire le azioni del "trasformare" passo dopo che hai caricato i dati. Avendo i dati caricati nel sistema finale durante la fase "Transform" talvolta rende più facile eseguire i rapporti e testare i risultati delle operazioni di trasformazione. A causa di questo, è possibile vedere il termine scritto come "ELT" piuttosto che "ETL".