Processi ETL

September 8

Processi ETL


database software ricevono informazioni da una varietà di fonti e memorizzare le informazioni per l'utilizzo da parte di programmi e gli utenti finali. Non tutte le informazioni sono presentate in un formato che un database può gestire; i dati devono subire modifiche per renderlo compatibile con il formato di database. Estrazione, trasformazione e caricamento dei processi rendono possibile per informazioni a venire da una fonte di dati e di essere caricato in un database.

Estrazione

L'estrazione è il processo di prendere i dati da un file system di origine o in altri luoghi per la eventuale integrazione in un database. Se i dati vengono correttamente estratti quindi processi successivi è probabile che si verifichino problemi se non mancano del tutto. L'estrazione è particolarmente importante per i database che attingono informazioni da più fonti, come i file system utilizzati dal ciascuna sorgente potrebbero non essere pienamente compatibile con il database o l'altro. possono essere necessari metodi di estrazione multipli per assicurare la corretta estrazione da tutte le fonti.

Trasformare

Il processo di trasformazione prepara estratti i dati per il caricamento in un database. A seconda delle analogie tra il file system utilizzato dalla sorgente dati e che del database, una serie di modifiche ai dati può essere necessario renderlo compatibile con il file database di sistema. Questi cambiamenti possono includere la fusione di diversi campi di dati, la conversione dei dati da un formato ad un altro e le regolazioni per l'orientamento dei campi di dati in modo che corrispondano al formato corrispondente del database.

Caricamento in corso

Il processo di caricamento prende i dati che è stato trasformato e genera nuovi record del database sulla base di questi dati. Questi nuovi documenti sono in formato database standard e sono accessibili dal software o utenti con con le credenziali appropriate o privilegi di amministratore di database. Ulteriori modifiche possono essere apportate ai dati da parte di utenti o di software di database, anche se queste modifiche non si rifletteranno nei dati ancora detenute alla fonte originale.

L'utilizzo di processi ETL

processi ETL sono spesso utilizzati nel data warehousing e operazioni simili in cui grandi quantità di dati sono tratti da una serie di diversi computer o server. I tre processi lavorano insieme per assicurare che i dati vengano correttamente convertito dal formato sorgente in una forma che può essere utilizzata dal database centrale senza errori. Senza l'uso di processi ETL, i dati possono diventare registrati in modo non corretto nel formato del database o può finire per non essere registrato a tutto.