February 21
Un data warehouse è un database relazionale, una banca dati elettronica in cui i dati sono memorizzati in tabelle di righe e colonne. È progettato per query e analisi, piuttosto che l'elaborazione delle transazioni di tutti i giorni. Una transazione è un'unità atomica di lavoro, come pagare una bolletta dal tuo conto bancario, che sia esito positivo o negativo. A differenza di un sistema di elaborazione delle transazioni, un data warehouse non ha bisogno di rispondere immediatamente alle richieste degli utenti ed ha altre caratteristiche uniche.
Un database è progettato per aiutare gli analisti analizzare i dati. Come tale, i dati vengono memorizzati per argomento, piuttosto che dall'applicazione; In altre parole, i dati sono "soggetto-oriented." La materia esatto soggetto può variare da azienda ad azienda, ma un business può decidere di strutturare la sua data warehouse di vendita, le spedizioni o inventario, in modo che possa rispondere a domande come, "Quale cliente ha acquistato la maggior parte di questo prodotto l'anno scorso?"
Un'altra caratteristica di un data warehouse è che deve mettere insieme i dati provenienti da diversi database operativi, file e segmenti di dati; poi li presenta in un formato coerente. Ciò significa che, prima che i dati viene spostato in un magazzino di dati, deve subire un processo noto come estrazione, trasformazione e caricamento. Innanzitutto, questo processo estrae dati da una o più sorgenti di dati operativi. In secondo luogo, rimuove incongruenze dai dati; infine, carica i dati nel data warehouse. In definitiva, l'efficienza di questo processo determina la qualità dei dati in un data warehouse.
Una volta trasferiti in un data warehouse, i dati non cambia ed è descritto come "non volatile". I dati non è destinato a gestire l'attività giorno per giorno; A differenza dei dati conservate nelle banche dati operativi, non viene aggiornato dopo ogni singola operazione. Invece, i dati vengono trasferiti nel data warehouse a regolari intervalli specifici, come una volta al giorno, una volta alla settimana o una volta al mese, a seconda della natura esatta dei dati.
A differenza di un sistema di elaborazione delle transazioni, in cui i dati storici sono archiviati per mantenere le prestazioni del database, data warehouse deve contenere i dati storici. Al fine di individuare le tendenze di business, gli analisti richiedono grandi volumi di dati, campionati nel corso del tempo, in modo da un data warehouse contiene "istantanee" storiche di dati operativi in momenti specifici. In altre parole, i dati in un data warehouse è descritto come "variante tempo", perché la sua concentra principalmente cambiano nel corso del tempo.