Codici minerari frequenti modello

April 18

Reticolo frequente mineraria, noto anche come frequente itemset mineraria, è una tecnica per scoprire gruppi di elementi che si verificano frequentemente insieme in un database. Secondo il Dr. Christian Borgelt, ricercatore principale presso il Centro europeo per Soft Computing, frequente modello di data mining è stato uno degli argomenti più ricercati attivamente in data mining sono stati sviluppati da primi anni 1990 e numerosi algoritmi matematici.

Frequente Mining pattern

Frequente modello mining è un problema elementare in molte applicazioni. Un tipico database transazionale - ad esempio un database che descrive il comportamento degli acquirenti su Main Street, per corrispondenza o on-line - contiene un enorme numero di set di elementi e rappresenta una sfida in termini di sviluppo di efficienti algoritmi scalabili. algoritmi di data mining di pattern frequenti note come Apriori, Eclat e FP-crescita sono tra i più ampiamente conosciuto.

Algoritmo Apriori

L'algoritmo Apriori, proposto per primo da Rakesh Agrawal e Ramkrishnan Srikant della IBM Almaden Research Center nel 1994, si basa sul principio che itemsets sono contati quando si verificano nelle transazioni. Il database viene sottoposto a scansione per trovare frequenti 1-itemset, i 1-set di elementi vengono utilizzati per generare 2-set di elementi e così via fino a K-set di elementi. A k-itemset è detto di essere frequenti se e solo se tutti i suoi subitemsets sono frequenti. Da quando è stato proposto prima, numerosi miglioramenti all'algoritmo Apriori sono stati suggeriti.

Algoritmo FP-crescita

L'algoritmo di FP-crescita - FP sta per "pattern frequente" - si avvale di una tecnica nota come l'algoritmo esegue la scansione del database per creare un elenco di elementi frequenti in ordine, che utilizza per comprimere il database di discesa "divide et impera". in un FP-tree. Il FP-albero stesso viene estratto, iniziando con ciascun frequenti lunghezza 1 pattern - noto anche come un pattern suffisso - per creare un condizionale FP-tree, che contiene prefissi corrispondenti agli elementi che co-verificarsi con il modello iniziale suffisso. Il modello di suffisso iniziale è concatenato con i modelli di frequente nelle condizionale FP-albero per ottenere una crescita pattern.

Algoritmo Eclat

Gli algoritmi Apriori e FP-crescita miniera modelli frequenti da una serie di operazioni disposte orizzontalmente. La classe di equivalenza Transformation (Eclat) algoritmo - proposto da Mohammed J. Zaki, professore di informatica presso il Rensselaer Polytechnic Institute, nel 2000 - d'altra parte, miniere modelli frequenti in una serie di operazioni disposti verticalmente. L'algoritmo Eclat inizia con un singolo elemento e utilizza un set di intersezione per determinare itemset frequenti e si ripete fino a quando non set di elementi ulteriori frequenti si possono trovare.