Population Algorithm (Semeion©)
L’algoritmo Population (di seguito denominato Population) ha un posto nel quadro teorico della Multi Dimensional Scaling . Ridurre la dimensionalità di un dataset è un problema frequente nell’analisi dei dati ed è di notevole importanza, in particolare, nel campo dell’analisi esplorativa. Population offre l’opportunità di comprimere N record di uno spazio M-dimensionale (denominato Spazio Sorgente) in un sottospazio di dimensioni Q (denominato Spazio Proiettato), dove Q << M, mantenendo il maggior numero possibile di relazioni esistenti contenute negli N record originali. Population è un algoritmo iterativo basato sul calcolo di una fitness locale: la distanza tra due punti è considerata ottimale quando le singole differenze tra la matrice delle distanze dello Spazio Sorgente e la matrice delle distanze dello Spazio Proiettato sono vicine allo zero.
Questa particolare caratteristica di Population , la capacità di convergere su una soluzione senza calcolare la fitness globale, determina la velocità con cui trova una soluzione minimizzando l’errore globale rispetto ad altri algoritmi di Multi Dimensional Scaling, come ad esempio Sammon’s map. É quindi particolarmente utile per le elaborazioni di dataset di grande dimensionalità.
L’algoritmo Population ha dimostrato di possedere una elevata qualità per la risoluzione del problema della Multi Dimensional Scaling. Il potenziale di questo algoritmo è notevole:
1. Velocità;
2. Efficienza;
3. Semplicità dell’algoritmo;
4. Libertà dal dover calcolare una funzione di costo specifico;
5. Possibilità di analizzare un dataset di grandi dimensioni;
6. Possibilità di introdurre in modo dinamico nuovi record nel dataset durante l’esecuzione del programma;
7. Possibilità di scegliere le dimensioni dello Spazio Proiettato.
References
[1] Giulia Massini, Stefano Terzi, Paolo Massimo Buscema
Population Algorithm: A New Method of Multi-Dimensional Scaling
Chapter 3, pp 63-74, in W.J. Tastle (ed.), Data Mining Applications Using Artificial Adaptive Systems, DOI 10.1007/978-1-4614-4223-3_1, Springer Science+Business Media New York 2013