- Questionario proveniente da rilevazioni dirette mediante indagini ad hoc.
- Statistiche indirette
- Risultati di osservazioni sperimentali o database aziendali.
- Scientifici: deve contenere la definizione del problema da analizzare;
- Pratici: deve presentare omogeneità dei dati;
- Informatici: contiene la premessa per la elaborazione
2) LA CODIFICA A PRIORI DEI DATI GREZZI
La codifica a priori dei dati grezzi rilevati nella prima fase rappresenta il primo passo per il trattamento automatico dei dati.
Una buona codifica a priori richiede, infatti, la conoscenza dei fenomeni oggetto di studio: fenomeni poco noti conducono spesso a codifiche a priori ambigue o incomplete.
Dal punto di vista operativo, la codifica a priori consiste nella trasposizione di tutti i dati grezzi, rilevati nella prima fase, nella base dei dati.
3) LA CODIFICA A POSTERIORI
La codifica a posteriori riguarda la necessità di ricodificare i dati contenuti nella base dei dati, affinché essi siano compatibili con certi algoritmi.
4) LA SCELTA DELLA TABELLA DEI DATI
La quarta fase dell'a.d.d riguarda la scelta della/e tabella/e dei dati da sottoporre a uno o più metodi di analisi dei dati. Non sempre, infatti, la base dei dati è da sottoporre interamente all'analisi.
5) A SCELTA DELLA DISTANZA (O SIMILARITÀ) TRA UNITÀ
In generale, la scelta di una data distanza (o similarità), dipende dalla compatibilità che deve esistere tra tipo di tabella dei dati, tipo dei dati e misura/e possibili, nell'ipotesi di scegliere il livello di misurazione più alto tra quelli consentiti dai dati disponibili. Una volta, tuttavia, assicurata tale compatibilità e, qualora si sia in dubbio tra più misure possibili, non si possono stabilire dei criteri unici di scelta della misura "migliore": è, allora, conveniente fare più prove con misure diverse per valutarne la bontà o meno rispetto al problema da analizzare. È il caso di osservare circa la scelta delle distanze che, non sempre i packages statistici di a.d.d. consentono opzioni tra diverse misure e che, qualora le consentano, non sempre tra esse figurano le distanze più importanti, obbligando al calcolo a parte delle matrice delle distanze da inserire poi in analisi.
6) LA SCELTA DEL METODO
Questa fase dell'analisi dovrebbe riguardare soltanto la scelta del software di analisi, ossia la scelta tra vari packages statistici esistenti /o disponibili per effettuare il tipo di analisi dei dati di partenza.
7) L'OUTPUT DI SINTESI DEI RISULTATI
L'ultima fase dell'Analisi riguarda la stampa dei risultati finali ottenuti, effettuata secondo le varie scelte nelle fasi precedenti ed espressa, oltre che da valori numerici, da rappresentazioni grafiche particolarmente importanti e necessarie all'interpretazione dei risultati ottenuti.
si ringrazia [http://www.statix.ch/Analisi%20dei%20dati.htm]