Termini utili
In questa pagina sono elencati e brevemente descritti dei termini di uso comune in ambito di Machine Learning il cui significato è bene aver sempre ben presente.
ALGORITMO
Insieme di regole utilizzate per risolvere problemi attraverso data processing, matematica o ragionamenti automatici.
ANOMALY DETECTION
Modello che segnala comportamenti inaspettati o particolarmente strani per il contesto di analisi.
DATI CATEGORICI
Dati suddivisi in categorie di informazioni, o suddivisibili in gruppi.
CLASSIFICAZIONE
Modello in grado di assegnare a ciascun dato una opportuna categoria sulla base della classificazione già presente nei dati di training.
ESTRAZIONE DI FEATURES
Processo di selezione o estrazione di features legate a un dataset al fine di migliorare i risultati attuabili (i.e., la suddivisione di una categoria "data" in "giorni festivi" o "giorni lavorativi".
MODELLO
É l'insieme di dati di training, algoritmo, e moduli funzionali per l'analisi e la valutazione dei risultati. Può essere considerato l'unita costitutiva di un esperimento.
DATI NUMERICI
Dati che assumono il significato di misurazione o conteggio. Sono anche indicati con il termine dati quantitativii.
PARTIZIONAMENTO
Criterio mediante il quale viene suddiviso in campioni (samples) il datset.
SAMPLES
Campione di dati che può essere considerato una buona rappresentazione dell'intero dataset. I campioni possono essere selezionati attraverso processi random o basati su specifiche feature.
PREDIZIONE
Previsione di un valore o di un insieme di valori effettuato da un modello di Machine Learning.
REGRESSIONE
Tipologia di modello che si basa su _variabili indipendenti _per predirre un valore. Ad esempio la previsione del prezzo di una macchina sulla base dell'anno e del produttore.
SCORE
Valore generato da un modello di classificazione o di regressione per indicare la probabilità legata al valore previsto. Viene utilizzato generalmente per determinare l'accurtezza generale del modello in questione.