Le tecniche di data mining sono modelli di analisi multivariata sviluppati per essere impiegati su grandi moli di dati a scopo previsionale e di classificazione.
Possiamo fornirvi la nostra esperienza nello sviluppare e impiegare le seguenti tecniche, confrontandole e valutandone la performance predittiva:
- Reti neurali Radial Basis Function e Multilayer Perceptron.
- Alberi di regressione e classificazione (Chaid, C5.0).
- Regole di associazione.
- MARS splines.
- Support Vector Machines (SVM).
- K-nearest neighbour classifier (KNN).
- Naive Bayes Classifier.
- Bagged Models, Random Forest.
- Boosted Models: AdaBoost, GBM, XGBoost, CatBoost, LightGBM.
- Deep Learning per dati tabulari, immagini, testuali (Natural Language Processing)
Tutte le analisi saranno effettuate con le good – practices correnti, per garantire massima robustezza e possibilità di uso operativo:
- ripartizione dei dati tra train, validation e test set;
- ottimizzazione degli iperparametri;
- valutazione delle performance
- verifica della replicabilità dei risultati