Paderno Dugnano (MI)
+39 3209089730
statisticaladvisor@gmail.com

Data mining e Machine Learning

Analisi dati statistici per tesi e tesine

Le tecniche di data mining sono modelli di analisi multivariata sviluppati per essere impiegati su grandi moli di dati a scopo previsionale e di classificazione.

Possiamo fornirvi la nostra esperienza nello sviluppare e impiegare le seguenti tecniche, confrontandole e valutandone la performance predittiva:

  • Reti neurali Radial Basis Function e Multilayer Perceptron.
  • Alberi di regressione e classificazione (Chaid, C5.0).
  • Regole di associazione.
  • MARS splines.
  • Support Vector Machines (SVM).
  • K-nearest neighbour classifier (KNN).
  • Naive Bayes Classifier.
  • Bagged Models, Random Forest.
  • Boosted Models: AdaBoost, GBM, XGBoost, CatBoost, LightGBM.
  • Deep Learning per dati tabulari, immagini, testuali (Natural Language Processing)

Tutte le analisi saranno effettuate con le good – practices correnti, per garantire massima robustezza e possibilità di uso operativo:

  • ripartizione dei dati tra train, validation e test set;
  • ottimizzazione degli iperparametri;
  • valutazione delle performance
  • verifica della replicabilità dei risultati