6533b7d4fe1ef96bd1262df9

RESEARCH PRODUCT

Gli algoritmi di classificazione per i Big Data e la loro valutazione

Trobia

subject

Settore SPS/07 - Sociologia GeneraleBig Data classificazione alberi decisionali

description

La classificazione è uno degli obiettivi principali dell’analisi dei Big Data. In questo capitolo, presento la tecnica degli alberi decisionali. Ne riassumo, anzitutto, la logica di base e ne illustro, a partire da un semplice esempio, alcuni dettagli computazionali. Successivamente, utilizzando KNIME, una potente piattaforma user friendly per l’analisi dei Big Data, analizzo un dataset remoto su Amazon S3, mostro i principali risultati ottenuti e accenno ad alcune strategie più complesse d’analisi. Concludo il contributo con una panoramica sulle metriche e le tecniche più diffuse per valutare la bontà di un modello di classificazione e con un bilancio metodologico sulle applicazioni degli alberi decisionali nelle scienze sociali.

http://hdl.handle.net/10447/452832