Modulo |
Titolo Modulo |
Descrizione |
CFU |
SSD |
1 |
Data&Analtyics - Introduzione |
Questo modulo introduce i concetti fondamentali e le tecniche essenziali della Data Science e del Machine Learning, fornendo una base per coloro che desiderano intraprendere una carriera nel campo dell'analisi dei dati. Iniziamo con Introduzione al Big Data, dove gli studenti esplorano il significato e l'importanza dei Big Data nel contesto moderno. Qui, impareranno a comprendere le caratteristiche distintive dei Big Data, come volume, varietà e velocità, e a riconoscerne il potenziale nel trasformare le decisioni aziendali. Successivamente, ci addentriamo nei Principi di Data Governance e DFM (Data Framework Management). Questa lezione è fondamentale per capire come gestire e proteggere efficacemente i dati aziendali. Gli studenti apprendono le migliori pratiche per garantire l'integrità, la sicurezza e la qualità dei dati. Introduzione ad Hadoop è il passo successivo, dove si esplora una delle piattaforme più popolari per la gestione e l'analisi dei Big Data. Gli studenti imparano a conoscere l'ecosistema Hadoop, inclusi HDFS (Hadoop Distributed File System) e il modello di programmazione MapReduce. Approfondiamo il concetto di MapReduce & YARN, che sono fondamentali per l'elaborazione distribuita dei dati. Gli studenti apprendono come questi strumenti lavorano insieme per elaborare grandi volumi di dati in modo efficiente e scalabile. Le NoSQL Databases vengono poi introdotte, offrendo una panoramica delle soluzioni scalabili e flessibili per la gestione di dati non strutturati. Questa lezione prepara gli studenti a comprendere quando e come utilizzare database NoSQL rispetto ai tradizionali database relazionali. Il modulo prosegue con un'introduzione approfondita al Machine Learning. In Introduzione al Machine Learning - Prima parte e Seconda parte, gli studenti acquisiscono una comprensione dei concetti fondamentali, dei modelli e degli algoritmi di Machine Learning. Questi concetti vengono esplorati sia in teoria che attraverso applicazioni pratiche, fornendo una base robusta per progetti di Machine Learning reali. Il modulo culmina con applicazioni specifiche di analytics. Social Analytics - Prima Parte e Seconda Parte esplorano l'analisi dei dati derivanti dai social media, mentre Marketing Analytics e Biomedical Analytics mostrano come le tecniche di analisi possono essere applicate in contesti aziendali e biomedici. Infine, Introduzione alla data visualization insegna agli studenti come presentare i dati in modo chiaro e convincente, una competenza essenziale per qualsiasi data scientist. |
6 |
ING-INF/05 |
2 |
Piattaforme per la Data Analysis |
Questo modulo si concentra su tecniche avanzate per l'analisi dei dati e il machine learning, fornendo agli studenti strumenti pratici per gestire e interpretare grandi volumi di dati. Iniziamo con la lezione su MapReduce, un paradigma di programmazione che consente di elaborare grandi dataset in modo distribuito e scalabile. Gli studenti apprendono come suddividere compiti complessi in operazioni di mappatura e riduzione, essenziali per analizzare dati su vasta scala. Le lezioni sull'analisi di itemset frequenti si concentrano sull'identificazione di pattern comuni nei dati. Attraverso queste lezioni, gli studenti imparano a utilizzare algoritmi per trovare associazioni significative in database transazionali, Proseguendo, l'individuazione di elementi simili introduce tecniche per identificare e raggruppare dati simili. Queste competenze sono fondamentali per attività di deduplicazione e clustering, migliorando la qualità dei dati per analisi successive. Gli studenti apprendono metodi per segmentare i dati in gruppi omogenei, facilitando l'identificazione di pattern e tendenze nei dataset. Le lezioni sui sistemi di raccomandazione esplorano algoritmi utilizzati per personalizzare contenuti e prodotti. Gli studenti imparano a creare sistemi che suggeriscono articoli in base alle preferenze e comportamenti degli utenti. La riduzione dimensionale insegna a semplificare i dati riducendo il numero di variabili, pur mantenendo le informazioni essenziali. Questo è particolarmente utile per migliorare la visualizzazione dei dati e le prestazioni dei modelli. L'analisi di grafi di grandi dimensioni permette agli studenti di esplorare strutture di rete complesse. Imparano tecniche per analizzare connessioni e relazioni nei dati, applicabili in vari contesti come i social network e la bioinformatica. Infine, le lezioni su machine learning su larga scala preparano gli studenti ad applicare algoritmi di machine learning a grandi dataset utilizzando piattaforme distribuite. Questo segmento del corso è cruciale per affrontare le sfide del machine learning in ambienti di produzione su larga scala. |
6 |
ING-INF/05 |
3 |
Machine Learning |
In questo modulo, iniziamo con una introduzione al machine learning, dove gli studenti imparano i concetti di base e le applicazioni principali di questa disciplina. Le lezioni sui fondamentali del machine learning sono divise in tre parti, offrendo una comprensione graduale e approfondita delle tecniche e degli algoritmi di machine learning. Si passa poi a esplorare il deep learning in due parti, che introduce reti neurali avanzate e come queste possono essere utilizzate per risolvere problemi complessi. La lezione successiva tratta il bias-variance e gli errori metrici, fornendo strumenti per valutare e migliorare i modelli di machine learning. Le lezioni sulle macchine a vettori di supporto sono articolate in tre parti, dove gli studenti apprendono come funzionano questi potenti algoritmi di classificazione e come applicarli a diversi tipi di dati. L'apprendimento non supervisionato viene poi esplorato, mostrando come trovare pattern nascosti nei dati senza etichette predefinite. L'analisi delle componenti principali e l'analisi fattoriale vengono trattate per ridurre la dimensionalità dei dati, seguite dal reinforcement learning e controllo, che introduce tecniche per addestrare agenti autonomi a prendere decisioni. La teoria dell'apprendimento viene discussa per comprendere i fondamenti teorici che guidano i modelli di machine learning. La regolarizzazione e la selezione del modello sono coperte per evitare l'overfitting e migliorare le prestazioni dei modelli. Infine, il modulo si conclude con un focus sull'analisi biomedica, applicando le tecniche apprese per risolvere problemi specifici nel campo della biomedicina. |
6 |
ING-INF/05 (4 CFU) - ING-INF/06 (2 CFU) |
4 |
Metodi e Strumenti Cloud per i Big Data
|
L'insegnamento intende fornire gli strumenti concettuali e progettuali che permettano al discente di acquisire una comprensione del Cloud Computing e delle sue infrastrutture per gestire grandi moli di dati. Il corso introduce inoltre sistemi distribuiti e ne descrive le caratteristiche fondamentali. L’enfasi del corso verterà sulle tecniche per creare sistemi ed infrastrutture cloud funzionali, versatili e performanti. Gli obiettivi del corso sono quelli di fornire agli studenti i principi e le tecniche per la progettazione delle infrastrutture su cloud. Verterà inoltre su tematiche come la gestione della concorrenza, la programmazione concorrente, la modularità, il monitoraggio, lo scheduling e la comunicazione remota. Saranno inoltre forniti i concetti pratici per la creazione e l’implementazione di sistemi distribuiti su infrastrutture cloud per gestire i big data. |
5 |
ING-INF/05 |
5 |
Workshop in Data Science in Python
|
Questo modulo offre una panoramica delle basi della data science e delle principali tecniche di analisi dei dati, utilizzando Python come linguaggio principale. Si mostrano metodi per analizzare dati complessi, creare modelli predittivi, ridurre la dimensionalità dei dataset e studiare le relazioni tra le variabili. Il modulo copre anche le principali tecniche di machine learning, inclusa la regressione per modellare le relazioni tra variabili, la classificazione per assegnare etichette a nuove osservazioni e il clustering per segmentare i dati in gruppi significativi. La riduzione dimensionale è trattata per mostrare come semplificare i dataset riducendo il numero di variabili senza perdere informazioni significative. L'analisi di grafi e reti introduce gli studenti alle tecniche per modellare e analizzare relazioni complesse tra entità. Infine, la lezione sul web scraping insegna come raccogliere dati da siti web in modo automatizzato, una competenza preziosa per arricchire i dataset e ottenere informazioni aggiornate. |
4 |
ING-INF/05 |
6 |
Modelli di Linguaggio di Grandi Dimensioni (LLM) e Intelligenza Artificiale Generativa |
Questo modulo, erogato in presenza c/o il Campus Reti di Busto Arsizio, offre una panoramica sui concetti e la metodologia dei Modelli di Linguaggio di Grandi Dimensioni (LLM), spiegando come vengano addestrati e utilizzati per comprendere e generare linguaggio naturale. Viene poi introdotta l'Intelligenza Artificiale Generativa, con un focus sui suoi utilizzi pratici in vari settori e sul Prompt Engineering per ottimizzare l'interazione con i modelli generativi. Successivamente si affrontano anche tecniche avanzate come la generazione di dataset sintetici per l'addestramento e la validazione dei modelli di Machine Learning, con particolare attenzione a questioni di privacy e bilanciamento dei dati.
Nella parte più pratica, si esplora l'uso di servizi commerciali per implementare soluzioni di computer vision, natural language processing e knowledge mining. Si fa esperienza insieme di strumenti di document intelligence per sviluppare applicazioni innovative in diversi contesti aziendali. Grazie a un approccio orientato ai risultati, il modulo fornisce le competenze necessarie per integrare l’intelligenza artificiale nei processi decisionali e operativi. |
5 |
|
8 |
Stage |
Descrizione dello stage |
8 |
|
9 |
Project Work |
Descrizione del project work |
5 |
|