Progetto di ricerca Antares
Antares nasce nel 2013 da un progetto di ricerca realizzato con la collaborazione dell’Università di Trento, in particolare del Dipartimento di Ingegneria e Scienza dell’Informazione (DISI), per le competenze legate all’analisi dei big-data.
descrizione del progetto
La componente tecnologica di un SIA (Sistema Informativo Aziendale) è formata da una varietà di tecnologie e dispositivi interconnessi tra loro, caratterizzati da una veloce obsolescenza, e una continua necessità di aggiornamento e manutenzione. Questa varietà di tecnologie permette di realizzare sistemi complessi capaci di adattarsi alle esigenze più varie e quindi con uno scarso grado di standardizzazione, rendendo, al lato pratico, ogni SIA unico.
La centralità del SIA rispetto alle attività aziendali e le normative vigenti relative alla sicurezza dei dati, rendono il SIA un elemento critico dal punto di vista della continuità del business nonché per le implicazioni legali che potrebbero nascere dalla non conformità alle normative come quelle inerenti la privacy.
Per gli MSP (Managed Service Provider), queste problematiche si moltiplicano e si complicano, dovendo gestire una molteplicità di tecnologie, relazioni, rapporti con fornitori, per Clienti diversi.
All’esigenza del MSP di standardizzare sistemi e procedure per facilitare la gestione, si contrappone l’esigenza del Cliente di disporre di tecnologie, sistemi e procedure personalizzati.
Diventa importante la capacità del MSP di rispondere con tecnologie adeguate che permettano di personalizzare il servizio e, ancora più importante, la capacità di intercettare le necessità del Cliente e i possibili ambiti di miglioramento, non solo in termini tecnologici ma anche economico-organizzativi.
Per l’efficace erogazione dei propri servizi, un Managed Service Provider deve sviluppare e migliorare costantemente la propria organizzazione sia in ambito tecnico che in quello commerciale: il primo, utile al mantenimento del corretto grado di conoscenza tecnologica, il secondo, di fondamentale importanza per mantenere alto il grado di consapevolezza sulle esigenze del cliente.
Le possibili variazioni che si dovessero verificare negli ambiti sopra elencati nonché le informazioni raccolte anche in condizioni di normale esercizio del SIA, possono essere studiati nel tentativo di correlarli a schemi riproducibili ed interpretabili. Tali schemi definiscono modelli comportamentali e costituiscono un’importante base di conoscenza per l’area commerciale e sistemistica per il MSP.
L’intero progetto di ricerca, infatti, pone le sue basi sulle modalità di gestione del SIA nonché sui dati e sulle euristiche su questi basate. Grazie a strumenti di Data Mining, opportunamente integrati con tecniche di Machine Learning, è possibile risalire ad un modello che descrive modelli d’uso e di comportamento funzionale del SIA in oggetto, di poterne
interpretare le variazioni, di poterne predire eventuali limitazioni e percorsi evolutivi all’individuazione di modelli comportamentali.
L’area commerciale, quella sistemistica, quella dell’assistenza e quella manageriale potranno quindi interagire con cliente su basi informative maggiormente consolidate comprendendo meglio i bisogni del cliente e attuando interventi più adeguati ed efficaci.
Il progetto di ricerca iniziato nel 2013 ha come obiettivo realizzare un sistema informativo per società di servizi IT e MSP (Managed Service Provider) che permetta di analizzare le modalità di interazione tra i vari soggetti che a vario titolo interagiscono con il sistema informativo, ne permetta l’analisi dell’uso e ne evidenzi le variazioni nel tempo.
I principali risultati prefissati erano:
- la definizione di un modello di raccolta dati conforme alle normative, utile allo sviluppo della piattaforma per l’elaborazione delle informazioni e efficace nella consultazione dei dati in linea con quanto previsto dagli Obiettivi;
- la definizione di un modello per la rappresentazione delle interazioni tra gli attori coinvolti e la variazione di questi nel tempo;
- la dimostrazione dell’efficacia di quanto ottenuto mediante lo sviluppo di un prototipo di piattaforma destinata all’analisi dei dati raccolti generando benchmark di confronto.
Per raggiungere gli obiettivi sopra elencati abbiamo sviluppato tre sistemi completamente integrati tra di loro:
Antares come sistema per la gestione del Service Management e interfaccia verso gli utenti;
Quark come Agent Windows di raccolta dati sui dispositivi periferici;
Una specifica piattaforma di analisi dei Big data.
Al termine della ricerca possiamo dire che tutti i risultati sono stati raggiunti e con le successive fasi di ingegnerizzazione siamo riusciti a creare un sistema modulare e flessibile che ci permette di integrare le nuove tecnologie e i nuovi trend che costantemente il mercato propone.
Il modello che abbiamo individuato e implementato in Antares è estremamente flessibile ma al tempo stesso molto rigoroso e ci ha permesso di estendere l’utilizzo di Antares anche in contesti estremamente diversi tra loro.
le principali sfide del progetto
l’eterogeneità dei dati e l’eterogeneità delle fonti dati.
Per effettuare le analisi sopra descritte si dovranno infatti utilizzare
- i dati prodotti nei log dai vari sistemi informatici. Tale tipologia di dati è molto diversificata per gli standard di riferimento utilizzati per il tracciamento delle attività che possono contenere un livello di dettaglio e delle modalità descrittive molto differenti;
- i dati di natura commerciale o inerenti la manutenzione del SIA rilevabili direttamente dai sistemi di invio degli ordini o dal sistema di tracciamento dell’Help Desk aziendale offerto quale servizio ai clienti;
la quantità dei dati su cui effettuare le analisi sopra elencate comporta la valutazione di alcune tipologie di problemi quali:
- l’individuazione delle modalità di raccolta e memorizzazione dei dati;
- la crescita degli investimenti sull’hardware e sui sistemi IT coerentemente con l’impiego degli algoritmi di data mining utilizzati per effettuare le analisi sulle grandi moli di dati estratte dal SIA;
- il costante processo di innovazione delle tecnologie e dei dati che le caratterizzano nel funzionamento e nell’uso, impone, a sua volta, un continuo aggiornamento dell’analisi e l’adeguamento degli algoritmi di sintesi dei dati. L’arco temporale di svolgimento del presente progetto è sufficientemente esteso da imporre un costante monitoraggio dei cambiamenti e la relativa adozione di nuove strategie nello svolgimento delle attività di progetto;
la riservatezza delle informazioni che condiziona fortemente le modalità di raccolta e memorizzazione dei dati rilevati inerente il SIA in quanto dovranno ottemperare alle normative vigenti in materia di rispetto della privacy e quanto previsto dalle discipline giuslavoristiche a tutela dei lavoratori utenti del SIA stesso;
la costante evoluzione delle tecnologie, dell’uso del SIA e delle attività dei clienti che richiede lo studio e l’adozione di un’architettura nonché di modelli di descrizione delle informazioni che consentano un costante adeguamento del sistema oggetto del progetto in grado di garantire costantemente continuità dell’adeguatezza delle informazioni rilevate al fine di rendere sempre possibile il perseguimento degli obiettivi aziendali.
La prima fase del progetto di ricerca è partita con uno scouting sul mercato di prodotti, metodologie e tecnologie che potessero essere utili nelle attività di definizione dei requisiti di Antares, con lo scopo di ottenere un prodotto finale che fosse competitivo e in linea con le sempre più stingenti normative in tema di sicurezza e privacy dei dati.
Abbiamo ritenuto fondamentale, per non realizzare un prodotto già vecchio, individuare dei modelli consolidati attorno ai quali sviluppare Antares, per ridurre il rischio derivante dalla forte evoluzione tecnologia in atto in questi anni. Dopo un lungo confronto all’interno del gruppo di lavoro abbiamo deciso di sviluppare Antares tenendo come pilastri delle ISO, in particolare la ISO20001 (gestione servizi ICT), la ISO27001 (gestione della sicurezza dei dati), la ISO31001 (gestione del rischio) e la ISO9001 (sistemi qualità). Questi standard sono stati presi come riferimento da tutto il settore ICT, e le nuove tecnologie prenderanno come riferimento questi standard.
sperimentazione
L’attività di sperimentazione è diventata parte integrante dello sviluppo del progetto ed è partita subito dopo lo sviluppo dei primi moduli software.
Abbiamo realizzato un ambiente di test coinvolgendo 6 aziende con sistemi non critici, per un totale di circa 80 utenti e 10 sistemi tra client e server. Durante questa fase sono state operate numerose modifiche al software per aumentarne l’affidabilità ed implementare le nuove funzionalità per raccogliere nuove tipologie di dati.
Durante la fase di sperimentazione sono stati messi a punto i vari parametri di configurazione per ottimizzare la raccolta e il trasferimento dei dati. Il quantitativo di dati raccolto si è dimostrato subito molto elevato sia dal punto di vista della varietà sia dal punto di vista della variabilità. Dall’analisi dei dati è emerso, fin da subito, che il vero valore aggiunto risiedeva nella possibilità di analizzare i dati relazionati con i dati prodotti durante l’erogazione dei servizi di assistenza ed in particolare con le interazioni tra i soggetti coinvolti nel servizio. La raccolta delle informazioni riguardanti i servizi erogati, ed in particolar modo, le interazioni tra i vari soggetti che girano attorno al sistema informativo del Cliente non è stata cosa facile. Siamo partiti tentando di raccogliere i dati dai software presenti in azienda ma ci siamo subito accorti che, nonostante ne avessimo la totale padronanza, i sistemi non contenevano i dati necessari per una corretta rappresentazione degli stessi e delle loro interazioni.
Appena pronte le release di Antares (la componente web) che implementa la possibilità di mappare le interazioni tra soggetti (commerciali, tecnici, clienti, sistemi) abbiamo iniziato ad utilizzarlo sulle aziende oggetto della sperimentazione in corso del sistema Quark. Con la stessa modalità utilizzata in precedenza abbiamo sperimentato le funzionalità e raccolto i miglioramenti da implementare. Questa è stata una fase particolarmente complessa, non tanto tecnicamente, ma dal punto di vista dell’introduzione di un nuovo sistema per la gestione di questi clienti. Il particolare il sistema, specialmente nelle prime versioni, era giudicato di non facile utilizzo e molto macchinoso. Dopo una serie di miglioramenti, in gran parte legati all’usabilità e dell’interfaccia utente, abbiamo esteso l’utilizzo di Antares ad un numero più alto di utenti per testarne l’architettura interna. In particolare la sperimentazione di Antares ha generato: Trattative, Riunioni, Eventi, Attività, Progetti, Servizi.
Durante tutta la fase di sperimentazione si è fatto largo uso dello strumento Microsoft Power BI che permette di esplorare con relativa semplicità i dati prodotti. In particolare, dai dati inseriti in Antares siamo riusciti ad ottenere una serie di statistiche e clusterizzazioni a completamento di quelle generate dal sistema Quark.
La sperimentazione ha confermato in pieno che il modello di rappresentazione delle relazioni implementato permette effettivamente di rappresentare, con grande flessibilità, tutte le interazioni tra i soggetti e i sistemi che fanno parte del Sistema Informativo Aziendale, siano esse ricavate da sistemi informatici, mediante l’utilizzo dell’agent Quark, o siano esse ricavate dall’utilizzo della piattaforma Antares.
Il codice sorgente del sistema di raccolta ed elaborazione dati e i dataset utilizzati sono scaricabili gratuitamente previa richiesta da inviare a saidea@saidea.it
le componenti di Antares