12.07.2015 Views

Business Intelligence: un caso di studio nel settore cosmetico

Business Intelligence: un caso di studio nel settore cosmetico

Business Intelligence: un caso di studio nel settore cosmetico

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

iiiA Elena, che mi è stata vicinodurante questi anni <strong>di</strong> stu<strong>di</strong>o.


vRingraziamentiDesidero innanzitutto ringraziare la mia famiglia, Anna, Daniele, Francesco e Veronicaper avermi sempre sostenuto durante il mio percorso <strong>di</strong> stu<strong>di</strong>o.Ringrazio l’azienda Sinfo-One s.p.a. per avermi permesso <strong>di</strong> effettuare lo stage aziendalesu cui si basa questo lavoro <strong>di</strong> tesi.Un particolare ringraziamento al Dott. Fabio Morsiani che è stato il mio tutor aziendalee grazie al quale ho conosciuto il mondo della <strong>Business</strong> <strong>Intelligence</strong>.Desidero inoltre ringraziare Leonardo Barbato, Sara Cangini, Emanuele Marchesi, AndreaMessetti, Sara Saccò e Antonio Viscomi per il supporto e la formazione aziendale.Ringrazio il Prof. Giulio Destri per il tempo de<strong>di</strong>catomi durante questi mesi <strong>di</strong> lavoroe per i suggerimenti che ha saputo darmi.Infine <strong>un</strong> grazie a tutti i pagliacci del <strong>di</strong>partimento: Fede Ferretti, Fede Bacchi, Gando,Leo, Matte, Marti, Paolo, Ali, Tocci, Ila, Jessica, Bea, Ponz e, perché no, anche ilDisa.


viiPresentazione dell’aziendaSinfo One S.p.A. nasce il 1 ◦ settembre 2007, dalla Divisione Industria <strong>di</strong> Sinfo Pragmae si rivolge, in particolare, alle me<strong>di</strong>e aziende italiane fornendo soluzioni ERP estese,consulenza <strong>di</strong>rezionale, organizzativa, <strong>di</strong> processo e tecnologica nonché servizi <strong>di</strong> systemintegration.Flessibilità, continui investimenti in ricerca e formazione e attenzione alle esigenze deiclienti costituiscono le basi del suo progetto <strong>di</strong> sviluppo.L’offerta ERP è basata sulla piattaforma proprietaria Si Fides e sulla piattaforma OracleJD Edwards Enterprise One che Sinfo One completa con il proprio verticale per il Food& Beverage.Sinfo One opera su tutto il territorio nazionale attraverso <strong>un</strong> team <strong>di</strong> oltre 100 professionisticon esperienze nei <strong>di</strong>versi settori <strong>di</strong> mercato e profonde competenze sui relativiprocessi specifici.Grazie alla specifica conoscenza della piattaforma Oracle JDEdwards ed alle competenzeed esperienze dei propri team <strong>di</strong> professionisti è in grado <strong>di</strong> offrire soluzioni verticalizzatee integrate a Enterprise Content Managemet, Enterprise Performance Management e<strong>Business</strong> <strong>Intelligence</strong>.Sinfo One e OracleSinfo One è Platinum Partner <strong>di</strong> Oracle e Oracle Accelerate Partner per il Food & Beverage.Si è inoltre aggiu<strong>di</strong>cata l’e<strong>di</strong>zione 2010 degli Oracle Partner Specialization Awardsper la regione Europa, Me<strong>di</strong>o Oriente e Africa. Un grande successo per l’azienda che hacosì superato la concorrenza <strong>di</strong> altre 87 società provenienti da 22 Paesi, tutte can<strong>di</strong>datealla conquista del riconoscimento.


viiiEsperienza e competenzaI professionisti Sinfo One hanno competenze estese e specializzate, sono attenti ai bisognidei clienti e abituati a lavorare con obiettivi ambiziosi. Particolare attenzione, con<strong>di</strong>visioni e laboratori <strong>di</strong> ricerca (Isi Lab) de<strong>di</strong>cati, è data a tematiche <strong>di</strong> ECM, EPM, BIe SCM.Sul fronte del Supply Chain Planning il team <strong>di</strong> esperti Sinfo One ha messo a p<strong>un</strong>to<strong>un</strong>a metodologia proprietaria: Step (Sistemi Tecnologici <strong>di</strong> Pianificazione) che nasce daknow-how, esperienza, efficienza e selezione delle migliori tecnologie.Sinfo One numeriSinfo One ha chiuso il 2010 con <strong>un</strong> fatturato <strong>di</strong> 9,5 milioni (<strong>nel</strong> 2009 il fatturato è stato<strong>di</strong> 9 milioni <strong>di</strong> euro), risultato buono se si tiene conto della particolare situazione <strong>di</strong> crisiche attraversa l’economia mon<strong>di</strong>ale.Il budget 2011 prevede <strong>un</strong> fatturato <strong>di</strong> 10,5 milioni e i dati dei primi mesi sono in lineacon il budget.Sinfo One SPA: Via Benedetta 77/a - 43122 Parma - Tel. 0521.9371, Fax 0521.775824info@sinfo-one.it - www.sinfo-one.it


ixSommarioL’aumento esponenziale del volume dei dati operazionali ha reso il calcolatore l’<strong>un</strong>ico supportoadatto al processo decisionale, inoltre l’utilizzo massiccio <strong>di</strong> tecniche <strong>di</strong> analisi deidati aziendali ha reso il sistema informativo <strong>un</strong> elemento strategico per la realizzazionedel business. Per questi motivi il ruolo dell’informatica è passato da passivo strumentoper la registrazione delle operazioni, a fattore decisivo per l’in<strong>di</strong>viduazione <strong>di</strong> elementicritici dell’organizzazione e <strong>di</strong> potenziali aree <strong>di</strong> business.Il termine <strong>Business</strong> <strong>Intelligence</strong> (BI) venne introdotto <strong>nel</strong> 1989 da Howard Dresner, perin<strong>di</strong>care <strong>un</strong> insieme <strong>di</strong> strumenti e procedure che consentono a <strong>un</strong>’azienda <strong>di</strong> trasformare ipropri dati <strong>di</strong> business in informazioni utili al processo decisionale, da rendere <strong>di</strong>sponibilialla persona giusta e <strong>nel</strong> formato idoneo. Le informazioni ottenute sono utilizzate daidecisori aziendali (decision maker) per definire e supportare le strategie <strong>di</strong> business.Lo strumento principe per la BI è stato fino a oggi il data warehouse (DW), al qualevanno riconosciuti meriti come la capacità <strong>di</strong> gestire serie storiche dei dati o <strong>di</strong> effettuareanalisi multi<strong>di</strong>mensionali, basandosi su <strong>un</strong> modello semplice e che può essere facilmenteassimilato dai manager. Caratteristiche come queste hanno facilitato l’ampia <strong>di</strong>ffusionedei sistemi <strong>di</strong> data warehousing e hanno favorito la maturazione degli utenti che, <strong>un</strong>a voltasfruttate appieno le sue potenzialità, cominciano a percepirne i limiti e <strong>di</strong> conseguenzarichiedono nuove soluzioni in grado <strong>di</strong> sod<strong>di</strong>sfare l’accresciuta richiesta <strong>di</strong> informazioni.In particolare sorge la necessità <strong>di</strong> soluzioni che consentano analisi su dati provenienti dasorgenti informative eterogenee, con aggiornamenti più rapi<strong>di</strong> rispetto a quelli del DW,che <strong>di</strong>fficilmente hanno <strong>un</strong>a perio<strong>di</strong>cità inferiore al giorno, e che consentano ai decionmaker la possibilità <strong>di</strong> “prevedere il futuro”.Il data mining, le analisi what-if e le attività <strong>di</strong> <strong>Business</strong> Performance Management(BPM), sono alc<strong>un</strong>e delle tecniche che vengono utilizzate per sod<strong>di</strong>sfare i limiti che isistemi <strong>di</strong> data warehousing presentano.La tecnologia Oracle BI 11g fornisce <strong>un</strong>a gamma completa <strong>di</strong> soluzioni per la businessintelligence. Tuttavia <strong>nel</strong> <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o realizzato utilizzeremo le sole f<strong>un</strong>zionalità <strong>di</strong>analisi su dati provenienti da <strong>un</strong> data warehouse.


INDICE1 I dati e l’azienda 11.1 Processi e catena del valore . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.1 La catena del valore <strong>di</strong> Porter . . . . . . . . . . . . . . . . . . . . 31.1.2 La piramide <strong>di</strong> Anthony . . . . . . . . . . . . . . . . . . . . . . . 41.2 I principali tipi <strong>di</strong> sistemi usati <strong>nel</strong>le aziende . . . . . . . . . . . . . . . . 61.3 I DBMS ed il loro ruolo . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.3.1 DBMS transazionali (OLTP) . . . . . . . . . . . . . . . . . . . . . 101.3.2 DBMS per l’analisi (OLAP) . . . . . . . . . . . . . . . . . . . . . 121.3.3 Perché è necessario <strong>di</strong>stinguere . . . . . . . . . . . . . . . . . . . . 132 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong> 152.1 Data warehousing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.1.1 Componenti <strong>di</strong> <strong>un</strong> data warehouse . . . . . . . . . . . . . . . . . . 182.1.2 Architetture per il data warehousing . . . . . . . . . . . . . . . . 202.1.3 Gli strumenti ETL . . . . . . . . . . . . . . . . . . . . . . . . . . 242.2 Il modello multi<strong>di</strong>mensionale . . . . . . . . . . . . . . . . . . . . . . . . . 262.2.1 Modellazione concettuale: il Dimensional Fact Model . . . . . . . 282.2.2 Modellazione logica . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2.2.1 I sistemi ROLAP . . . . . . . . . . . . . . . . . . . . . . 312.2.2.2 I sistemi MOLAP . . . . . . . . . . . . . . . . . . . . . . 342.2.2.3 Slowly Changing Dimensions (SCD) . . . . . . . . . . . 35


xiiINDICE2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) . . . . . . . . . . . . . . . . . . . . . . . . . 372.3.1 Accedere al data warehouse . . . . . . . . . . . . . . . . . . . . . 402.3.2 <strong>Business</strong> <strong>Intelligence</strong>: oltre il data warehouse . . . . . . . . . . . . 442.3.2.1 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . 452.3.2.2 Analisi what-if . . . . . . . . . . . . . . . . . . . . . . . 482.3.2.3 <strong>Business</strong> Performance Management (BPM) . . . . . . . 492.3.3 Ciclo delle analisi <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> . . . . . . . . . . . . . . 503 La tecnologia Oracle BI 11g 533.1 Oracle e la business intelligence . . . . . . . . . . . . . . . . . . . . . . . 543.2 Architettura logica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583.3 Installazione del prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . 633.4 Componenti <strong>di</strong> front-end . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.4.1 Analisi e reportistica . . . . . . . . . . . . . . . . . . . . . . . . . 663.4.2 Dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.4.3 Scorecard e Strategy Management . . . . . . . . . . . . . . . . . . 693.4.4 BI Publisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703.4.5 Actionable <strong>Intelligence</strong> . . . . . . . . . . . . . . . . . . . . . . . . 703.4.6 BI Mobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.5 L’Administration Tool . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.6 Comparazione con gli altri competitor . . . . . . . . . . . . . . . . . . . . 753.6.1 Prodotti open source . . . . . . . . . . . . . . . . . . . . . . . . . 794 Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong>per l’azienda Cadey 814.1 Presentazione dell’azienda . . . . . . . . . . . . . . . . . . . . . . . . . . 814.2 Struttura data center Cadey . . . . . . . . . . . . . . . . . . . . . . . . . 834.3 Struttura del data mart ven<strong>di</strong>te . . . . . . . . . . . . . . . . . . . . . . . 854.4 Costruzione dei metadati . . . . . . . . . . . . . . . . . . . . . . . . . . . 864.4.1 Livello fisico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 864.4.2 Livello logico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.4.3 Livello <strong>di</strong> presentazione . . . . . . . . . . . . . . . . . . . . . . . . 924.4.4 Validazione del repository . . . . . . . . . . . . . . . . . . . . . . 924.5 Costruzione della reportistica . . . . . . . . . . . . . . . . . . . . . . . . 93Conclusioni 95


CAPITOLO 1I dati e l’aziendaUn’azienda è <strong>un</strong>a struttura sociale stabile e formale che trae risorse dall’ambiente e leelabora per produrre <strong>un</strong> risultato. Il capitale e la forza lavoro sono i principali fattori <strong>di</strong>produzione forniti dall’ambiente. L’azienda trasforma questi input in prodotti e servizitramite la f<strong>un</strong>zione <strong>di</strong> produzione. I prodotti e i servizi vengono poi consumati dall’ambiente.Molte aziende operano in <strong>un</strong> contesto complesso ed in continua trasformazione: le nuoveopport<strong>un</strong>ità che si vengono a creare devono essere valutate rapidamente con sempre maggiorfrequenza per non rischiare <strong>di</strong> perdere la propria competitività. In questo contesto,le tecnologie dell’informazione e della com<strong>un</strong>icazione (ICT) stanno contribuendo a mo<strong>di</strong>ficareil modo <strong>di</strong> lavorare e <strong>di</strong> vivere dell’azienda, attraverso nuove e sofisticate soluzioni<strong>di</strong> elaborazione e trasmissione dell’informazione. La <strong>di</strong>sponibilità, a costi sempre minori,<strong>di</strong> tali soluzioni sta provocando significativi cambiamenti soprattutto per quelle attività,sempre più numerose, che comportano gestione <strong>di</strong> informazione.La costruzione dell’informazione ed il suo uso entro l’azienda, a partire da dati “grezzi”<strong>di</strong> ingresso, può avvenire attraverso quattro sta<strong>di</strong> successivi qui <strong>di</strong> seguito riportati:• Dati: sono l’insieme <strong>di</strong> fatti, il risultato <strong>di</strong> <strong>un</strong>a misurazione, la materia prima dell’informazionein relazione agli oggetti del mondo reale. Non possiedono significatoal <strong>di</strong> là della loro esistenza. Possono essere scoperti, ricercati, raccolti e prodotti.


2 I dati e l’azienda• Informazione: l’informazione conferisce <strong>un</strong> significato ai dati, grazie al fatto che lipone in <strong>un</strong>a relazione reciproca e li organizza secondo dei modelli. Per trasformare idati in utili informazioni, <strong>un</strong>’impresa deve impegnare risorse per organizzare i datiin categorie <strong>di</strong> comprensione, come rapporti relativi ai totali <strong>di</strong> ven<strong>di</strong>ta mensili,giornalieri, regionali o per negozio.• Conoscenza: la conoscenza è informazione rielaborata ed applicata. È <strong>un</strong> eventocognitivo e persino fisiologico che ha luogo <strong>nel</strong>la mente delle persone, ma allo stessotempo viene conservato in librerie e registrazioni, con<strong>di</strong>viso, ad esempio, per mezzo<strong>di</strong> conferenze, e conservato dalle aziende sotto forma <strong>di</strong> processi gestionali co<strong>di</strong>ficatie documentati e know-how dei <strong>di</strong>pendenti. La conoscenza presente <strong>nel</strong>la mente dei<strong>di</strong>pendenti e che non sia documentata prende il nome <strong>di</strong> conoscenza tacita, mentrequella documentata viene definita conoscenza esplicita.• Saggezza: la saggezza è l’esperienza collettiva ed in<strong>di</strong>viduale dell’applicazione dellaconoscenza alla soluzione <strong>di</strong> problemi. Essa implica il dove, come e quando applicarela conoscenza. Non è possibile creare la saggezza allo stesso modo <strong>di</strong> come vengonocreati i dati e le informazioni, e non è possibile con<strong>di</strong>viderla con gli altri, comeinvece avviene per la conoscenza.Per l’impresa la conoscenza è <strong>un</strong> tipo <strong>di</strong> bene <strong>di</strong>verso, per esempio, dagli e<strong>di</strong>fici o dai benifinanziari; inoltre la conoscenza è <strong>un</strong> fenomeno complesso e il processo <strong>di</strong> gestione chela riguarda ha molti aspetti. Possiamo inoltre riconoscere che il nucleo delle competenzebasate sulla conoscenza <strong>di</strong> <strong>un</strong>’impresa, ossia le due o tre cose che <strong>un</strong>’azienda fa meglio,sono beni organizzativi fondamentali. Sapere come fare le cose in modo efficiente adottandosoluzioni che le altre organizzazioni non possono riprodurre è <strong>un</strong>a fonte primaria<strong>di</strong> profitto e <strong>di</strong> vantaggio competitivo che i concorrenti non possono facilmente acquistaresul mercato.La collaborazione e la com<strong>un</strong>icazione con professionisti ed esperti, la creazione <strong>di</strong> nuovaconoscenza, l’agevolazione dell’accesso alla conoscenza e l’uso <strong>di</strong> quest’ultima per migliorarei processi gestionali e <strong>di</strong>rezionali sono <strong>di</strong>ventati elementi vitali per l’innovazione e lasopravvivenza delle imprese [LL06].


1.1 Processi e catena del valore 31.1 Processi e catena del valoreCon il termine “processo” si fa riferimento a <strong>un</strong> insieme <strong>di</strong> attività attraverso le qualile risorse <strong>di</strong> <strong>un</strong>’impresa o, più in generale, <strong>di</strong> <strong>un</strong>’organizzazione (in<strong>di</strong>vidui e mezzi) realizzanola mission organizzativa trasformando input (materiali o immateriali) in output,ossia in prodotti/servizi che trasferiscono valore al fruitore dei prodotti/servizi stessi. Ilconcetto <strong>di</strong> valore è fondamentale, in quanto <strong>un</strong>o degli scopi fondamentali della modellazionetramite processi delle attività aziendali è proprio <strong>un</strong> ausilio alla misurazione delvalore prodotto. In ciasc<strong>un</strong> processo vengono tipicamente coinvolte competenze e <strong>un</strong>itàorganizzative <strong>di</strong>verse che rispondono al responsabile del processo (process owner), figuraalla quale sono stati affidati la responsabilità e il coor<strong>di</strong>namento del processo stesso.Figura 1.1: Rappresentazione <strong>di</strong> <strong>un</strong> processo aziendale1.1.1 La catena del valore <strong>di</strong> PorterIn ogni organizzazione è possibile in<strong>di</strong>viduare alc<strong>un</strong>i processi fondamentali. La catenadel valore <strong>di</strong> Porter rappresenta <strong>un</strong>a classificazione dei processi, modellizzando il f<strong>un</strong>zionamentodell’intera azienda come <strong>un</strong>a successione <strong>di</strong> processi. I processi sono sud<strong>di</strong>visiin: [Des07]


4 I dati e l’azienda• Buy side: come acquisti/approvvigionamenti, ossia processi il cui output provienedai fornitori;• Inside: ossia aventi sia input sia output interni all’azienda, che possono essere ulteriormentesud<strong>di</strong>visi tra processi primari, che sono <strong>di</strong>rettamente legati alla produzionedel valore del core business dell’azienda e processi ausiliari, che non generano<strong>di</strong>rettamente <strong>un</strong> valore, ma producono quei servizi senza i quali l’organizzazionenon potrebbe operare;• Sell side: il cui output è rivolto <strong>di</strong>rettamente ai clienti esterni dell’azienda.1.1.2 La piramide <strong>di</strong> AnthonyLa piramide <strong>di</strong> Anthony, illustrata in Figura 1.2 è <strong>un</strong>a modalità <strong>di</strong> rappresentazione dell’organizzazione,introdotta con l’obiettivo specifico <strong>di</strong> classificare le attività tipicamentesvolte <strong>nel</strong>l’organizzazione stessa e identificare il ruolo dei sistemi informatici a supporto<strong>di</strong> tali attività e la progettazione del loro sviluppo. Nonostante l’inarrestabile e ra<strong>di</strong>caleinnovazione delle ICT questo modello ha sostanzialmente mantenuto intatta la vali<strong>di</strong>tàdella sua formulazione originaria <strong>nel</strong> corso del tempo.Il modello <strong>di</strong> Anthony, sviluppato <strong>nel</strong> 1965, <strong>di</strong>stingue tre <strong>di</strong>verse tipologie <strong>di</strong> attività,ogn<strong>un</strong>a delle quali interagisce con quella a<strong>di</strong>acente realizzando cicli <strong>di</strong> pianificazione econtrollo attraverso i quali verificare risultati e decidere azioni correttive. Tali attivitàsono: [PM05]• Attività strategiche: concorrono all’identificazione degli obiettivi primari dell’aziendanei confronti del mercato e della concorrenza;• Attività tattiche: traducono gli obiettivi strategici in obiettivi economici, definendole previsioni a me<strong>di</strong>o termine e verificandone perio<strong>di</strong>camente l’attuazione;• Attività operative: attuano i piani definiti occupandosi dello svolgimento delleattività correnti.


1.1 Processi e catena del valore 5Figura 1.2: Le attività aziendali secondo AnthonyUna tale classificazione è dovuta al fatto che attività appartenenti a ciasc<strong>un</strong>a tipologiapossiedono caratteristiche com<strong>un</strong>i per quanto riguarda il fabbisogno informativo che richiedonoper supportare in modo adeguato il loro svolgimento. I criteri per identificaretali caratteristiche sono: [TRS03]• Orizzonte temporale <strong>di</strong> riferimento: è l’intervallo <strong>di</strong> tempo che intercorre tradue esecuzioni successive <strong>di</strong> <strong>un</strong>a determinata attività. Le attività strategiche hannoeffetto <strong>nel</strong> “l<strong>un</strong>go termine”, mentre le attività operative solitamente hanno effettoimme<strong>di</strong>ato;• Orientamento all’esterno: è l’entità dell’impatto che le attività hanno al <strong>di</strong> fuoridei confini dell’organizzazione. Le attività strategiche hanno effetto sul contestocompetitivo in cui l’organizzazione opera, mentre le attività operative sono confinate<strong>nel</strong>l’interno dell’organizzazione;• Discrezionalità: è il grado <strong>di</strong> arbitrio con il quale si può decidere come e quandosvolgere <strong>un</strong>’attività. È massima a livello strategico e <strong>di</strong>minuisce progressivamente<strong>nel</strong>le attività <strong>di</strong> più basso livello. Nelle attività operative le procedure <strong>di</strong> esecuzionesono il più possibile precise;


6 I dati e l’azienda• Ripetitività: è la frequenza con cui <strong>un</strong>’attività viene svolta. Un’alta ripetitivitàcaratterizza le attività operative;• Preve<strong>di</strong>bilità: è correlata alla ripetitività. È tipica delle attività operative, poichéproducono risultati preve<strong>di</strong>bili a priori e la loro esecuzione è prevista a priori neitempi e <strong>nel</strong>la modalità;• Ruoli organizzativi coinvolti: Le attività strategiche sono <strong>di</strong> competenza della<strong>di</strong>rezione aziendale. Le attività <strong>di</strong> programmazione e controllo sono assegnate alle<strong>di</strong>rezioni f<strong>un</strong>zionali o <strong>di</strong> <strong>di</strong>visione. Le attività operative sono condotte dal personaleesecutivo.In particolare questo ultimo criterio è alla base della scomposizione dell’organizzazione,che secondo <strong>un</strong> approccio <strong>di</strong> tipo gerarchico può essere rappresentata con la piramidein<strong>di</strong>cata.1.2 I principali tipi <strong>di</strong> sistemi usati <strong>nel</strong>le aziendePoiché in <strong>un</strong>’azienda esistono interessi, specializzazioni e livelli <strong>di</strong>fferenti, esistono anchetipi <strong>di</strong> sistemi <strong>di</strong>versi. Non esiste <strong>un</strong> sistema in grado <strong>di</strong> fornire tutte le informazioni <strong>di</strong>cui ha bisogno <strong>un</strong>’azienda.Come abbiamo visto prima, secondo il modello <strong>di</strong> Anthony <strong>un</strong>’azienda può essere scompostain tre livelli, ad ogn<strong>un</strong>o dei quali corrispondono <strong>di</strong>fferenti tipologie <strong>di</strong> attività:strategiche, tattiche ed operative. È inoltre possibile osservare <strong>un</strong>’ulteriore sud<strong>di</strong>visionein aree f<strong>un</strong>zionali, come per esempio ven<strong>di</strong>te e marketing, produzione, gestione finanziariae contabilità e risorse umane. I sistemi informativi hanno lo scopo <strong>di</strong> servire questi <strong>di</strong>versiinteressi <strong>nel</strong>l’azienda.I sistemi informativi a supporto delle attività strategiche aiutano i senior managerad affrontare i problemi strategici e a valutare le tendenze a l<strong>un</strong>go termine sia <strong>nel</strong>l’aziendasia <strong>nel</strong>l’ambiente esterno. La loro principale preoccupazione è far corrispondere i cambiamenti<strong>nel</strong>l’ambiente esterno con le capacità organizzative dell’azienda. “Quali saranno itassi <strong>di</strong> occupazione tra cinque anni?”. “Quali saranno le tendenze dei costi in questocampo a l<strong>un</strong>go termine e come si posizionerà la nostra azienda?”. “Quali prodotti dovremoprodurre nei prossimi cinque anni?”.


1.2 I principali tipi <strong>di</strong> sistemi usati <strong>nel</strong>le aziende 7I sistemi informativi a supporto dell’attività manageriale favoriscono le attività<strong>di</strong> monitoraggio, <strong>di</strong> controllo, decisionali e amministrative dei middle manager. La principaledomanda a cui devono rispondere questi sistemi è: “Le cose f<strong>un</strong>zionano bene?”. Ingenere i sistemi a livello manageriale forniscono report perio<strong>di</strong>ci piuttosto che informazioniistantanee sulle operazioni.I sistemi informativi operativi supportano i manager per la registrazione delle attivitàelementari e delle transazioni che si svolgono <strong>nel</strong>l’azienda. Lo scopo principale deisistemi a questo livello è quello <strong>di</strong> supportare le attività <strong>di</strong> routine e registrare il flussodelle transazioni all’interno dell’azienda.Normalmente in <strong>un</strong>’azienda esistono sistemi informativi operativi, <strong>di</strong> supporto alle attivitàmanageriali e <strong>di</strong> supporto alle attività strategiche per ogn<strong>un</strong>a delle aree f<strong>un</strong>zionali(alc<strong>un</strong>i esempi sono stati riportati sopra).Per esempio la f<strong>un</strong>zione ven<strong>di</strong>te sarà in generale dotata <strong>di</strong>:• <strong>un</strong> sistema operativo per registrare i dati <strong>di</strong> ven<strong>di</strong>ta quoti<strong>di</strong>ani e per elaborare glior<strong>di</strong>ni;• <strong>un</strong> sistema informativo <strong>di</strong> supporto all’attività manageriale avrà <strong>un</strong> sistema perregistrare i dati <strong>di</strong> ven<strong>di</strong>ta mensili sud<strong>di</strong>visi per area geografica e in<strong>di</strong>care i luoghiin cui le ven<strong>di</strong>te hanno superato o non hanno raggi<strong>un</strong>to i livelli previsti;• <strong>un</strong> sistema informativo <strong>di</strong> supporto alle attività strategiche che prevede le tendenze<strong>di</strong> ven<strong>di</strong>ta <strong>nel</strong>l’arco <strong>di</strong> cinque anni.I principali tipi <strong>di</strong> sistemi informativi sono:TPS (Transaction Processing System):I sistemi <strong>di</strong> elaborazione delle transazioni sono i sistemi operativi <strong>di</strong> base che servono illivello operativo dell’azienda. Un sistema <strong>di</strong> elaborazione delle transazioni è <strong>un</strong> sistemacomputerizzato che svolge e registra le transazioni <strong>di</strong> routine necessarie quoti<strong>di</strong>anamenteper condurre le attività aziendali. Per esempio, può trattarsi <strong>di</strong> sistemi per l’inserimento<strong>di</strong> or<strong>di</strong>ni, <strong>di</strong> prenotazione alberghiera, <strong>di</strong> calcolo degli stipen<strong>di</strong>, <strong>di</strong> archiviazione della documentazionerelativa ai <strong>di</strong>pendenti e delle spe<strong>di</strong>zioni.I sistemi <strong>di</strong> elaborazione delle transazioni sono talvolta così importanti per <strong>un</strong>’azienda


8 I dati e l’aziendache <strong>un</strong> guasto <strong>di</strong> qualche ora può sancire la sua fine e talvolta anche <strong>di</strong> altre aziende ad essaconnesse. I TPS sono anche i principali produttori <strong>di</strong> informazioni per altri tipi sistemi.MIS (Management Information System):Il termine sistemi <strong>di</strong> gestione dell’informazione designa <strong>un</strong>a specifica categoria <strong>di</strong> sistemiinformativi che servono le f<strong>un</strong>zioni <strong>di</strong> livello manageriale. Generalmente adempiono aquesto compito offrendo ai manager report e spesso <strong>un</strong> accesso online alle prestazionicorrenti e ai dati storici dell’azienda. In genere questi sistemi sono orientati quasi esclusivamentea eventi interni.Il sistema <strong>di</strong> gestione delle informazioni normalmente risponde alle necessità dei managerinteressati a risultati settimanali, mensili e annuali, benché alc<strong>un</strong>i <strong>di</strong> essi consentano loro<strong>di</strong> approfon<strong>di</strong>re fino a vedere i dati su base giornaliera o persino oraria.DSS (Decision Support System):Anche i sistemi <strong>di</strong> supporto alle decisioni rispondono alle esigenze del livello managerialedell’azienda. Aiutano i manager a prendere decisioni che sono <strong>un</strong>iche, in rapido cambiamentoe <strong>di</strong>fficilmente specificate in anticipo. Questi sistemi riguardano problemi incui la procedura per arrivare ad <strong>un</strong>a soluzione può non essere nota completamente inanticipo. Sebbene i sistemi <strong>di</strong> supporto alle decisioni usino le informazioni interne fornitedai sistemi <strong>di</strong> elaborazione delle transazioni e dai sistemi <strong>di</strong> gestione delle informazioni,spesso impiegano anche informazioni tratte da fonti esterne.Per definizione i DSS hanno <strong>un</strong>a maggiore potenza analitica rispetto agli altri sistemi.Essi utilizzano vari modelli <strong>di</strong> analisi dei dati o condensano gran<strong>di</strong> quantità <strong>di</strong> dati in <strong>un</strong>formato utile per prendere decisioni.Sono sistemi progettati in modo che gli utenti possano lavorare <strong>di</strong>rettamente sui dati;questi sistemi sono costituiti da software <strong>di</strong> facile uso; sono interattivi e l’utente puòcambiare le premesse, porre nuove domande e includere nuovi dati.ESS (Executive Support System):Sono sistemi informativi per il livello strategico. Per prendere le loro decisioni i seniormanager utilizzano sistemi <strong>di</strong> supporto <strong>di</strong>rezionale. Essi riguardano decisioni non <strong>di</strong>routine che richiedono giu<strong>di</strong>zi, valutazioni e conoscenze approfon<strong>di</strong>te, poiché non esisteness<strong>un</strong>a procedura standard per gi<strong>un</strong>gere a <strong>un</strong>a soluzione.


1.2 I principali tipi <strong>di</strong> sistemi usati <strong>nel</strong>le aziende 9I sistemi <strong>di</strong> supporto <strong>di</strong>rezionale sono progettati per incorporare i dati legati a eventiesterni, ma traggono anche informazioni dai MIS e dai DSS. Essi filtrano, comprimono,estraggono ed in<strong>di</strong>viduano i dati critici, mettendo in luce quelli della massima importanzaper i senior manager.Il sistema ESS utilizza software <strong>di</strong> grafica avanzato ed è in grado <strong>di</strong> presentare grafici edati provenienti da molte fonti.La Figura 1.3 illustra il modo in cui i vari sistemi servono i vari livelli <strong>di</strong> <strong>un</strong>’aziendae le relazioni tra <strong>di</strong> essi.Figura 1.3: Relazioni tra i sistemiI sistemi <strong>di</strong> elaborazione delle transazioni rappresentano la fonte principale dei dati pergli altri sistemi, mentre i sistemi <strong>di</strong> supporto <strong>di</strong>rezionale fondamentalmente ricevono idati dai sistemi <strong>di</strong> livello inferiore. È sostanzialmente vantaggioso avere <strong>un</strong>a certa integrazionetra questi sistemi in modo che le informazioni possano fluire con facilità trale varie parti dell’azienda e offrire al management <strong>un</strong>a visione delle prestazioni aziendaliche abbracci l’intera impresa. Ma l’integrazione costa. L’integrazione <strong>di</strong> tanti sistemi<strong>di</strong>fferenti richiede molto tempo e impegno [LL06].La Tabella 1.1 riassume le principali caratteristiche dei sistemi appena descritti.


10 I dati e l’aziendaTipo <strong>di</strong> sistema Informazioni <strong>di</strong> input Elaborazioni svolte Informazioni <strong>di</strong> output UtentiESS Dati aggregati, esterni e Grafici, simulazioni; interattivitàProiezioni; risposte alle interrogazioniSenior managerinterniDSSBassi volumi <strong>di</strong> dati o grossi Interattività; simulazionidatabase ottimizzati per l’analisidei dati; modelli analiticie strumenti <strong>di</strong> analisidei datianalisiMISRiepilogo dei dati sulle transazioni,alti volumi <strong>di</strong> dati,semplici modelliReport <strong>di</strong> routine, modellisemplici; analisi <strong>di</strong> bassolivelloTPS Transazioni; eventi Or<strong>di</strong>namento, produzioneelenchi, <strong>un</strong>ioni eaggiornamentiReport speciali; analisi delleProfessionisti; manager <strong>di</strong>decisioni; risposte alle staffinterrogazioniRiepiloghi e report delle Middle managereccezioniReport dettagliati, liste; riepiloghiPersonale operativo, supervisoriTabella 1.1: Caratteristiche dei <strong>di</strong>versi tipi <strong>di</strong> sistemi informativi.1.3 I DBMS ed il loro ruoloNel primo capitolo abbiamo osservato quanto siano importanti i dati per <strong>un</strong>’azienda alfine <strong>di</strong> produrre in successione informazione, conoscenza e saggezza.L’attenzione ai dati ha caratterizzato le applicazioni dell’informatica fin dalle sue origini,ma sistemi software specificamente de<strong>di</strong>cati alla gestione dei dati sono stati realizzatisolo a partire dalla fine degli anni Settanta. I DBMS (Data Base Management System)rientrano in questi sistemi software; sono infatti in grado <strong>di</strong> gestire collezioni <strong>di</strong> dati chesiano gran<strong>di</strong>, con<strong>di</strong>vise e persistenti, assicurando la loro affidabilità e privatezza. Comeogni prodotto informatico, <strong>un</strong> DBMS deve essere efficiente ed efficace. Una base <strong>di</strong> datiè <strong>un</strong>a collezione <strong>di</strong> datigestita da <strong>un</strong> DBMS [ACPT06].In <strong>un</strong>’azienda i vari tipi <strong>di</strong> sistemi utilizzano gli stessi dati ma con finalità e modalità<strong>di</strong>verse. In base a questa osservazione, possiamo sud<strong>di</strong>videre i sistemi in sistemi operazionalio transazionali, ovvero sistemi a supporto <strong>di</strong> attività operative e gestionali e sistemi<strong>di</strong> analisi, ovvero sistemi a supporto delle attività decisionali-strategici.1.3.1 DBMS transazionali (OLTP)Si definisce transazione <strong>un</strong>’<strong>un</strong>ità logica <strong>di</strong> elaborazione, cioè <strong>un</strong>a sequenza <strong>di</strong> operazioniche hanno <strong>un</strong> effetto globale sul database, vista come <strong>un</strong> insieme atomico, che completacon successo o fallisce, senza ness<strong>un</strong>a possibilità interme<strong>di</strong>a. Un sistema che mette a<strong>di</strong>sposizione <strong>un</strong> meccanismo per la definizione e l’esecuzione <strong>di</strong> transazioni viene dettosistema transazionale. Il loro scopo principale è quello <strong>di</strong> supportare attività routinarie


1.3 I DBMS ed il loro ruolo 11e registrare il flusso delle transazioni entro l’azienda, al livello operativo; mentre il lorocomponente principale sono i sistemi OLTP (On-Line Transaction Process), che svolgonoe registrano le transazioni <strong>di</strong> routine necessarie per le attività quoti<strong>di</strong>ane dell’azienda.In <strong>un</strong> DBMS transazionale, tutto il co<strong>di</strong>ce che viene eseguito all’interno <strong>di</strong> <strong>un</strong>a transazionegode <strong>di</strong> proprietà particolari, le cosiddette proprietà acide delle transazioni: atomicità,consistenza, isolamento e persistenza; il termine deriva dall’acronimo ACID (Atomicity,Consistency, Isolation, Durability) [ACPT06].• Atomicità: rappresenta il fatto che <strong>un</strong>a transazione è <strong>un</strong>’<strong>un</strong>ità in<strong>di</strong>visibile <strong>di</strong> esecuzione.Tutte le operazioni della sequenza terminano con successo (commit) oppure,se anche <strong>un</strong>a sola <strong>di</strong> esse fallisce, l’intera transazione viene abortita (abort); siapplica quin<strong>di</strong> <strong>un</strong> approccio “tutto o niente”;• Consistenza: richiede che l’esecuzione della transazione non violi i vincoli <strong>di</strong> integritàdefinita sulla base dati. Una transazione è <strong>un</strong>a trasformazione corretta dellostato del database, vale a <strong>di</strong>re, al termine <strong>di</strong> ogni transazione il database devetrovarsi in <strong>un</strong>o stato consistente. Nel <strong>caso</strong> <strong>di</strong> <strong>un</strong>’eventuale violazione il sistemainterviene per annullare la transazione o per correggere la violazione del vincolo.• Isolamento: richiede che l’esecuzione <strong>di</strong> <strong>un</strong>a transazione sia in<strong>di</strong>pendente dallacontemporanea esecuzione <strong>di</strong> altre transazioni. In particolare si richiede che il risultatodell’esecuzione concorrente <strong>di</strong> <strong>un</strong> insieme <strong>di</strong> transazioni sia analogo al risultatoche le stesse transazioni otterrebbero qualora ciasc<strong>un</strong>a <strong>di</strong> esse fosse seguita da sola;• Persistenza: richiede che l’effetto <strong>di</strong> <strong>un</strong>a transazione che ha eseguito il commitcorrettamente non venga più perso. In pratica, <strong>un</strong>a base <strong>di</strong> dati deve garantire cheness<strong>un</strong> dato venga perso per ness<strong>un</strong> motivo.Data la sua natura esecutiva, il sistema transazionale ha la tendenza a strutturare i flussie a standar<strong>di</strong>zzare il contenuto informativo per minimizzare la possibilità <strong>di</strong> commettereerrori e, <strong>nel</strong>lo stesso tempo, rendere le operazioni fluide e rapide. La sua strutturaè ottimizzata per sostenere l’attività <strong>di</strong> <strong>un</strong> numero potenzialmente elevato <strong>di</strong> personeche interagiscono p<strong>un</strong>tualmente con la base dati in attività <strong>di</strong> ricerca, <strong>di</strong> creazione e <strong>di</strong>aggiornamento delle informazioni.


12 I dati e l’azienda1.3.2 DBMS per l’analisi (OLAP)Mentre i dati operazionali coprono <strong>un</strong> arco temporale <strong>di</strong> solito piuttosto limitato, poichéla maggior parte delle transazioni coinvolge i dati più recenti, i sistemi <strong>di</strong> analisi devonopermettere analisi che spazino sulla prospettiva <strong>di</strong> alc<strong>un</strong>i anni. Per questo motivo questiultimi sistemi devono essere aggiornati a intervalli regolari a partire dai dati operazionalie sono in crescita continua. Volendo fare <strong>un</strong> paragone possiamo supporre che, a intervalliregolari, venga scattata <strong>un</strong>a fotografia istantanea dei dati operazionali. La progressionedelle fotografie scattate viene immagazzinata, generando <strong>un</strong> film che documenti la situazioneaziendale da <strong>un</strong> istante zero fino al tempo attuale.I processi decisionali non sono standar<strong>di</strong>zzabili né riconducibili a procedure automatizzate,perché sono influenzati dai modelli <strong>di</strong> realtà che le persone utilizzano per effettuarele scelte. I sistemi <strong>di</strong> analisi devono pertanto supportare il processo decisionale seguendoi passaggi logici del decisore e dandogli la possibilità <strong>di</strong> avere visioni <strong>di</strong>versamente organizzatedai dati.L’On-Line Analytical Processing (OLAP) è l’insieme dei sottosistemi informativi aziendalipensati per l’analisi interattiva dei dati, ottimizzati per garantire la massima efficienza<strong>nel</strong>l’elaborazione dei dati <strong>di</strong> sintesi e la massima flessibilità <strong>nel</strong>le interrogazioni.Solitamente si basano su sistemi in sola lettura, o com<strong>un</strong>que articolati in modo tale daprivilegiare operazioni <strong>di</strong> lettura e <strong>di</strong> aggregazione dei dati, con strutture orientate aglioggetti <strong>di</strong> analisi.Il database per il processo <strong>di</strong> analisi ha le seguenti caratteristiche: [Des07]• Entità denormalizzate;• Disegno del database più semplice (meno tabelle e meno associazioni) per <strong>un</strong>acomprensione più facile da parte dell’utente;• I dati memorizzati possono essere aggregati (riass<strong>un</strong>tivi);• Le interrogazioni richiedono poche join;• Ottimizzato per la consultazione <strong>di</strong> gran<strong>di</strong> moli <strong>di</strong> dati.Dal momento che i sistemi <strong>di</strong> analisi, come già detto, accedono ai dati quasi solamentein sola lettura, le proprietà acide osservate precedentemente per i DBMS transazionalipossono essere tralasciate.


1.3 I DBMS ed il loro ruolo 131.3.3 Perché è necessario <strong>di</strong>stinguereL’elevata <strong>di</strong>screpanza tra le esigenze informative dei <strong>di</strong>versi livelli operativi e decisionaliaziendali impone, come abbiamo visto in precedenza, l’adozione <strong>di</strong> sistemi <strong>di</strong>fferenziati. Isistemi informativi aziendali devono guidare sia l’attività operativa che quella decisionale.Fino a tempi recenti lo facevano tramite il solo sistema operazionale. Al crescere dellacriticità del processo decisionale e della quantità <strong>di</strong> dati da elaborare, l’uso <strong>di</strong> <strong>un</strong> <strong>un</strong>icosistema centralizzato come supporto sia operativo che informazionale ha manifestato numerosilimiti.In particolare, il sistema operazionale, strutturato sul concetto <strong>di</strong> transazione e <strong>di</strong> processo,si è rilevato carente:• Nella produzione <strong>di</strong> dati <strong>di</strong> sintesi, presentati tramite reportistica solitamente rigida,mo<strong>di</strong>ficabile solo con costi elevati;• Nella possibilità <strong>di</strong> interrogare interattivamente la base dati, solitamente articolatain modo complesso e accessibile ai soli addetti ai lavori:• Nella <strong>di</strong>sponibilità <strong>di</strong> dati fondamentali per il processo decisionale, ma non sempreutilizzati o presenti a livello operativo;• Nella velocità <strong>di</strong> risposta dal momento che la struttura dati è ottimizzata per ilsupporto alle transazioni e non per l’elaborazione <strong>di</strong> informazioni <strong>di</strong> sintesi;• Nella copertura temporale, solitamente ridotta per motivi <strong>di</strong> prestazioni e <strong>di</strong> occupazione<strong>di</strong> memoria <strong>di</strong> massa , che potrebbe rivelarsi insufficiente per condurreanalisi <strong>di</strong> tendenza sul me<strong>di</strong>o/l<strong>un</strong>go periodo.Uno schema delle <strong>di</strong>fferenze tra OLTP e OLAP , tra sistemi operazionali e sistemi <strong>di</strong>analisi, è mostrato in Tabella 1.2 [PM05].


14 I dati e l’aziendaOLTPOLAPFinalità Supporto all’operatività Supporto al processo decisionaleUtenti Molti, livello operativo Pochi, livello <strong>di</strong>rezionaleDatiElementari, numerici e alfanumericiSintetici, solitamente numericiModalità <strong>di</strong> utilizzoGuidata, per processi e stati Interrogazioni ad hocsuccessiviQuantità <strong>di</strong> datiper operazioneBassa: centinaia <strong>di</strong> record perogni transazioneAlta: milioni <strong>di</strong> record per ogniqueryelementareQualità In termini <strong>di</strong> integrità In termini <strong>di</strong> consistenzaOrientamento Per processo/applicazione Per soggettoFrequenza <strong>di</strong> aggiornamentoContinua, tramite azioni Spora<strong>di</strong>ca, tramite f<strong>un</strong>zioniespliciteCopertura temporaleDati correntiStoricaOttimizzazione Per accessi in lettura e scritturasu <strong>un</strong>a porzione della basePer accessi in sola lettura sututta la base <strong>di</strong> dati<strong>di</strong> datiTabella 1.2: Differenze tra sistemi OLTP e sistemi OLAP.


CAPITOLO 2Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>2.1 Data warehousingTra i sistemi <strong>di</strong> supporto alle decisioni, i sistemi <strong>di</strong> data warehousing sono probabilmentequelli su cui negli ultimi anni si è maggiormente focalizzata l’attenzione sia <strong>nel</strong> mondoaccademico sia in quello industriale. È possibile definire in modo informale il data warehousingcome segue:Data warehousing: È <strong>un</strong>a collezione <strong>di</strong> meto<strong>di</strong>, tecnologie e strumenti <strong>di</strong> ausilioal cosiddetto “lavoratore della conoscenza” per condurre analisi dei dati finalizzateall’attuazione <strong>di</strong> processi decisionali ed al miglioramento del patrimonio informativo.Per capire a fondo il ruolo e l’utilità del data warehousing occorre analizzare le esigenzeche ne hanno decretato la nascita. Kimball riassume efficacemente tali esigenze,evidenziando le lamentele più frequenti mosse dagli utenti.“Abbiamo montagne <strong>di</strong> dati ma non possiamo accedervi!”. Questa frase esprime la frustrazioneda parte <strong>di</strong> chi ha il ruolo e la competenza per decidere del futuro aziendale,ma non possiede gli strumenti tecnici per ottenere, <strong>nel</strong>la forma desiderata, i dati necessari.


16 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>“Come è possibile che persone che svolgono lo stesso ruolo presentino risultati sostanzialmente<strong>di</strong>versi?”. In <strong>un</strong> contesto aziendale me<strong>di</strong>o-grande sono tipicamente presentipiù basi <strong>di</strong> dati, ciasc<strong>un</strong>a relativa a <strong>un</strong>a <strong>di</strong>versa area del business, spesso memorizzatesu piattaforme logico-fisiche <strong>di</strong>fferenti e non integrate dal p<strong>un</strong>to <strong>di</strong> vista concettuale. Irisultati prodotti all’interno delle <strong>di</strong>verse aree saranno allora, molto probabilmente, inconsistentitra loro.“Vogliamo selezionare, raggruppare e manipolare i dati in ogni modo possibile!”. Il processodecisionale è <strong>di</strong>fficilmente pianificabile a priori. L’utente finale vorrebbe <strong>di</strong>sporre<strong>di</strong> <strong>un</strong>o strumento sufficientemente amichevole e flessibile da consentirgli <strong>di</strong> condurre l’analisiin modo estemporaneo, lasciandosi guidare dalle informazioni via via ottenute perdecidere sul momento quali nuove correlazioni ricercare.“Mostrami solo ciò che è importante!”. Esaminare i dati al massimo livello <strong>di</strong> dettaglio ènon solo inutile per il processo decisionale, ma ad<strong>di</strong>rittura controproducente, perché nonconsente <strong>di</strong> focalizzare l’attenzione sulle informazioni veramente significative.“Tutti sanno che alc<strong>un</strong>i dati non sono corretti!”. Questo è <strong>un</strong> altro p<strong>un</strong>to dolente. Unapercentuale non trascurabile dei dati transazionali è non corretta, o ad<strong>di</strong>rittura assente.Evidentemente, basare il proce<strong>di</strong>mento analitico su dati errati e incompleti non permette<strong>di</strong> raggi<strong>un</strong>gere risultati vali<strong>di</strong>.Da questo elenco <strong>di</strong> <strong>di</strong>fficoltà e problemi possiamo facilmente estrarre <strong>un</strong> elenco <strong>di</strong> parolechiave che <strong>di</strong>ventano fattori <strong>di</strong>stintivi e requisiti in<strong>di</strong>spensabili del processo <strong>di</strong> data warehousing,ossia del complesso <strong>di</strong> attività che consentono <strong>di</strong> trasformare i dati operazionaliin conoscenza a supporto delle decisioni:• Accessibilità a utenti con conoscenze limitate <strong>di</strong> informatica e strutture dati;• Integrazione dei dati sulla base <strong>di</strong> <strong>un</strong> modello standard dell’impresa;• Flessibilità <strong>di</strong> integrazione per trarre il massimo vantaggio dal patrimonio informativoesistente;• Sintesi per permettere analisi mirate ed efficaci;


2.1 Data warehousing 17• Rappresentazione multi<strong>di</strong>mensionale per offrire all’utente <strong>un</strong>a visione intuitivaed efficacemente manipolabile delle informazioni;• Correttezza e completezza dei dati integrati.Al centro del processo vi è il data warehouse, <strong>un</strong> contenitore <strong>di</strong> dati che <strong>di</strong>venta garantedei requisiti esposti. Inmon ne <strong>di</strong>ede <strong>un</strong>a definizione <strong>nel</strong> 1996.Data warehouse. Un Data Warehouse (DW) è <strong>un</strong>a collezione <strong>di</strong> dati <strong>di</strong> supportoper il processo decisionale che presenta le seguenti caratteristiche:• È orientata ai soggetti <strong>di</strong> interesse;• È integrata e consistente;• È rappresentativa dell’evoluzione temporale e non volatile.Il DW è orientato ai soggetti in quanto in quanto si incentra sui concetti <strong>di</strong> interessedell’azienda, quali clienti, i prodotti, le ven<strong>di</strong>te, gli or<strong>di</strong>ni. Viceversa, i database operazionalisono organizzati intorno alle <strong>di</strong>fferenti applicazioni del dominio aziendale.La con<strong>di</strong>zione <strong>di</strong> integrità e consistenza è molto importante, in quanto il DW si appoggiaa più fonti <strong>di</strong> dati eterogenee: dati estratti dall’ambiente <strong>di</strong> produzione, e quin<strong>di</strong>originariamente archiviati in basi <strong>di</strong> dati aziendali, o ad<strong>di</strong>rittura provenienti da sistemiinformativi esterni all’azienda. Di tutti questi dati il DW si impegna a restituire <strong>un</strong>avisione <strong>un</strong>ificata. La costruzione <strong>di</strong> <strong>un</strong> sistema <strong>di</strong> data warehousing non comporta l’inserimento<strong>di</strong> nuove informazioni bensì la riorganizzazione <strong>di</strong> quelle esistenti, e implicapertanto l’esistenza <strong>di</strong> <strong>un</strong> sistema informativo.Infine <strong>nel</strong> data warehouse i dati non vengono mai rimossi ma solo aggi<strong>un</strong>ti, questa caratteristicaconsente <strong>di</strong> avere a <strong>di</strong>sposizione sia dati storici che recenti.Un data warehouse può essere consultato <strong>di</strong>rettamente, ma anche essere usato comesorgente per costruirne delle parziali repliche orientate verso specifiche aree dell’impresa.Tali repliche vengono dette data mart.


18 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Data mart. Con il termine data mart si intende <strong>un</strong> sottoinsieme o <strong>un</strong> aggregazionedei dati presenti <strong>nel</strong> DW primario, contenente l’insieme delle informazioni rilevantiper <strong>un</strong>a particolare area del business, <strong>un</strong>a particolare <strong>di</strong>visione dell’azienda, <strong>un</strong>aparticolare categoria <strong>di</strong> soggetti2.1.1 Componenti <strong>di</strong> <strong>un</strong> data warehouseOra che abbiamo compreso gli obiettivi <strong>di</strong> <strong>un</strong> sistema <strong>di</strong> data warehousing, possiamoosservare quali sono i componenti che ne fanno parte. Se ne possono in<strong>di</strong>viduare quattro(Figura 2.1), ogn<strong>un</strong>o dei quali ha le proprie f<strong>un</strong>zionalità e il proprio ruolo all’interno delsistema [KRT + 07].Figura 2.1: Componenti <strong>di</strong> <strong>un</strong> sistema <strong>di</strong> data warehousingSistemi Sorgente:Sono costituiti dai sistemi gestionali e amministrativo-contabili <strong>di</strong> tipo tra<strong>di</strong>zionale o ERP,dai sistemi che interfacciano il mercato (sistemi <strong>di</strong> CRM), dai sistemi Web e da tutti glialtri sistemi informativi <strong>di</strong> tipo operativo e/o transazionali [Pas04]. Devono essere visticome parti esterne rispetto al sistema <strong>di</strong> data warehousing, poiché probabilmente si avràpoco o ness<strong>un</strong> controllo sul contenuto e la forma dei dati che essi contengono. Questisistemi solitamente mantengono pochi dati storici. Avere a <strong>di</strong>sposizione <strong>un</strong> buon data


2.1 Data warehousing 19warehouse solleva la gran parte della responsabilità <strong>di</strong> rappresentare il passato ai sistemisorgente.Staging Area:La staging area <strong>di</strong> <strong>un</strong> data warehouse è composta da due parti: <strong>un</strong>’area <strong>di</strong> memorizzazionedei dati e <strong>un</strong> insieme <strong>di</strong> procedure com<strong>un</strong>emente dette extraction-transformation-loa<strong>di</strong>ng(ETL). Si colloca tra i sistemi sorgente e l’area <strong>di</strong> presentazione. Kimball paragona lastaging area alla cucina <strong>di</strong> <strong>un</strong> ristorante, <strong>nel</strong>la quale gli ingre<strong>di</strong>enti vengono trasformatiper <strong>un</strong> buon pasto. I dati operazionali vengono infatti trasformati e consegnati al datawarehouse in <strong>un</strong>a forma appropriata per il loro consumo, ossia la loro elaborazione perprodurre informazioni utili all’azienda. Come per la cucina <strong>di</strong> <strong>un</strong> ristorante anche lastaging area sarà accessibile solamente da professionisti qualificati e per tanto risulteràessere off-limits per gli utenti business. Inoltre non sarà pre<strong>di</strong>sposta per servizi <strong>di</strong> interrogazionee <strong>di</strong> presentazione, così come i clienti <strong>di</strong> <strong>un</strong> ristorante non sono invitati amangiare in cucina.La presenza e l’utilizzo <strong>di</strong> questo componente <strong>di</strong>pende dall’architettura adottata perrealizzare il sistema <strong>di</strong> data warehousing, come verrà esposto in seguito.Area <strong>di</strong> presentazione:L’area <strong>di</strong> presentazione è la parte dove i dati sono organizzati, conservati, e resi <strong>di</strong>sponibiliper l’interrogazione <strong>di</strong>retta da parte <strong>di</strong> utenti, autori <strong>di</strong> report, e altre applicazionianalitiche. Per la com<strong>un</strong>ità impren<strong>di</strong>toriale l’area <strong>di</strong> presentazione coincide con il datawarehouse, in quanto è tutto quello che possono vedere e toccare me<strong>di</strong>ante gli appositistrumenti in loro possesso. È fortemente consigliabile che i dati vengano presentati,memorizzati e siano accessibili in schema <strong>di</strong>mensionali (il modello multi<strong>di</strong>mensionale èdescritto <strong>nel</strong> capitolo 4), in quanto risultano essere <strong>di</strong> più facile uso per gli utenti <strong>di</strong> datawarehouse.Strumenti <strong>di</strong> accesso ai dati:È l’insieme degli strumenti <strong>di</strong> front-end che gli utenti business hanno a loro <strong>di</strong>sposizioneper consultare l’area <strong>di</strong> presentazione. Possono essere semplici strumenti per eseguirequery ad hoc oppure strumenti che eseguono analisi più complesse, come verrà illustrato


20 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong><strong>nel</strong> paragrafo 2.3.1. Tuttavia <strong>nel</strong>l’80-90 per cento dei casi gli utenti utilizzano applicazioniche forniscono automaticamente e ad intervalli <strong>di</strong> tempo prestabiliti informazioni strutturatein modo pressoché invariabile e che quin<strong>di</strong> non implicano la costruzione <strong>di</strong>retta<strong>di</strong> query. In ogni <strong>caso</strong> questi strumenti dovranno possedere <strong>un</strong> motore <strong>di</strong> ottimizzazionedelle interrogazioni, a prescindere dal fatto che esse vengano o meno costruite dell’utente.2.1.2 Architetture per il data warehousingCome accennato <strong>nel</strong> paragrafo precedente la presenza e le modalità <strong>di</strong> utilizzo della stagingarea definiscono l’architettura del sistema <strong>di</strong> data warehousing. La scelta dell’architetturada utilizzare <strong>di</strong>pende delle esigenze e dal tipo dell’organizzazione entro la quale il progettodovrà essere realizzato, tuttavia esistono caratteristiche irrin<strong>un</strong>ciabili per <strong>un</strong> sistema <strong>di</strong>data warehousing che possono essere così en<strong>un</strong>ciate: [GR06]• Separazione: l’elaborazione analitica e quella transazionale devono essere mantenuteil più possibile separate;• Scalabilità: l’architettura hardware e software deve poter essere facilmente ri<strong>di</strong>mensionataa fronte della crescita <strong>nel</strong> tempo dei volumi <strong>di</strong> dati da gestire ed elaboraree del numero <strong>di</strong> utenti da sod<strong>di</strong>sfare;• Esten<strong>di</strong>bilità: deve essere possibile accogliere nuove applicazioni e tecnologie senzariprogettare integralmente il sistema;• Sicurezza: il controllo sugli accessi è essenziale a causa della natura strategica deidati memorizzati;• Amministrabilità: la complessità dell’attività <strong>di</strong> amministrazione non deve risultareeccessiva.In seguito vengono presentati alc<strong>un</strong>i modelli architetturali.Architettura a <strong>un</strong> livelloÈ <strong>un</strong>’architettura scarsamente utilizzata <strong>nel</strong>la pratica. Ha come obiettivo quello <strong>di</strong> minimizzarela quantità <strong>di</strong> dati memorizzati eliminando le ridondanze. Come mostrato inFigura 2.2 il data warehouse in questo <strong>caso</strong> è virtuale, poiché viene implementato come<strong>un</strong>a vista multi<strong>di</strong>mensionale dei dati operazionali da <strong>un</strong> apposito middleware.


2.1 Data warehousing 21Figura 2.2: Architettura ad <strong>un</strong> livello per <strong>un</strong> sistema <strong>di</strong> data warehousingUna tale architettura presenta i seguenti p<strong>un</strong>ti deboli:• Non rispetta il requisito <strong>di</strong> separazione dell’elaborazione analitica da quella transazionale.Le interrogazioni <strong>di</strong> analisi vengono infatti ri<strong>di</strong>rette sui dati operazionalidopo essere state reinterpretate dal middleware, interferendo così con il normalecarico <strong>di</strong> lavoro transazionale;• I requisiti <strong>di</strong> integrazione e correttezza dei dati possono essere sod<strong>di</strong>sfatti, ma con<strong>un</strong>’elevata complessità;• È impossibile avere <strong>un</strong> livello <strong>di</strong> storicizzazione superiore a quello delle sorgenti.Architettura a due livelliCon questa architettura si riesce a sod<strong>di</strong>sfare il requisito <strong>di</strong> separazione, come si evincedalla Figura 2.3. Nonostante si articoli su quattro livelli <strong>di</strong>stinti viene chiamata architetturaa due livelli per evidenziare la separazione tra le sorgenti e il data warehouse. I datiche il data warehouse utilizzerà sono contenuti in database aziendali relazionali o legacy,oppure provenienti da sistemi informativi esterni all’azienda (livello delle sorgenti). Talidati saranno estratti, ripuliti per eliminare le inconsistenze e completare eventuali parti


22 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Figura 2.3: Architettura a due livelli per <strong>un</strong> sistema <strong>di</strong> data warehousingmancanti, integrati per fondere sorgenti eterogenee secondo <strong>un</strong>o schema com<strong>un</strong>e, me<strong>di</strong>antegli strumenti ETL accennati precedentemente ed approfon<strong>di</strong>ti <strong>nel</strong> paragrafo 2.1.3(livello <strong>di</strong> alimentazione). Le informazioni vengono raccolte <strong>nel</strong> data warehouse che potràessere <strong>di</strong>rettamente consultato o usato come sorgente per costruire data mart (livello delwarehouse). Accanto al DW, il contenitore dei metadati mantiene informazioni sulle sorgenti,sui meccanismi <strong>di</strong> accesso, sulle procedure <strong>di</strong> pulitura e alimentazione, sugli utenti,sugli schemi dei data mart ecc. Infine si potranno consultare in modo efficiente e flessibilei dati integrati a fini <strong>di</strong> stesura <strong>di</strong> report, <strong>di</strong> analisi e <strong>di</strong> simulazione (livello <strong>di</strong> analisi).Architettura a tre livelliAl livello delle sorgenti e quello del data warehouse, viene aggi<strong>un</strong>to <strong>un</strong> terzo livello cheviene chiamato livello dei dati riconciliati. Questo livello materializza i dati operazionaliottenuti a valle del processo <strong>di</strong> integrazione e ripulitura dei dati sorgente: quin<strong>di</strong> datiintegrati, consistenti, corretti, volatili, correnti e dettagliati. Il data warehouse non verràquin<strong>di</strong> più alimentato <strong>di</strong>rettamente dalle sorgenti, ma dai dati riconciliati.


2.1 Data warehousing 23Un vantaggio <strong>di</strong> questa architettura, mostrata in Figura 2.4, è che il livello dei dati riconciliaticrea <strong>un</strong> modello <strong>di</strong> dati com<strong>un</strong>e e <strong>di</strong> riferimento per l’intera azienda, introducendoal contempo <strong>un</strong>a separazione netta tra le problematiche legate all’estrazione e integrazionedei dati dalle sorgenti e quelle inerenti l’alimentazione del DW. Tuttavia presenta losvantaggio <strong>di</strong> introdurre <strong>un</strong>’ulteriore ridondanza rispetto ai dati operazionali sorgente.Figura 2.4: Architettura a tre livelli per <strong>un</strong> sistema <strong>di</strong> data warehousing


24 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>2.1.3 Gli strumenti ETLIl ruolo degli strumenti <strong>di</strong> extraction-trasformation-loa<strong>di</strong>ng è quello <strong>di</strong> alimentare <strong>un</strong>asorgente dati singola, dettagliata, esauriente e <strong>di</strong> alta qualità che possa a sua volta alimentareil data warehouse. Le procedure <strong>di</strong> popolamento del data warehouse possonoraggi<strong>un</strong>gere elevati livelli <strong>di</strong> complessità, in relazione alle <strong>di</strong>screpanze esistenti tra le sorgenti,al loro livello <strong>di</strong> correttezza e al livello <strong>di</strong> precisione rappresentativa <strong>nel</strong> tempo chesi desidera mantenere <strong>nel</strong> sistema informazionale. Sono caratterizzate da <strong>un</strong>a sequenza <strong>di</strong>fasi che <strong>di</strong>pende dalle politiche <strong>di</strong> aggiornamento che si è deciso <strong>di</strong> adottare, politiche cheprevedono azioni più o meno articolate da parte delle procedure <strong>di</strong> popolamento. La complessità<strong>di</strong> queste procedure è tale che sul mercato sono presenti <strong>di</strong>versi prodotti softwareorientati specificamente al supporto delle fasi <strong>di</strong> estrazione, pulizia, trasformazionee caricamento dei dati <strong>nel</strong> processo <strong>di</strong> alimentazione del data warehouse.Occorre precisare che, <strong>nel</strong>la letteratura, i confini tra pulitura e trasformazione sono spessosfumati dal p<strong>un</strong>to <strong>di</strong> vista terminologico, per cui è spesso poco chiara l’attribuzione <strong>di</strong><strong>un</strong>a specifica operazione all’<strong>un</strong>o o all’altro processo.EstrazioneLe operazioni <strong>di</strong> estrazione sono eseguite all’atto dell’inizializzazione del livello riconciliatoper essere poi ripetute perio<strong>di</strong>camente, in base all’intervallo <strong>di</strong> aggiornamento stabilitodal progettista, al fine <strong>di</strong> acquisire informazioni relative agli eventi verificatisi durantela vita del sistema. I dati che andranno a popolare il data warehouse sono solo quelliessenziali all’analisi e non tutti i dati ospitati sui sistemi <strong>di</strong> origine. Esistono due tipologie<strong>di</strong> approcci all’estrazione:• Estrazione statica: vengono trattati tutti i dati presenti <strong>nel</strong>le sorgenti operazionali.È l’<strong>un</strong>ica soluzione possibile all’atto dell’inizializzazione, ma può essere impiegataogni qual volta la quantità ridotta dei dati lo permetta;• Estrazione incrementale: con questo approccio vengono presi in considerazione isoli dati prodotti o mo<strong>di</strong>ficati dalle sorgenti <strong>nel</strong>l’intervallo <strong>di</strong> tempo intercorso dall’ultimoaggiornamento del data warehouse. Può essere sud<strong>di</strong>viso ulteriormentein imme<strong>di</strong>ato e ritardato. Nel primo <strong>caso</strong> ogni mo<strong>di</strong>fica ai dati viene registrataimme<strong>di</strong>atamente, mentre <strong>nel</strong> secondo <strong>caso</strong> posticipano tale operazione.


2.1 Data warehousing 25L’estrazione incrementale generalmente si basa sui log mantenuti dal DBMS transazionale.Inoltre l’estrazione può anche essere guidata dalle sorgenti in quei casi in cui è possibilericevere, in modo asincrono, le notifiche delle mo<strong>di</strong>fiche dalle applicazioni operazionali.PuliziaSpesso i dati provenienti dalle sorgenti non sono <strong>di</strong> qualità adeguata agli standard richiestiper il sistema informazionale. Devono quin<strong>di</strong> essere applicate analisi in grado <strong>di</strong> rilevaree possibilmente correggere le situazioni che potrebbero essere critiche o condurre a errori.Tra gli errori e le inconsistenze tipiche che rendono “sporchi” i dati segnaliamo: [GR06]• Dati duplicati (per esempio, <strong>un</strong> cliente che compare più volte <strong>nel</strong>l’anagrafica);• Inconsistenza tra valori logicamente associati (per esempio, tra i dati della personaed il suo co<strong>di</strong>ce fiscale);• Dati mancanti (per esempio, la professione <strong>di</strong> <strong>un</strong> cliente);• Uso non previsto <strong>di</strong> <strong>un</strong> campo (per esempio il campo destinato al co<strong>di</strong>ce fiscaleusato per memorizzare il numero <strong>di</strong> telefono d’ufficio);• Valori impossibili o errati (per esempio, 30/02/2011);• Valori inconsistenti per la stessa entità dovuti a <strong>di</strong>fferenti convenzioni (per esempio,la nazione in<strong>di</strong>cata me<strong>di</strong>ante sigla piuttosto che con il nome completo) eabbreviazioni (per esempio, ‘Piazza Garibal<strong>di</strong>’ e ‘P.za Garibal<strong>di</strong>’);• Valori inconsistenti per la stessa entità dovuti a errori <strong>di</strong> battitura (per esempio,‘Piazza Garibal<strong>di</strong>’ e ‘Piazza Gribal<strong>di</strong>’).Per correggere errori <strong>di</strong> scrittura e riconoscere sinonimi vengono utilizzati degli appositi<strong>di</strong>zionari, mentre per stabilire le corrette corrispondenze tra valori vengono applicateregole proprie del dominio applicativo.TrasformazioneDurante questa fase vengono eseguite le trasformazioni necessarie a conformare i dati dellesorgenti alla struttura del data warehouse; in <strong>caso</strong> <strong>di</strong> architettura a tre livelli l’output <strong>di</strong>questa fase è il livello dei dati riconciliati. La presenza <strong>di</strong> più fonti eterogenee complica


26 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>notevolmente questa fase, in quanto viene richiesta <strong>un</strong>a complessa fase <strong>di</strong> integrazione.Nella fase <strong>di</strong> trasformazione possono essere effettuate molte operazioni, tra cui:• Conversione e normalizzazione: operano a livello <strong>di</strong> formato <strong>di</strong> memorizzazione e<strong>di</strong> <strong>un</strong>ità <strong>di</strong> misura per <strong>un</strong>iformare i dati;• Matching: Stabilisce le corrispondenze tra campi equivalenti in sorgenti <strong>di</strong>verse;• Selezione: riduce il numero <strong>di</strong> campi e <strong>di</strong> record rispetto alle sorgenti.Negli strumenti ETL le attività <strong>di</strong> pulitura e trasformazione sono spesso allacciate esovrapposte.CaricamentoAl termine, si procede al caricamento vero e proprio dei dati sul data warehouse. Questaprocedura può avvenire in due modalità.Refresh. I dati vengono completamente riscritti all’interno del DW. Viene solitamenteutilizzata insieme all’estrazione statica durante la fase <strong>di</strong> inizializzazione.Update. Vengono aggi<strong>un</strong>ti al DW i soli cambiamenti verificatisi <strong>nel</strong>le sorgenti operazionali.Questa tecnica viene solitamente utilizzata in abbinamento all’estrazione incrementaleal fine <strong>di</strong> ottenere <strong>un</strong> aggiornamento perio<strong>di</strong>co del DW.2.2 Il modello multi<strong>di</strong>mensionaleLa progettazione <strong>di</strong> data warehouse e data mart si basa su <strong>un</strong> para<strong>di</strong>gma <strong>di</strong> rappresentazionemulti<strong>di</strong>mensionale dei dati, in grado <strong>di</strong> offrire <strong>un</strong> duplice vantaggio: sotto il profilof<strong>un</strong>zionale, risulta efficace per garantire tempi <strong>di</strong> risposta rapi<strong>di</strong> a fronte <strong>di</strong> interrogazionicomplesse; sul piano logico, le <strong>di</strong>mensioni corrispondono in modo naturale ai criteri <strong>di</strong>analisi utilizzati dai knowledge worker [Ver06].Il modello multi<strong>di</strong>mensionale si basa sul fatto che gli oggetti che influenzano il processodecisionale sono fatti del mondo aziendale come ad esempio le ven<strong>di</strong>te o le spe<strong>di</strong>zioni. Leoccorrenze <strong>di</strong> <strong>un</strong> fatto vengono dette eventi: ogni singola ven<strong>di</strong>ta o spe<strong>di</strong>zione effettuataè <strong>un</strong> evento. Per ciasc<strong>un</strong> fatto, interessano in particolare i valori <strong>di</strong> <strong>un</strong> insieme <strong>di</strong> misureche descrivono quantitativamente gli eventi.


2.2 Il modello multi<strong>di</strong>mensionale 27La quantità degli eventi all’interno <strong>di</strong> <strong>un</strong>a azienda è troppo elevata per poter analizzareogni singolo evento singolarmente. Per questo motivo per poterli agevolmente selezionaree raggruppare (come vedremo <strong>nel</strong> capitolo 5) si immagina <strong>di</strong> collocarli in <strong>un</strong>o spazion-<strong>di</strong>mensionale, i cui assi vengono chiamati app<strong>un</strong>to <strong>di</strong>mensioni <strong>di</strong> analisi. Per esempio<strong>nel</strong> <strong>caso</strong> in cui il fatto in questione siano le ven<strong>di</strong>te, le <strong>di</strong>mensioni <strong>di</strong> analisi potrebberoessere: i prodotti, i negozi e le date.Il concetto <strong>di</strong> <strong>di</strong>mensione genera la metafora del cubo.Cubo multi<strong>di</strong>mensionale. Un cubo multi<strong>di</strong>mensionale è incentrato su <strong>un</strong> fatto<strong>di</strong> interesse per il processo decisionale. Esso rappresenta <strong>un</strong> insieme <strong>di</strong> eventi, descrittiquantitativamente da misure numeriche. Ogni asse del cubo rappresenta <strong>un</strong>apossibile <strong>di</strong>mensione <strong>di</strong> analisi.Figura 2.5: Cubo multi<strong>di</strong>mensionale che modella le ven<strong>di</strong>te in <strong>un</strong>a catena <strong>di</strong> negoziOvviamente se le <strong>di</strong>mensioni sono più <strong>di</strong> tre, si tratta più propriamente <strong>di</strong> <strong>un</strong> ipercubo.


28 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Normalmente ciasc<strong>un</strong>a <strong>di</strong>mensione è associata ad <strong>un</strong>a gerarchia <strong>di</strong> livelli <strong>di</strong> aggregazioneche ne raggruppa i valori in <strong>di</strong>versi mo<strong>di</strong>. I livelli che compaiono <strong>nel</strong>la gerarchia vengonodetti attributi <strong>di</strong>mensionaliFigura 2.6: Una possibile gerarchia per la <strong>di</strong>mensione negozi2.2.1 Modellazione concettuale: il Dimensional Fact ModelUn modello concettuale deve per definizione fornire <strong>un</strong>a serie <strong>di</strong> strutture, dette costrutti,atte a descrivere la realtà <strong>di</strong> interesse in <strong>un</strong>a maniera facile da comprendere e che prescindedai criteri <strong>di</strong> organizzazione dei dati nei calcolatori [ACPT06]. Il modello Entity/Relationship è <strong>un</strong> modello concettuale molto <strong>di</strong>ffuso <strong>nel</strong>le imprese per la progettazione edocumentazione <strong>di</strong> basi <strong>di</strong> dati relazionali.Mentre è ormai <strong>un</strong>iversalmente riconosciuto che <strong>un</strong> data mart si appoggia su <strong>un</strong>a visionemulti<strong>di</strong>mensionale dei dati, non c’è ancora accordo su come portare a termine laprogettazione concettuale a partire dai requisiti utente. Non esiste infatti <strong>un</strong> modelloconcettuale adottato <strong>un</strong>iversalmente per la progettazione e documentazione <strong>di</strong> basi <strong>di</strong>dati per il data warehousing. Il modello Entity/Relationship non risulta essere adatto atale scopo in quanto non è in grado <strong>di</strong> mettere correttamente in luce gli aspetti peculiari


2.2 Il modello multi<strong>di</strong>mensionale 29del modello multi<strong>di</strong>mensionale, senza contare che risulterebbe poco economico dal p<strong>un</strong>to<strong>di</strong> vista grafico-notazionale.Il Dimensional Fact Model (DFM), proposto da Golfarelli <strong>nel</strong> 1998, è <strong>un</strong> modello concettualespecificamente concepito per f<strong>un</strong>gere da supporto alla progettazione <strong>di</strong> data mart;è essenzialmente <strong>di</strong> tipo grafico, e può essere considerato come <strong>un</strong>a specializzazione delmodello multi<strong>di</strong>mensionale per applicazioni <strong>di</strong> data warehousing. La rappresentazioneconcettuale generata dal DFM consiste in <strong>un</strong> insieme <strong>di</strong> schemi <strong>di</strong> fatto. Gli elementi <strong>di</strong>base modellati dagli schemi <strong>di</strong> fatto sono i fatti, le misure, le <strong>di</strong>mensioni, le gerarchie egli attributi <strong>di</strong>mensionali. In questa sede non saranno trattati gli aspetti <strong>di</strong> modellazioneavanzata.Nelle Figure 2.7 e 2.8 sono riportati lo schema <strong>di</strong> fatto e lo schema Entity/Relationshiprelativi alle ven<strong>di</strong>te.Figura 2.7: Semplice schema <strong>di</strong> fatto delle ven<strong>di</strong>teFigura 2.8: Schema Entity/Relationship corrispondente allo schema <strong>di</strong> fatto <strong>di</strong> Figura 2.7


30 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Come si può evincere dalla figura, <strong>un</strong> fatto è raffigurato da <strong>un</strong> rettangolo che ne riporta ilnome insieme ai nomi delle eventuali misure; le <strong>di</strong>mensioni sono rappresentati da piccolicerchi collegati al fatto tramite linee. È importante evidenziare come <strong>un</strong> fatto esprime<strong>un</strong>’associazione molti-a-molti tra le <strong>di</strong>mensioni. Per tale motivo lo schema Entity/Relationshipcorrispondente ad <strong>un</strong>o schema <strong>di</strong> fatto consiste in <strong>un</strong>’associazione n-aria traentità che modellano le <strong>di</strong>mensioni.Le gerarchie vengono rappresentate da alberi <strong>di</strong>rezionati i cui no<strong>di</strong> sono attributi <strong>di</strong>mensionalie i cui archi modellano associazioni molti-a-<strong>un</strong>o tra coppie <strong>di</strong> attribuiti <strong>di</strong>mensionali.La Figura 2.9 ne fornisce <strong>un</strong>a rappresentazione.Figura 2.9: Schema <strong>di</strong> fatto delle ven<strong>di</strong>te arricchitoSe si volesse tradurre questo schema <strong>di</strong> fatto <strong>nel</strong> corrispondente schema E/R si avrebbe<strong>un</strong>’esplosione in termini grafico-notazionali, come già si era accennato in precedenza.Tutti gli attributi <strong>di</strong>mensionali all’interno <strong>di</strong> <strong>un</strong>o schema <strong>di</strong> fatto devono avere nomi<strong>di</strong>versi tra loro. Nomi uguali possono essere <strong>di</strong>fferenziati qualificandoli con il nome <strong>di</strong><strong>un</strong> attributo <strong>di</strong>mensionale che li precede <strong>nel</strong>la gerarchia (per esempio, citta negozio ecitta marca).


2.2 Il modello multi<strong>di</strong>mensionale 312.2.2 Modellazione logicaMentre per la fase <strong>di</strong> modellazione concettuale non ci si deve preoccupare delle scelte chesi dovranno fare durante la fase <strong>di</strong> modellazione logica, per quest’ultima non si può <strong>di</strong>rela stessa cosa. Sarà infatti in questa fase che si dovrà scegliere il DBMS da utilizzaredurante la progettazione fisica. I dati soggetti ad analisi possono essere rappresentatisecondo due modelli logici: quello relazionale, che dà luogo ai cosiddetti sistemi ROLAP(Relational OLAP), e quello multi<strong>di</strong>mensionale, per il quale i sistemi utilizzati vengonodetti MOLAP (Multi<strong>di</strong>mensional OLAP).Esiste anche <strong>un</strong>a terza soluzione, interme<strong>di</strong>a alle due appena menzionate ed è il cosiddettoHOLAP (Hybrid OLAP).2.2.2.1 I sistemi ROLAPAdottare <strong>un</strong>a soluzione <strong>di</strong> questo genere implica il dover modellare i concetti multi<strong>di</strong>mensionaliosservati fin ora in elementi bi<strong>di</strong>mensionali, ovvero le tabelle del modellorelazionale. Una tale operazione viene effettuata me<strong>di</strong>ante il cosiddetto star schema(Figura 2.10).Figura 2.10: Star schema per le ven<strong>di</strong>te


32 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Uno schema a stella è composto da:• Un insieme <strong>di</strong> tabelle, chiamate tabelle delle <strong>di</strong>mensioni (<strong>di</strong>mension table). Ciasc<strong>un</strong>a<strong>di</strong> queste tabelle è caratterizzata da <strong>un</strong>a chiave primaria e da <strong>un</strong> insieme <strong>di</strong>attributi che descrivono le <strong>di</strong>mensioni <strong>di</strong> analisi a <strong>di</strong>versi livelli <strong>di</strong> aggregazione;• Una tabella chiamata tabella dei fatti (fact table) in cui sono presenti le chiavi <strong>di</strong>tutte le tabelle delle <strong>di</strong>mensioni. La chiave primaria <strong>di</strong> questa tabella sarà datadall’insieme delle chiavi esterne delle <strong>di</strong>mension table. La tabella dei fatti contieneinoltre <strong>un</strong> attributo per ogni misura.La visione multi<strong>di</strong>mensionale si ottiene eseguendo il join tra la fact table e le <strong>di</strong>mensiontable.La seguente query SQL fornisce la quantità e l’incasso totale delle ven<strong>di</strong>te <strong>di</strong> surgelatirelative all’anno 2010 per la regione Emilia Romagna, raggruppata per responsabili.1 SELECT DT2. r e s p o n s a b i l e , SUM(FT. quantita ) , SUM(FT. i n c a s s o )2 FROM Ven<strong>di</strong>te FT, Prodotto DT1, Negozio DT2, Data DT33 WHERE FT. prodotto = DT1. prodotto ID AND4 FT. negozio = DT2. negozio ID AND5 FT. data = DT3. data ID AND6 DT1. c a t e g o r i a = ’ s u r g e l a t i ’ AND7 DT2. r e g i o n e = ’ Emilia Romagna ’ AND8 DT3. anno = 20109 GROUP BY DT2. r e s p o n s a b i l eSi noti come le <strong>di</strong>mension table violino la terza forma normale, ovvero contengono attributiche <strong>di</strong>pendono transitivamente da <strong>un</strong>a chiave. Una tale situazione introduce <strong>un</strong>aridondanza e per tanto richiede più spazio per la memorizzazione dei dati, ma allo stessotempo richiede <strong>un</strong> minor numero <strong>di</strong> join per reperire le informazioni. Si potrebbe peròessere interessati ad avere <strong>un</strong>o schema logico più vicino agli en<strong>un</strong>ciati della teoria relazionale;lo snowflake schema (Figura 2.11) lo permette in quanto caratterizzato da <strong>un</strong>aparziale normalizzazione delle <strong>di</strong>mension table.


2.2 Il modello multi<strong>di</strong>mensionale 33Uno schema snowflake è ottenibile da <strong>un</strong>o schema a stella scomponendo <strong>un</strong>a o più <strong>di</strong>mensiontable in più tabelle, in modo tale da eliminare alc<strong>un</strong>e delle <strong>di</strong>pendenze f<strong>un</strong>zionalitransitive in esse presenti. Le tabelle delle <strong>di</strong>mensioni le cui chiavi sono importate <strong>nel</strong>lafact table vengono dette primarie, mentre chiameremo secondarie le rimanenti.In questo modo è possibile trovare il giusto compromesso tra spazio in memoria utilizzatoe numero <strong>di</strong> join da effettuare per ricavare l’informazione desiderata. Si noti come a ognipasso <strong>di</strong> normalizzazione corrisponda <strong>un</strong> arco <strong>nel</strong>lo schema <strong>di</strong> fatto e <strong>un</strong>a sotto-gerarchiache invece verrà memorizzata in <strong>un</strong>a tabella a parte.Affinchè lo snowflaking sia efficace, tutti gli attributi del sottoalbero dell’attributo da cuiha origine la normalizzazione devono essere spostati <strong>nel</strong>la nuova relazione.La scelta <strong>di</strong> mappare elementi del mondo multi<strong>di</strong>mensionale <strong>nel</strong> modello relazionale potrebbeapparire <strong>un</strong>a forzatura. Tuttavia <strong>un</strong>a tale scelta è giustificata da <strong>un</strong> insieme <strong>di</strong>motivazioni <strong>di</strong> varia natura, prima fra tutte la constatazione che il modello relazionaleè <strong>di</strong> fatto lo standard <strong>nel</strong> <strong>settore</strong> dei database. Inoltre, l’evoluzione subita dai DBMSrelazionali <strong>nel</strong>l’arco degli anni della loro presenza sul mercato ne fa degli strumenti estremamenteraffinati ed ottimizzati.Figura 2.11: Snowflake schema ottenuto me<strong>di</strong>ante <strong>un</strong>a parziale normalizzazione dello starschema <strong>di</strong> Figura 2.10


34 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>2.2.2.2 I sistemi MOLAPNell’approccio MOLAP il data warehouse memorizza i dati usando strutture intrinsecamentemulti<strong>di</strong>mensionali: i dati vengono fisicamente memorizzati in vettori e l’accesso è<strong>di</strong> tipo posizionale. Il sistema alloca <strong>un</strong>a cella per ogni possibile combinazione dei valoridelle <strong>di</strong>mensioni e l’accesso ad <strong>un</strong> fatto avviene in modo <strong>di</strong>retto, sulla base delle coor<strong>di</strong>natefornite.L’utilizzo <strong>di</strong> <strong>un</strong>a tale soluzione rappresenta la soluzione naturale per <strong>un</strong> sistema <strong>di</strong> datawarehousing e può fornire prestazioni ottimali, in quanto le operazioni <strong>di</strong> query multi<strong>di</strong>mensionalenon devono essere simulate me<strong>di</strong>ante complesse istruzioni SQL. Il principaleproblema a cui però è soggetta la soluzione MOLAP, è la sparsità dei dati, rappresentatain Figura 2.12.Figura 2.12: Rappresentazione del fenomeno <strong>di</strong> sparsità dei dati: in bianco le celle relativead eventi effettivamente accadutiMe<strong>di</strong>amente in <strong>un</strong> cubo multi<strong>di</strong>mensionale meno del 20% delle celle contiene effettivamentedelle informazioni, mentre le restanti celle risultano essere vuote poiché corrispondonoad eventi non accaduti. La memorizzazione <strong>di</strong> celle non informative provoca <strong>un</strong>o sprecodello spazio su <strong>di</strong>sco.Il fenomeno della sparsità dei dati viene affrontato partizionando il cubo n-<strong>di</strong>mensionalein questione, in più sottocubi n-<strong>di</strong>mensionali che vengono detti ch<strong>un</strong>k. Si parla <strong>di</strong> ch<strong>un</strong>kdensi, se la maggior parte delle celle contengono dati, ch<strong>un</strong>k sparsi altrimenti [GR06].Un tale approccio permette <strong>di</strong> operare su blocchi <strong>di</strong> dati <strong>di</strong> <strong>di</strong>mensione inferiore e chequin<strong>di</strong> potranno essere caricati agevolmente in memoria.


2.2 Il modello multi<strong>di</strong>mensionale 35Figura 2.13: Sud<strong>di</strong>visione del cubo multi<strong>di</strong>mensionale in ch<strong>un</strong>k: in bianco i ch<strong>un</strong>k densiSi osserva però che la memorizzazione <strong>di</strong>retta <strong>di</strong> ch<strong>un</strong>k sparsi comporta <strong>un</strong> notevole spreco<strong>di</strong> spazio dovuto alla rappresentazione delle celle che non contengono informazioni. Perquesto motivo i ch<strong>un</strong>k sparsi vengono utilizzati me<strong>di</strong>ante <strong>un</strong> in<strong>di</strong>ce che riporta l’offsetdelle sole celle che contengono informazioni.Oltre al problema relativo allo spreco <strong>di</strong> memoria, <strong>un</strong> altro fattore debilitante per la<strong>di</strong>ffusione dei sistemi MOLAP è costituito dalla mancanza <strong>di</strong> standard. I <strong>di</strong>versi strumenti<strong>di</strong>sponibili sul mercato sono accom<strong>un</strong>ati dai soli principi <strong>di</strong> base (come può essere lagestione della sparsità), mentre non si è a conoscenza dei dettagli implementativi. Nonesiste infatti <strong>un</strong>o standard <strong>di</strong> interrogazione che svolga il ruolo che l’SQL svolge nei sistemirelazionali.2.2.2.3 Slowly Changing Dimensions (SCD)Per quanto è stato detto fino ad ora si potrebbe pensare che l’<strong>un</strong>ica componente <strong>di</strong>namicadel modello multi<strong>di</strong>mensionale siano i fatti e i relativi eventi che lo instanziano, portandocia pensare che le <strong>di</strong>mensioni, e <strong>di</strong> conseguenza le gerarchie, siano caratterizzate da <strong>un</strong>anatura statica. Ciò non sempre è vero. Può infatti capitare che la categoria <strong>di</strong> <strong>un</strong> prodottovenga cambiata, oppure che <strong>un</strong> negozio venga spostato da <strong>un</strong> <strong>di</strong>stretto all’altro, o ancorache <strong>un</strong> cliente cambi agente. Kimball (1996) chiama questo fenomeno slowly changing<strong>di</strong>mensions. Un tale fenomeno richiede mo<strong>di</strong>fiche, seppur minime, alle <strong>di</strong>mensioni ed èda considerarsi come <strong>un</strong> evento straor<strong>di</strong>nario legato alla manutenzione del data mart.Per far fronte allo slowly changing <strong>di</strong>mensions, durante la fase <strong>di</strong> modellazione logica saràpossibile scegliere fra tre tipi <strong>di</strong> tecniche (più <strong>un</strong>a ibrida): [KRT + 07]


36 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>• Tipo 1 : Sovrascrittura (Overwrite). È <strong>un</strong>a tecnica che prevede la semplice sovrascrittura<strong>di</strong> <strong>un</strong>o o più attributi <strong>nel</strong>le <strong>di</strong>mensioni esistenti. Il vecchio valore andràperso, per tanto è bene utilizzare questa metodologia quando non si ha interesse <strong>nel</strong>memorizzare lo storico per l’attributo <strong>di</strong>mensionale in questione. Si supponga <strong>di</strong>porsi <strong>nel</strong>lo scenario in cui <strong>un</strong>a tale mo<strong>di</strong>fica debba essere effettuata su <strong>un</strong>o schemaa stella (ovvero <strong>un</strong>o scenario <strong>nel</strong> quale è stata adottata <strong>un</strong>a soluzione ROLAP). Nelmomento in cui interverrà <strong>un</strong>a mo<strong>di</strong>fica a <strong>un</strong> valore <strong>di</strong> <strong>un</strong>a tupla della <strong>di</strong>mensiontable sarà sufficiente sovrascrivere il vecchio valore con il nuovo. Come conseguenzatutti i dati della fact table vengono associati al nuovo valore della <strong>di</strong>mension table.• Tipo 2 : Creazione <strong>di</strong> <strong>un</strong>a nuova riga (Create new row). È la tecnica standardper registrare la verità storica, ovvero consente <strong>di</strong> mo<strong>di</strong>ficare le <strong>di</strong>mensioni inmodo che esse vengano poi associate correttamente ai fatti. Nell’esempio <strong>di</strong> <strong>un</strong>ostar schema gli eventi della fact table dovranno essere associati ai dati <strong>di</strong>mensionaliche erano vali<strong>di</strong> quando si è verificato l’evento. Per realizzare questa tecnica basteràaggi<strong>un</strong>gere <strong>un</strong>a nuova riga <strong>nel</strong>la <strong>di</strong>mension table appropriata, senza andare adeliminare quella vecchia. Al vecchio record non sarà più possibile associare ness<strong>un</strong>nuovo evento. Per il sod<strong>di</strong>sfacimento <strong>di</strong> <strong>un</strong> tale vincolo è possibile aggi<strong>un</strong>gere <strong>un</strong>acolonna contenente <strong>un</strong> flag che in<strong>di</strong>chi la versione corrente, oppure assegnare adogni versione <strong>un</strong>a data <strong>di</strong> inizio ed <strong>un</strong>a data <strong>di</strong> fine, la versione in cui la data <strong>di</strong> finenon è stata settata sarà quella corrente.• Tipo 3 : Aggi<strong>un</strong>ta <strong>di</strong> <strong>un</strong>a nuova colonna (Add a new column). Questatecnica supporta variazioni degli attributi che avvengono in modo poco frequente.Essa infatti <strong>di</strong>mostra <strong>un</strong>a minor flessibilità ai cambiamenti rispetto la tecnica <strong>di</strong>tipo 2. Mentre per quest’ultima ogni cambiamento richiedeva l’aggi<strong>un</strong>ta <strong>di</strong> <strong>un</strong>anuova riga, per la tecnica <strong>di</strong> tipo 3 è richiesta la valorizzazione <strong>di</strong> apposite colonne.Il numero delle colonne a <strong>di</strong>sposizione è stabilito in fase <strong>di</strong> progettazione e per tantoil livello <strong>di</strong> storicizzazione risulta essere limitato. Tuttavia rende possibile riferirsiad <strong>un</strong> attributo che conterrà sia il nuovo che il vecchio valore.• Tecnica ibrida. Si basa sulla combinazione delle tecniche viste fino ad ora eviene talvolta in<strong>di</strong>cata come tecnica <strong>di</strong> tipo 6 (1+2+3 = 6). Per esempio, puòessere impiegata per avere la gestione dello storico offerto dalle soluzioni <strong>di</strong> tipo2, ma con la possibilità <strong>di</strong> raggi<strong>un</strong>gere agevolmente il valore corrente dell’attributo


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 37partendo dai vecchi valori. Quest’ultima caratteristica può essere ottenuta me<strong>di</strong>antela tecnica <strong>di</strong> tipo 3 memorizzando per ogni vecchio valore anche il valore correntein <strong>un</strong>’apposita colonna.Prima <strong>di</strong> affrontare la scelta della tecnica con la quale si desidera fronteggiare lo slowlychanging <strong>di</strong>mensions occorre precisare che l’adozione <strong>di</strong> gerarchie <strong>di</strong>namiche implica <strong>un</strong>sovraccosto in termini <strong>di</strong> spazio e può comportare <strong>un</strong>a forte riduzione delle prestazioni.È quin<strong>di</strong> in<strong>di</strong>spensabile valutare con attenzione i casi in cui impiegarle.2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI)L’aumento esponenziale del volume dei dati operazionali ha reso il calcolatore l’<strong>un</strong>ico supportoadatto al processo decisionale, inoltre l’utilizzo massiccio <strong>di</strong> tecniche <strong>di</strong> analisi deidati aziendali ha reso il sistema informativo <strong>un</strong> elemento strategico per la realizzazionedel business. Per questi motivi il ruolo dell’informatica è passato da passivo strumentoper la registrazione delle operazioni, a fattore decisivo per l’in<strong>di</strong>viduazione <strong>di</strong> elementicritici dell’organizzazione e <strong>di</strong> potenziali aree <strong>di</strong> business.Il termine <strong>Business</strong> <strong>Intelligence</strong> venne introdotto <strong>nel</strong> 1989 da Howard Dresner, per in<strong>di</strong>care<strong>un</strong> insieme <strong>di</strong> strumenti e procedure che consentono a <strong>un</strong>’azienda <strong>di</strong> trasformare ipropri dati <strong>di</strong> business in informazioni utili al processo decisionale, da rendere <strong>di</strong>sponibilialla persona giusta e <strong>nel</strong> formato idoneo. Le informazioni ottenute sono utilizzate daidecisori aziendali (decision maker) per definire e supportare le strategie <strong>di</strong> business.L’insieme delle applicazioni IT in <strong>un</strong>’azienda viene detto portafoglio applicativo (Figura2.14) e può essere <strong>di</strong>viso in tre segmenti principali:• Portafoglio <strong>di</strong>rezionale: è l’insieme delle applicazioni utilizzate dai manageraziendali per analizzare lo stato dell’azienda e prendere le decisioni migliori <strong>nel</strong>minor tempo possibile;• Portafoglio operativo:primari dell’azienda;comprende le applicazioni informatiche per i processi• Portafoglio istituzionale: comprende le applicazioni informatiche per i processi<strong>di</strong> supporto, quali amministrazione, gestione delle risorse umane, contabilità.


38 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Figura 2.14: Rappresentazione del portafoglio applicativo aziendaleIl portafoglio <strong>di</strong>rezionale viene anche detto piattaforma per la <strong>Business</strong> <strong>Intelligence</strong>. Essa,al fine <strong>di</strong> garantire ai manager analisi potenti e flessibili, deve possedere <strong>un</strong>’appositainfrastruttura hardware e software <strong>di</strong> supporto composta da:• Hardware de<strong>di</strong>cato;• Infrastrutture <strong>di</strong> rete;• DBMS;• Software <strong>di</strong> back-end;• Software <strong>di</strong> front-end.Il ruolo chiave <strong>di</strong> <strong>un</strong>a piattaforma <strong>di</strong> business intelligence è la trasformazione dei datiaziendali in informazioni fruibili a <strong>di</strong>versi livelli <strong>di</strong> dettaglio e, quin<strong>di</strong>, in conoscenza.La Figura 2.15 rappresenta quella che viene chiamata piramide della <strong>Business</strong> <strong>Intelligence</strong>.Decisioni efficaci e tempestive:L’abilità in<strong>di</strong>viduale e collettiva dei decision maker, che possiamo in<strong>di</strong>care con il termine<strong>di</strong> knowledge worker, rappresenta <strong>un</strong>o dei principali fattori che influenzano le prestazionie la competitività <strong>di</strong> <strong>un</strong>’organizzazione.


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 39Figura 2.15: Piramide della <strong>Business</strong> <strong>Intelligence</strong>: dai dati alla conoscenzaLa maggior parte dei knowledge worker elabora le proprie decisioni utilizzando in modoprevalente metodologie semplici e intuitive, che tengono conto <strong>di</strong> elementi quali esperienzepassate, conoscenza del contesto, informazioni <strong>di</strong>sponibili. Questa attitu<strong>di</strong>ne determina<strong>un</strong>o stile decisionale <strong>di</strong> indole statica, che trova <strong>di</strong>fficoltà ad adattarsi a con<strong>di</strong>zioni mutevolideterminate dai cambiamenti dell’ambiente economico. Nelle situazioni reali, iprocessi decisionali risultano troppo complessi e <strong>di</strong>namici per essere affrontati con efficaciame<strong>di</strong>ante analisi intuitive, e richiedono invece <strong>un</strong> or<strong>di</strong>namento più rigoroso, basato sumetodologie analitiche e modelli matematici.Un ambiente <strong>di</strong> business intelligence si propone <strong>di</strong> offrire ai knowledge worker strumentie metodologie che permettono <strong>di</strong> in<strong>di</strong>viduare decisioni efficaci e tempestive.Decisioni efficaci. Se il decision maker <strong>di</strong>spone <strong>di</strong> informazioni e conoscenze più atten<strong>di</strong>bili,ricavate sulla base <strong>di</strong> rigorose analisi quantitative, è in grado <strong>di</strong> formulare decisioni epiani d’azione che consentono <strong>di</strong> realizzare con maggiore efficacia gli obiettivi prefissati.In effetti, il ricorso a strumenti formali <strong>di</strong> indagine induce i decision maker a descrivere inmodo esplicito i criteri <strong>di</strong> valutazione delle scelte alternative e i meccanismi che regolano ilfenomeno analizzato. L’attività <strong>di</strong> stu<strong>di</strong>o e <strong>di</strong> riflessione che ne scaturisce determina <strong>un</strong>amaggiore consapevolezza e <strong>un</strong>a comprensione più approfon<strong>di</strong>ta della logica che governail processo decisionale.


40 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Decisioni tempestive. Le imprese operano in contesti economici caratterizzati da <strong>un</strong> elevatolivello competitivo e da forte <strong>di</strong>namicità. Di conseguenza, la capacità <strong>di</strong> reagirein modo tempestivo alle azioni dei competitori e alle nuove con<strong>di</strong>zioni <strong>di</strong> mercato rappresenta<strong>un</strong> fattore decisivo per determinare il successo <strong>di</strong> <strong>un</strong>’impresa o ad<strong>di</strong>rittura perconsentire la sua sopravvivenza.Se il decision maker <strong>di</strong>spone <strong>di</strong> <strong>un</strong> ambiente <strong>di</strong> business intelligence in grado <strong>di</strong> facilitareil suo compito, ci possiamo attendere che la qualità del processo decisionale netragga <strong>un</strong> complessivo beneficio [Ver06].2.3.1 Accedere al data warehouseFino ad oggi lo strumento principe per la <strong>Business</strong> <strong>Intelligence</strong> è stato sicuramente il DataWarehouse, le cui installazioni si stanno rapidamente consolidando, oltre che <strong>nel</strong>le gran<strong>di</strong>aziende anche in quelle <strong>di</strong> me<strong>di</strong>a <strong>di</strong>mensione. In particolare possiamo elencare alc<strong>un</strong>i deimeriti che sono riconosciuti al DW: [GR06]• Consente <strong>di</strong> gestire serie storiche dei dati;• Permette <strong>di</strong> effettuare analisi multi<strong>di</strong>mensionali;• Si basa su <strong>un</strong> modello semplice che può essere facilmente assimilato dai manager;• È alla base dei sistemi per il calcolo degli in<strong>di</strong>catori.Nel capitolo 3 abbiamo accennato a strumenti <strong>di</strong> accesso ai dati come <strong>un</strong>a componentedei sistemi <strong>di</strong> data warehousing. Li avevamo definiti come degli strumenti <strong>di</strong> front-end chegli utenti business hanno a loro <strong>di</strong>sposizione per consultare l’area <strong>di</strong> presentazione, ovveroil data warehouse. Di seguito presenteremo i due principali approcci all’interrogazione <strong>di</strong><strong>un</strong> DW da parte degli utenti finali: la reportistica e l’analisi multi<strong>di</strong>mensionale.ReportisticaÈ <strong>un</strong> approccio che permette agli utenti <strong>di</strong> accedere in modo tempestivo ai dati contenutinei DW e nei data mart. Solitamente l’accesso avviene a intervalli <strong>di</strong> tempo predefinitie le informazioni che si ricavano sono strutturate in modo invariabile. Proprio per quest’ultimoaspetto solitamente l’interrogazione viene definita a priori secondo quelle che


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 41sono le necessità dell’utente e successivamente integrata in <strong>un</strong>’applicazione. In questomodo l’utilizzatore <strong>di</strong> tale applicazione potrà eseguire l’interrogazione quando più ne habisogno sui dati correnti.Un rapporto (o report) è scomponibile in due parti: interrogazione e presentazione. L’interrogazioneè la parte che andrà a reperire i dati <strong>di</strong> interesse dal DW o data mart, mentrela presentazione provvede a presentare i dati ottenuti in forma grafica o tabellare. Lavali<strong>di</strong>tà <strong>di</strong> <strong>un</strong>o strumento <strong>di</strong> reportistica non è data solo dalla ricchezza <strong>nel</strong>la presentazionedei rapporti, ma anche dalla flessibilità dei meccanismi per la loro <strong>di</strong>stribuzione.Un rapporto infatti può essere sia generato manualmente dall’utente che automaticamenteper <strong>un</strong>a <strong>di</strong>stribuzione perio<strong>di</strong>ca agli utenti interessati, per esempio me<strong>di</strong>ante postaelettronica.Analisi multi<strong>di</strong>mensionaleL’analisi multi<strong>di</strong>mensionale è la più nota modalità <strong>di</strong> reperimento <strong>di</strong> informazioni contenutein <strong>un</strong> data warehouse. Si <strong>di</strong>fferenzia dalla reportistica statica proprio grazie allasua <strong>di</strong>namicità, permette infatti <strong>di</strong> sod<strong>di</strong>sfare quegli utenti le cui necessità <strong>di</strong> analisi nonsono ben note a priori. Mentre con gli strumenti <strong>di</strong> reportistica l’utente era limitato ad<strong>un</strong> ruolo passivo, con gli strumenti <strong>di</strong> analisi multi<strong>di</strong>mensionale l’utente svolge <strong>un</strong> ruoloattivo durante tutta la sessione <strong>di</strong> analisi.Facendo riferimento al concetto <strong>di</strong> cubo multi<strong>di</strong>mensionale, trattato <strong>nel</strong> capitolo 4, definiamoora le operazioni che vengono utilizzate durante l’analisi multi<strong>di</strong>mensionale, lecosiddette operazioni OLAP. Come prima cosa osserviamo quegli operatori che permettono<strong>di</strong> modellare la <strong>di</strong>mensione del cubo e quin<strong>di</strong> la quantità <strong>di</strong> dati che esso contiene.È possibile in<strong>di</strong>viduare due categorie <strong>di</strong>stinte.Restrizione. La grandezza del cubo viene ridotta me<strong>di</strong>ante l’imposizione <strong>di</strong> vincolisugli attributi <strong>di</strong>mensionali. Esistono sostanzialmente due operatori all’interno <strong>di</strong> questacategoria:• Slice: il cubo viene “tagliato a fettine”. La sua <strong>di</strong>mensionalità infatti viene ridottafissando <strong>un</strong> valore per <strong>un</strong>a o più delle <strong>di</strong>mensioni originarie. Per esempio, per leven<strong>di</strong>te potrebbe essere richiesto <strong>di</strong> osservare le sole ven<strong>di</strong>te dell’anno 2010, in questomodo viene eliminata la <strong>di</strong>mensione tempo. Oppure si potrebbe voler osservare le


42 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>sole ven<strong>di</strong>te del negozio x relativamente al prodotto y, in tal <strong>caso</strong> ad essere eliminatesaranno la <strong>di</strong>mensione negozio e prodotto;• Dice: il cubo viene “tagliato a cubetti”. Viene ridotto l’insieme dei dati attraversola formulazione <strong>di</strong> <strong>un</strong> criterio <strong>di</strong> selezione complesso. Tipicamente la <strong>di</strong>mensionalitàrimane invariata. Per esempio, per le ven<strong>di</strong>te se si vuole visualizzare le sole ven<strong>di</strong>tetra il 2004 ed il 2010 per i soli prodotti che presentano <strong>un</strong> costo superiore ai 100 euro.Si osserva che con l’imposizioni <strong>di</strong> tali vincoli la <strong>di</strong>mensionalità rimane invariata.Figura 2.16: Operatori <strong>di</strong> slice-and-<strong>di</strong>ceNella letteratura queste due operazioni vengono racchiuse <strong>nel</strong> termine slice-and-<strong>di</strong>ce (letteralmente,tagliare a fettine e cubetti).Aggregazione. L’aggregazione è <strong>un</strong> meccanismo <strong>di</strong> fondamentale importanza <strong>nel</strong>le basi<strong>di</strong> dati multi<strong>di</strong>mensionali. Si supponga <strong>di</strong> voler analizzare le ven<strong>di</strong>te <strong>nel</strong> loro dettagliomensile, anziché a livello giornaliero; ciò significa dover raggruppare, per ciasc<strong>un</strong> prodottoe negozio tutte le celle relative ai giorni <strong>di</strong> <strong>un</strong>o stesso mese in <strong>un</strong>’<strong>un</strong>ica macro-cella.L’aggregazione può essere operata contemporaneamente su più <strong>di</strong>mensioni, ovvero si potrebbedecidere <strong>di</strong> aggregare le ven<strong>di</strong>te per mese, tipo <strong>di</strong> prodotto e città del negozio.Anche in questo <strong>caso</strong> si possono in<strong>di</strong>viduare due operatori:• Roll-up: talvolta in<strong>di</strong>cato col termine drill-up, significa letteralmente arrotolare oalzare. Con questa operazione si induce <strong>un</strong> aumento <strong>nel</strong>l’aggregazione dei datieliminando <strong>un</strong> livello <strong>di</strong> dettaglio da <strong>un</strong>a gerarchia. Può essere utilizzata anche perridurre la <strong>di</strong>mensionalità del risultato, qualora tutti i dettagli <strong>di</strong> <strong>un</strong>a certa gerarchiavengano eliminati. Ad esempio, la rimozione della <strong>di</strong>mensione tempo conduce a


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 43consolidare le misure tramite la somma su tutti i perio<strong>di</strong> temporali presenti <strong>nel</strong>cubo <strong>di</strong> dati;• Drill-down: talvolta in<strong>di</strong>cato con il termine roll-down, significa letteralmente trivellare.È il duale dell’operatore roll-up, infatti esso <strong>di</strong>minuisce l’aggregazione dei datiintroducendo <strong>un</strong> ulteriore livello <strong>di</strong> dettaglio in <strong>un</strong>a gerarchia. Per esempio, puòessere utilizzato per passare dall’aggregazione per regione del cliente a quella, piùfine, per città del cliente. Come il roll-up permette <strong>di</strong> ridurre la <strong>di</strong>mensionalità, ildrill-down, essendo il suo duale, permette <strong>di</strong> aumentarla. Potremo infatti visualizzaregli incassi annuali <strong>di</strong> ogni categoria <strong>di</strong> prodotto, aggi<strong>un</strong>gendo le informazionisull’area geografica dei clienti.Figura 2.17: Effetti degli operatori <strong>di</strong> roll-up e drill-down sul cubo multi<strong>di</strong>mensionaleAggregazione e restrizione possono essere combinate per permettere <strong>un</strong> processo <strong>di</strong> analisimirato con precisione alle esigenze dell’utente.Come osservato in precedenza, le operazioni descritte sin ora permettono <strong>di</strong> alterare laquantità <strong>di</strong> dati da analizzare secondo quelle che sono le specifiche dell’analisi. Esistonotuttavia altre operazioni che possono essere usate per manipolare il cubo, e sono:• Pivoting: talvolta chiamata rotazione, permette <strong>di</strong> ruotare gli assi scambiando traloro alc<strong>un</strong>e <strong>di</strong>mensioni per ottenere <strong>un</strong>a <strong>di</strong>versa vista sul cubo <strong>di</strong> dati;• Drill-across: permette <strong>di</strong> stabilire <strong>un</strong> collegamento tra due o più cubi correlati alfine <strong>di</strong> compararne i dati;• Drill-through: è <strong>di</strong>sponibile solo in alc<strong>un</strong>i strumenti OLAP e consiste <strong>nel</strong> passaggiodai dati aggregati multi<strong>di</strong>mensionali del data warehouse ai dati operazionali presenti<strong>nel</strong>le sorgenti o <strong>nel</strong> livello riconciliato.


44 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>2.3.2 <strong>Business</strong> <strong>Intelligence</strong>: oltre il data warehouseNel precedente paragrafo abbiamo evidenziato le caratteristiche che hanno permesso ilsuccesso del data warehouse come strumento per la business intelligence. Tuttavia lasua ampia <strong>di</strong>ffusione ha comportato <strong>un</strong>a rapida maturazione degli utenti che, compreseappieno le sue potenzialità, cominciano a percepirne i limiti. Alc<strong>un</strong>i <strong>di</strong> queste limitazionisono:• I dati vengono aggiornati con <strong>un</strong>a perio<strong>di</strong>cità che <strong>di</strong>fficilmente è inferiore allasettimana/giorno.• Quando vengono eseguite complesse interrogazioni, al <strong>di</strong> fuori del modello multi<strong>di</strong>mensionale,il DW risulta essere poco efficiente;• Registra solo il passato e non offre scenari per la formulazione <strong>di</strong> previsioni.L’utente necessita <strong>di</strong> tecniche <strong>di</strong> analisi più potenti e non basate sul modello multi<strong>di</strong>mensionale,analisi che gli permettano <strong>di</strong> operare su dati provenienti da fonti eterogenee econ aggiornamenti più rapi<strong>di</strong>. Inoltre sorge la necessità <strong>di</strong> poter “pre<strong>di</strong>re il futuro”.A tali scopi si propongono varie soluzioni: il data mining, <strong>un</strong> processo <strong>di</strong> esplorazione eanalisi <strong>di</strong> <strong>un</strong> insieme <strong>di</strong> dati, generalmente <strong>di</strong> gran<strong>di</strong> <strong>di</strong>mensioni, per in<strong>di</strong>viduare eventualiregolarità, estrarre conoscenza e ricavare regole ricorrenti significative; l’analisi what-ifche permette <strong>di</strong> formulare scenari <strong>di</strong> previsione basati su modelli <strong>di</strong> business e trendaziendale; il business-performance-management (BPM), inteso come <strong>un</strong> framework peril controllo della performance aziendale che permette <strong>di</strong> con<strong>di</strong>videre la strategia scelta atutti i livelli dell’azienda. Il data mining e l’analisi what-if sono tecniche ben note <strong>nel</strong>laletteratura, ma che tuttavia, a causa della loro complessità, sono state quasi sempre ignoratein ambito aziendale, in favore del data warehousing, la cui complessità risulta esseredecisamente inferiore. Il BPM invece rappresenta <strong>un</strong>a soluzione innovativa soprattuttodal p<strong>un</strong>to <strong>di</strong> vista tecnologico.Al giorno d’oggi il panorama aziendale è da considerarsi pronto per utilizzare tecnicheall’avanguar<strong>di</strong>a come quelle appena descritte.


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 452.3.2.1 Data MiningLe attività <strong>di</strong> data mining costituiscono <strong>un</strong> processo <strong>di</strong> analisi <strong>di</strong> natura iterativa svolto suvoluminose basi <strong>di</strong> dati, con l’obiettivo <strong>di</strong> estrarre informazioni e conoscenze che risultinoaccurate e potenzialmente utili ai knowledge worker <strong>nel</strong> corso dei processi decisionali.Pren<strong>di</strong>amo in considerazione l’analisi multi<strong>di</strong>mensionale e osserviamo come essa non permettaall’utente <strong>di</strong> in<strong>di</strong>viduare modelli significativi come sequenze ripetute, correlazionie associazioni tra i dati o raggruppamenti interessanti all’interno della grande mole <strong>di</strong>dati che si vuole esaminare. I modelli appena citati sono solo alc<strong>un</strong>i esempi <strong>di</strong> quelli chevengono chiamati pattern, ovvero <strong>un</strong>a rappresentazione sintetica e ricca <strong>di</strong> semantica <strong>di</strong><strong>un</strong> insieme <strong>di</strong> dati (Rizzi, 2003). Il data mining raccoglie tutta <strong>un</strong>a serie <strong>di</strong> metodologiedell’intelligenza artificiale e del pattern recognition come per esempio algoritmi genetici,logica fuzzy e reti neurali, con l’obiettivo <strong>di</strong> aiutare l’utente <strong>nel</strong> processo <strong>di</strong> estrazionedella conoscenza (knowledge <strong>di</strong>scovery). Il processo <strong>di</strong> knowledge <strong>di</strong>scovery, rappresentatoin Figura 2.18, è <strong>di</strong> tipo iterativo e prevede quattro fasi <strong>di</strong>stinte: [GR06]• Selezione: vengono selezionati i dati da sottoporre al processo. Essi possonoprovenire da data base operazionale, dal data warehouse oppure da data streamalimentati per esempio dalle macchine <strong>di</strong> produzione;• Preparazione: i dati vengono ripuliti e trasformati <strong>nel</strong> formato richiesto dagli algoritmidel passo successivo;• Data mining: viene scelto ed eseguito l’algoritmo opport<strong>un</strong>o per generare i pattern;• Valutazione: I pattern in<strong>di</strong>viduati vengono visualizzati ed esaminati. Se i risultatinon sono sod<strong>di</strong>sfacenti si innesca <strong>un</strong>a retroazione verso le fasi precedenti.Ve<strong>di</strong>amo ora alc<strong>un</strong>e delle principali f<strong>un</strong>zionalità <strong>di</strong> data mining ed i relativi pattern cheesse si prestano ad in<strong>di</strong>viduare.Caratterizzazione. È <strong>un</strong> processo che si focalizza su <strong>un</strong> attributo target e opera su<strong>di</strong> esso con svariate finalità. Può infatti operare <strong>un</strong>a caratterizzazione <strong>di</strong> tale attributoosservando il valore che esso assume per tutti i record che appartengono ad <strong>un</strong>a determinataclasse, oppure evidenziare la <strong>di</strong>stribuzione dei valori che l’attributo assume peri record appartenenti ad <strong>un</strong>a medesima classe confrontandoli, per esempio, con quelli


46 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>Figura 2.18: Il processo <strong>di</strong> knowledge <strong>di</strong>scovery<strong>di</strong> <strong>un</strong>a classe <strong>di</strong>versa. È <strong>un</strong>a tecnica molto semplice da realizzare e i risultati vengonovisualizzati all’utente in forma grafica.Serie storiche. Talvolta l’attributo target è soggetto ad <strong>un</strong>’evoluzione temporale checonsiste in <strong>un</strong>a sequenza dei valori che tale attributo assume. Le serie storiche sono <strong>un</strong>af<strong>un</strong>zionalità <strong>di</strong> data mining che stu<strong>di</strong>ano fenomeni caratterizzati da <strong>un</strong>a <strong>di</strong>namica temporalee si propongono <strong>di</strong> pre<strong>di</strong>re il valore della variabile target per <strong>un</strong>o o più perio<strong>di</strong> futuri.


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 47Regole associative. Consentono <strong>di</strong> determinare le regole <strong>di</strong> implicazione logica presenti<strong>nel</strong>la base <strong>di</strong> dati, ovvero regole della forma:X ⇒ YSe per esempio X e Y sono insiemi <strong>di</strong> prodotti , avremo che le transazioni che contengonoprodotti in X tendono a contenere anche quelli in Y. Ad ogni regola riscontrata vengonoattribuite due misure: il supporto e la confidenza. Con il supporto si in<strong>di</strong>ca la percentualedelle transazioni che contengono sia X che Y, mentre la confidenza in<strong>di</strong>ca in chepercentuale le transazioni che contengono X contengono anche Y.Le aziende della grande <strong>di</strong>stribuzione ricorrono a regole <strong>di</strong> associazione per pianificare la<strong>di</strong>sposizione dei prodotti sugli scaffali o nei cataloghiClustering. Il termine cluster viene utilizzato per riferirsi ad <strong>un</strong> sottogruppo omogeneopresente all’interno <strong>di</strong> <strong>un</strong>a popolazione. Le tecniche <strong>di</strong> clustering svolgono operazioni<strong>di</strong> segmentazione <strong>di</strong> <strong>un</strong>a popolazione eterogenea. Solitamente è <strong>un</strong>a tecnica che vieneutilizzata durante la fase preliminare <strong>di</strong> data mining, in quanto consente <strong>di</strong> in<strong>di</strong>viduarecategorie <strong>di</strong> dati tra loro omogenei, consentendo così alle successive attività <strong>di</strong> mining <strong>di</strong>focalizzarsi sul cluster in interesse.Alberi decisionali. Vengono utilizzate per comprendere <strong>un</strong> determinato fenomeno,permettono infatti <strong>di</strong> classificare, in or<strong>di</strong>ne <strong>di</strong> importanza, le cause che portano al verificarsi<strong>di</strong> <strong>un</strong> evento. In prossimità <strong>di</strong> ciasc<strong>un</strong> nodo dell’albero viene effettuata <strong>un</strong>a scelta,solitamente attraverso il confronto <strong>di</strong> <strong>un</strong> attributo con <strong>un</strong>a costante; gli archi che esconodal nodo rappresentano l’esito del confronto. Le decisioni finali sono contenute <strong>nel</strong>lefoglie.


48 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>2.3.2.2 Analisi what-ifAssumendo <strong>un</strong> particolare insieme <strong>di</strong> con<strong>di</strong>zioni iniziali l’analisi what-if consente <strong>di</strong> formularealc<strong>un</strong>i scenari <strong>di</strong> previsione al fine <strong>di</strong> valutare il comportamento <strong>di</strong> <strong>un</strong> sistemareale. È evidente come questo tipo <strong>di</strong> approccio superi quelli che sono i limiti delle analisiche si basano sulla semplice consultazione del data warehouse (ovvero reportistica edanalisi multi<strong>di</strong>mensionale, osservate <strong>nel</strong> paragrafo precedente).Come prima cosa l’analista dovrà riprodurre <strong>un</strong> modello che sia in grado <strong>di</strong> simulare ilsistema in esame, ovviamente maggiore sarà l’accuratezza con il quale viene <strong>di</strong>segnato,più atten<strong>di</strong>bili saranno i risultati che da esso si ricaveranno. In genere il modello vienecostruito me<strong>di</strong>ante <strong>un</strong> processo iterativo, dove ad ogni passo viene verificato il suo comportamentoconfrontando i risultati in output con <strong>un</strong> insieme <strong>di</strong> dati <strong>di</strong> test. Le tecniche<strong>di</strong> analisi what-if possono essere classificate in base al metodo utilizzato per la creazionedel modello. Esistono sostanzialmente due tipologie:• Tecniche induttive: Sono le soluzioni più semplici da realizzare in quanto vengonoosservati solo gli effetti del comportamento <strong>di</strong> <strong>un</strong> sistema, mentre le cause sonocompletamente ignorate. La costruzione del modello fa riferimento al principiodescritto sinteticamente dalla seguente frase: “se fino ad ora è andata così, andràcosì anche dopo!”. Le tecniche induttive si basano infatti sul comportamento che ilsistema ha avuto durante <strong>un</strong> certo intervallo temporale. Per questo motivo vengonotalvolta dette estensionali;• Tecniche deduttive: I problemi osservati <strong>nel</strong>l’approccio induttivo vengono superatigrazie ad <strong>un</strong>a approfon<strong>di</strong>ta conoscenza delle regole che governano il sistema. Ilmodello che verrà generato sarà caratterizzato da <strong>un</strong> insieme <strong>di</strong> rapporti del tipocausa-effetto. I limiti <strong>di</strong> queste tecniche emergono <strong>nel</strong> <strong>caso</strong> in cui i rapporti primacitati formino dei cicli <strong>di</strong> retroazione.Solitamente, in<strong>di</strong>pendentemente dalla tecnica scelta, la modellazione viene effettuata suidati del data warehouse, poiché esso rappresenta il principale serbatoio che memorizza leserie storiche degli eventi verificatisi in azienda.


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 492.3.2.3 <strong>Business</strong> Performance Management (BPM)Fusione e acquisizioni, cambiamenti nei modelli <strong>di</strong> business, nuovi requisiti industriali emutamenti <strong>nel</strong>le aspettative dei clienti pongono <strong>un</strong> grande numero <strong>di</strong> problemi a livello<strong>di</strong> processi che le aziende devono continuamente affrontare. La gestione dei processi businessconsente alle aziende <strong>di</strong> gestire i cambiamenti incrementali dei processi che sonorichiesti simultaneamente in molte aree dell’azienda.<strong>Business</strong> Performance Management (BPM). Insieme <strong>di</strong> attività atte a misurarele proprie prestazioni incoraggiando l’efficacia dei processi aziendali e l’usoefficiente delle risorse umane, materiali ed economiche.La misurazione delle prestazioni dei processi aziendali può essere realizzata me<strong>di</strong>antedegli specifici in<strong>di</strong>catori detti Key Performance In<strong>di</strong>cator (KPI). Il p<strong>un</strong>to <strong>di</strong> forzadei KPI è quello <strong>di</strong> permettere ai manager <strong>di</strong> fissare delle regole che non si prestino aequivoci o a interpretazioni personali, il che non accade quando si utilizzano allo stessotempo regole <strong>di</strong> comportamento e <strong>di</strong>rettive aziendali.Il BPM richiede che i valori degli in<strong>di</strong>catori siano continuamente aggiornati e resi <strong>di</strong>sponibilial momento giusto <strong>nel</strong>la forma più adatta a supportare le attività decisionali.Si <strong>di</strong>fferenzia dalla classica soluzione <strong>di</strong> data warehousing per le seguenti caratteristiche:[GR06]• Utenti: il BPM interessa sempre i decisori, ma a livello operativo e tattico anzichéstrategico;• Tempo <strong>di</strong> risposta: dal momento che le decisioni dei livelli tattico e operativo devonoavvenire con maggior frequenza rispetto a quelle del livello strategico, i sistemi <strong>di</strong>BPM dovranno avere perio<strong>di</strong> <strong>di</strong> aggiornamento più brevi rispetto a quelli del datawarehouse;• Livello <strong>di</strong> dettaglio: poiché gli eventi <strong>di</strong> interesse dei BPM sono attività ben specifiche,il dettaglio delle informazioni che dovranno avere a <strong>di</strong>sposizione è <strong>di</strong> conseguenzapiù elevato rispetto a quello del data warehouse;• Tempo <strong>di</strong> vita: a <strong>di</strong>fferenza del livello <strong>di</strong> dettaglio, il tempo <strong>di</strong> vita delle informazioniper il BPM sarà decisamente minore rispetto a quello che richiedono i sistemi <strong>di</strong>


50 Introduzione alla <strong>Business</strong> <strong>Intelligence</strong>data warehousing. Questo perché gli utenti BPM sono interessati alle performanceattuali della propria attività;• Interfaccia utente: le informazioni verranno presentate all’utente sotto forma reporto tramite allarmi innescati automaticamente me<strong>di</strong>ante il controllo <strong>di</strong> regole <strong>di</strong>business.Alla luce <strong>di</strong> quanto appena detto risulta evidente come DW e BPM siano profondamente<strong>di</strong>fferenziati e allo stesso tempo complementari.Si noti come BPM sia anche l’acronimo utilizzato per il business process management cheperò è inerente alle modalità <strong>di</strong> gestione aziendale per processi.2.3.3 Ciclo delle analisi <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong>Ciasc<strong>un</strong>a analisi <strong>di</strong> business intelligence si sviluppa secondo modalità autonome che risentonodel contesto, delle caratteristiche soggettive dei decision maker e degli strumentianalitici <strong>di</strong>sponibili. Tuttavia è possibile identificare <strong>un</strong> percorso ideale che caratterizzal’evoluzione delle singole analisi <strong>di</strong> business intelligence, come rappresentato in Figura 2.19[Ver06].Figura 2.19: Fasi <strong>di</strong> <strong>un</strong>’analisi <strong>di</strong> business intelligenceAnalisi. In questa fase si deve comprendere in maniera precisa il problema da affrontare,<strong>un</strong> decision maker elabora <strong>un</strong> modello del fenomeno analizzato, selezionando i fattori cherisultano maggiormente rilevanti. La possibilità <strong>di</strong> esplorare secondo <strong>di</strong>verse viste logichei cubi <strong>di</strong> dati <strong>nel</strong> corso delle analisi multi<strong>di</strong>mensionali, permette a <strong>un</strong> decision maker <strong>di</strong>


2.3 La <strong>Business</strong> <strong>Intelligence</strong> (BI) 51mo<strong>di</strong>ficare con flessibilità e tempestività le sue ipotesi. Osserviamo quin<strong>di</strong> come le metodologie<strong>di</strong> business intelligence permettano <strong>di</strong> sviluppare rapidamente <strong>di</strong>versi percorsi<strong>di</strong> analisi.Comprensione. In <strong>un</strong> secondo momento il decision maker dovrà approfon<strong>di</strong>re ognicaratteristica del problema rilevato durante la fase <strong>di</strong> analisi. In pratica si tratta <strong>di</strong> trasformarele informazioni precedentemente identificate in conoscenza. Questo processo <strong>di</strong>trasformazione può avvenire me<strong>di</strong>ante l’intuizione e l’esperienza del decision maker oppuretramite eventuali informazioni non strutturate in suo possesso.Decisione. È la fase in cui le conoscenze vengono tradotte in decisioni e successivamentein azioni. La business intelligence permette <strong>di</strong> svolgere le fasi <strong>di</strong> analisi e comprensionein modo più rapido e <strong>di</strong> conseguenza anche decisioni più efficaci e tempestive.Misura. Durante la fase <strong>di</strong> misura ci si preoccupa <strong>di</strong> misurare le prestazioni, basatesu metriche comprendenti non solo in<strong>di</strong>catori finanziari ma anche prestazionali relativi ai<strong>di</strong>versi segmenti aziendali.Le metodologie <strong>di</strong> business intelligence riducono i tempi del ciclo analisi-decisione-azionerevisione,con <strong>un</strong> miglioramento della qualità dei processi decisionali.


CAPITOLO 3La tecnologia Oracle BI 11gIntroduzione al mondo OracleLa Oracle Corporation è <strong>un</strong>a multinazionale americana specializzata <strong>nel</strong>lo sviluppo ecommercializzazione <strong>di</strong> sistemi hardware e prodotti software enterprise. Ha sede in California,<strong>nel</strong>la Silicon Valley.Venne fondata <strong>nel</strong> 1977 da Larry Ellison, Bob Miner e Ed Oates con il nome “SoftwareDevelopment Laboratories” (SDL). Due anni dopo, <strong>nel</strong> 1979, la società venne rinominata“Relational Software Inc.”. Negli anni Ottanta, in seguito al successo del progetto Oracle,<strong>un</strong> database commissionato dalla CIA, la società ass<strong>un</strong>se il suo nome attuale.Presente in oltre 145 paesi <strong>nel</strong> mondo, Oracle Corporation oggi produce, sviluppa, commercializzae offre servizi legati all’infrastruttura tecnologica, alle business applications eai sistemi hardware.Dal gennaio 2005 con l’acquisizione <strong>di</strong> PeopleSoft, e quin<strong>di</strong> della piattaforma ERP JDEdwards, Oracle ha lanciato la sua strategia <strong>di</strong> acquisizioni che fino ad ora l’ha portataad acquisire quasi 60 aziende e a raggi<strong>un</strong>gere numerosi primati. In particolare, Peoplesoftha assicurato la leadership <strong>nel</strong>le applicazioni per la gestione delle Risorse Umane,Siebel Systems in area CRM, Hyperion in ambito Enterprise Performance Managemente <strong>Business</strong> <strong>Intelligence</strong>; mentre BEA Systems ha assicurato dei primati in alc<strong>un</strong>e aree


54 La tecnologia Oracle BI 11gdel Middleware. Con S<strong>un</strong> Microsystems, Oracle ha esteso la propria proposta anche aisistemi operativi e ai sistemi hardware oltre a <strong>di</strong>ventare proprietario <strong>di</strong> Java.Nel nostro Paese, Oracle è presente dal 1993 con se<strong>di</strong> principali a Milano e Roma e confiliali a Torino, Padova, Bologna e Vercelli.Oracle in Italia opera al fianco <strong>di</strong> circa 900 <strong>Business</strong> Partner e de<strong>di</strong>ca loro <strong>un</strong>o specificoprogramma, denominato Oracle PartnerNetwork (OPN) Specialized, a garanzia <strong>di</strong> <strong>un</strong>supporto continuativo ed efficiente [Oraa].3.1 Oracle e la business intelligenceIn questa sezione sono riportati gli aspetti del pensiero Oracle riguardo alla costruzione<strong>di</strong> <strong>un</strong> business case per la business intelligence [Ora09].<strong>Business</strong> case.È la collezione <strong>di</strong> (buoni) motivi per dare il via ad <strong>un</strong> progetto.Il business case tipico per la BI è quello <strong>di</strong> aiutare a prendere decisioni migliori, tuttaviaavere le giuste informazioni è solo <strong>un</strong>a parte del processo decisionale. I beneficidell’avere <strong>un</strong>a soluzione <strong>di</strong> BI si realizzano quando si implementa <strong>un</strong>a decisione e nondal processo decisionale in sé. Una soluzione <strong>di</strong> BI, aiuta a migliorare le f<strong>un</strong>zionalità <strong>di</strong>:reportistica, analisi e previsioni (in or<strong>di</strong>ne dalla meno importante alla più importante).Ogni business case inizia con <strong>un</strong>a comprensione del livello <strong>di</strong> ambizione che l’aziendasceglie <strong>di</strong> avere. Esistono tre <strong>di</strong>fferenti livelli <strong>di</strong> ambizione:• Efficienza: Concentrarsi sul miglioramento dell’efficienza aiuta gli utenti a lavoraremeglio <strong>nel</strong>l’ambito delle mansioni che già svolgono;• Efficacia: Curare l’aspetto dell’efficacia del business aiuta l’organizzazione adoperare le scelte giuste;• Cambiamento: Consente <strong>di</strong> avere la possibilità <strong>di</strong> fare nuove cose.I <strong>di</strong>versi incarichi che le persone ricoprono in azienda portano ciasc<strong>un</strong>o ad avere <strong>un</strong>aprospettiva <strong>di</strong>versa del medesimo problema. Si noti, infatti, che i responsabili IT focalizzerannola loro attenzione sull’efficienza, mentre i <strong>di</strong>rigenti aziendali sono interessati agestire il cambiamento.


3.1 Oracle e la business intelligence 55Un business case per la business intelligence è <strong>di</strong>segnato su cinque <strong>di</strong>stinti livelli:• Dati ed infrastruttura;• Strumenti <strong>di</strong> BI ed applicazioni <strong>di</strong> gestione delle prestazioni;• Uso, governance e BICC (BI Competency Center, coor<strong>di</strong>na la gestione delle informazioni);• Processi gestionali ed operativi;• Strategia <strong>di</strong> business.I vari livelli si “appoggiano” <strong>un</strong>o all’altro. È quin<strong>di</strong> necessario coinvolgere tutti i livelli inmodo da creare <strong>un</strong> link <strong>di</strong>retto tra i requisiti <strong>di</strong> business del cliente e le varie componentiche costituiscono la struttura operativa che supporta i suddetti requisiti.I livelli <strong>di</strong> ambizione possono essere combinati con quelli appena descritti generando laTabella 3.1, <strong>nel</strong>le celle sono riportati degli esempi <strong>di</strong> attività che devono essere affrontatedurante la realizzazione del business case.Standar<strong>di</strong>zzazione degli strumenti <strong>di</strong> BIRiportiamo al lettore i risultati <strong>di</strong> due ricerche relative all’impiego delle tecnologie <strong>di</strong>business intelligence all’interno delle aziende:• il 40% delle organizzazioni utilizzano ancora dai 3 ai 5 strumenti <strong>di</strong> BI, ed oltre il20% almeno 6 o più strumenti <strong>di</strong> BI (Forrester Research, 2008);• le aziende che hanno implementato <strong>un</strong>a soluzione <strong>di</strong> BI usando gli strumenti <strong>di</strong> <strong>un</strong><strong>un</strong>ico fornitore software sono aumentate dal 24% del 2005 al 42% del 2007. Dalsondaggio del 2007 è anche emerso che le aziende che hanno classificato la propriasoluzione BI come “<strong>di</strong> successo” implementavano <strong>un</strong> sistema realizzato utilizzandogli strumenti <strong>di</strong> <strong>un</strong> <strong>un</strong>ico fornitore software.La Figura 3.1 illustra la situazione appena descritta


56 La tecnologia Oracle BI 11gEfficienza Efficacia CambiamentoStrategia <strong>di</strong> Eccellenza Eccellenza Nuovi modellibusiness operativa gestionale <strong>di</strong> businessProcessi Riduzione dei Creazione <strong>di</strong> <strong>un</strong>’ Nuovi processi <strong>di</strong>costi, maggiori organizzazione business, integrazioneprestazioni, più che sia moderna, della catena per laqualitàagile ed allineata crezione del valoreUso e governance Il BICC Il BICC crea BICC esteso,supporta gli strumentiusatie con<strong>di</strong>vide conoscenzaall’internodell’organizzazionecreazione e con<strong>di</strong>visionedella conoscenza all’interno<strong>di</strong> tutta lacatena della creazionedel valoreStrumenti <strong>di</strong> BI eapplicazioni <strong>di</strong> gestioneStandar<strong>di</strong>zzazionedegli strumentiAggi<strong>un</strong>ta <strong>di</strong> nuovef<strong>un</strong>zionalitàConverge con la gestionedei processi <strong>di</strong>delle presta-business, le applica-zionizioni business ed ilmiddlewareDati ed infrastrutturaConcentrarsi sul Fare il p<strong>un</strong>to sul-ImplementazioneTCOla flessibilità <strong>di</strong> <strong>un</strong>’architetturaorientata ai servizi(SOA)Tabella 3.1: Matrice business case per la BI.


3.1 Oracle e la business intelligence 57Figura 3.1: Standar<strong>di</strong>zzazione degli strumenti e successo della BILa proposta Oracle, per quanto riguarda gli strumenti <strong>di</strong> business intelligence, è datadalla suite Oracle <strong>Business</strong> <strong>Intelligence</strong> Fo<strong>un</strong>dation. Essa è composta da Oracle <strong>Business</strong><strong>Intelligence</strong> Enterprise E<strong>di</strong>tion, Oracle BI Publisher, Oracle Essbase, Oracle Scorecard eStrategy Management e Oracle Essbase Analytics Link (EAL) [Ora11a].Il componente <strong>di</strong> maggior rilievo è senza dubbio la suite Oracle <strong>Business</strong> <strong>Intelligence</strong> EnterpriseE<strong>di</strong>tion (da ora in poi più semplicemente OBIEE), gi<strong>un</strong>ta alla versione 11.1.1.3.0,rilasciata il 13 agosto 2010. La Figura 3.2 fornisce <strong>un</strong>a panoramica della sua architettura.Figura 3.2: Architettura <strong>di</strong> OBIEE 11g


58 La tecnologia Oracle BI 11gLa suite OBIEE 11g, è completamente integrata con il Fusion Middleware <strong>di</strong> Oracle.Questo, dal p<strong>un</strong>to <strong>di</strong> vista architetturale, si traduce principalmente con l’adozione <strong>di</strong>Oracle Web Logic Application Server come piattaforma per tutti i servizi JEE dellasuite, a cui si affiancano i servizi C++ e J2SE ere<strong>di</strong>tati dalla precedente release.3.2 Architettura logicaL’architettura logica del sistema Oracle <strong>Business</strong> <strong>Intelligence</strong> è composta da <strong>un</strong> <strong>un</strong>ico insiemeintegrato <strong>di</strong> componenti gestibili, detto dominio BI (BI domain). Tali componentipossono risiedere su <strong>di</strong> <strong>un</strong> <strong>un</strong>ico host oppure essere separati in più host per ragioni <strong>di</strong>performance, <strong>di</strong>sponibilità e sicurezza.Figura 3.3: Architettura logica <strong>di</strong> OBIEE 11g su <strong>un</strong> singolo host


3.2 Architettura logica 59Un dominio BI è composto da: componenti Java, componenti <strong>di</strong> sistema e da <strong>un</strong> insieme<strong>di</strong> altri componenti tra cui repository dei metadati e presentation catalog [Orad].Componenti JavaVengono <strong>di</strong>stribuiti come applicazioni JEE per servizi SOAP, HTTP ed altre forme <strong>di</strong>richiesta. Nell’architettura mostrata in Figura 3.3 possiamo notare la presenza <strong>di</strong> duecontenitori JEE: l’Administration Server ed il Managed Server.L’Administration Server contiene i componenti Java necessari per l’amministrazionedel sistema. Tali componenti sono:• JMX MBeans: provvede a schematizzare gli accessi per la gestione del dominio BI;• Fusion Middleware Control:gestire il dominio BI;è l’interfaccia utente <strong>di</strong> amministrazione usata per• WebLogic Server Administration Console: è l’interfaccia utente <strong>di</strong> amministrazioneper la gestione avanzata <strong>di</strong> WebLogic, componenti JEE e sicurezza.Figura 3.4: Architettura logica <strong>di</strong> OBIEE 11g su più host


60 La tecnologia Oracle BI 11gIl Managed Server fornisce l’ambiente <strong>di</strong> r<strong>un</strong>-time per servizi Java-based e applicazioniinterne al sistema. Un dominio <strong>di</strong> BI può possedere più Managed Server che possonoessere <strong>di</strong>stribuiti su <strong>un</strong>o o più host. I componenti Java gestiti sono:• Action Services: fornisce i servizi Web de<strong>di</strong>cati che vengono richiesti dall’ActionFramework (descritto <strong>nel</strong> paragrafo 3.4.5) e che consentono all’amministratore <strong>di</strong>configurare manualmente quali <strong>di</strong>rectory del servizio Web possono essere sfogliatedagli utenti quando questi eseguono <strong>un</strong>a determinata azione;• SOA Services: fornisce servizi Web de<strong>di</strong>cati per gli oggetti <strong>nel</strong> presentation catalogper invocare analisi, agenti e con<strong>di</strong>zioni;• BI Office: provvede all’integrazione tra OBIEE ed i prodotti Microsoft Office;• Real-Time Decisions (RTD): fornisce soluzioni software enterprise <strong>di</strong> analisi chepermettono alle aziende <strong>di</strong> prendere le migliori decisioni in tempo reale;• BI Plugin: è <strong>un</strong>’applicazione JEE che ha il compito <strong>di</strong> instradare le richieste SOAPe HTTP ai Presentation Services (che saranno descritti in seguito);• BI Publisher: fornisce <strong>un</strong>a soluzione <strong>di</strong> reportistica per la creazione, gestione e<strong>di</strong>stribuzione <strong>di</strong> report “pixel perfect” a <strong>di</strong>pendenti, clienti e fornitori;• Security Services: fornisce servizi Web de<strong>di</strong>cati che consentono l’integrazione del BIServer (che descriveremo in seguito) con la piattaforma <strong>di</strong> sicurezza Oracle FusionMiddleware.Sia l’Administration che il Managed Server vengono eseguiti su Java virtual machinede<strong>di</strong>cate.Infine il Node Manager fornisce servizi per la gestione dei processi per l’Administrationed il Managed Server. Esso infatti permette <strong>di</strong> avviare, arrestare e riavviare le loro istanzein remoto.Componenti <strong>di</strong> sistemaI componenti <strong>di</strong> sistema forniscono i servizi base (C++ o J2SE) per poter eseguire OBIEE,e sono:


3.2 Architettura logica 61• BI Server: fornisce le f<strong>un</strong>zionalità <strong>di</strong> query ed accesso ai dati che sono il cuore <strong>di</strong>OBIEE;• Presentation Services: forniscono il framework e l’interfaccia per la presentazionedei dati <strong>di</strong> business intelligence. È loro compito gestire il Presentation Catalog (chesarà trattato successivamente);• Scheduler: permette <strong>di</strong> schedulare la consegna <strong>di</strong> analisi agli utenti in momentispecifici. BI Publisher possiede <strong>un</strong>o scheduler proprio;• JavaHost: offre servizi che permettono al Presentation Server <strong>di</strong> supportare componenticome i task dello Scheduler, BI Publisher e la generazione dei grafici;• Cluster Controller: ha il compito <strong>di</strong> <strong>di</strong>stribuire le richieste al BI Server ed assicurareche il carico <strong>di</strong> lavoro <strong>di</strong> tali richieste siano bilanciate su tutti i BI Server <strong>nel</strong> dominioBI.L’OPMN (Oracle Process Manager and Notification server) ha il compito <strong>di</strong> gestire icomponenti appena descritti.Repository dei metadatiIl repository dei metadati è <strong>un</strong> file con estensione rpd dalle <strong>di</strong>mensioni solitamente compresetra 0.5MB e 2MB. Ha il compito <strong>di</strong> memorizzare i metadati <strong>di</strong> cui necessita il BIServer per trasformare <strong>un</strong>a query logica, ovvero <strong>un</strong>a interrogazione che viene costruitadall’utente che non è a conoscenza della struttura delle sorgenti, <strong>nel</strong>la relativa query fisicada eseguire sui dati sorgente. Un repository è sud<strong>di</strong>viso in tre livelli, come mostrato inFigura 3.5: [Orac]• Livello fisico: definisce gli oggetti e le loro relazioni, necessarie al BI Server percostruire le query native sui dati fisici. Può essere creato importando tabelle, cubie flat file dalle fonti dati. Il livello fisico ha il compito <strong>di</strong> separare il comportamentologico delle applicazioni dal modello fisico, dando quin<strong>di</strong> la possibilità <strong>di</strong> <strong>un</strong>ire piùfonti dati fisiche in <strong>un</strong> <strong>un</strong>ico oggetto logico. Una separazione <strong>di</strong> questo tipo assicura<strong>un</strong>a elevata portabilità;


62 La tecnologia Oracle BI 11gFigura 3.5: Traduzione <strong>di</strong> <strong>un</strong>a query logica <strong>nel</strong>la relativa query fisica attraverso i 3 livellidel repository• Livello logico: definisce il modello business dei dati e la mappatura con gli schemifisici. In questo livello si determina il comportamento analitico percepito dagli utentie viene definito l’insieme degli oggetti e delle relazioni a <strong>di</strong>sposizione dell’utente;• Livello <strong>di</strong> presentazione: fornisce <strong>un</strong> modo sicuro e personalizzato per rappresentareil modello business. Nel livello <strong>di</strong> presentazione vengono create le cosiddettesubject area che permettono <strong>di</strong> sud<strong>di</strong>videre il modello business in più parti.Il repository dei metadati viene gestito dall’Administration Tool, <strong>un</strong>’applicazione Windowsappartenente alla suite dei client tools, trattata <strong>nel</strong> paragrafo 3.5Come accennato in precedenza, il BI server si serve del repository per trasformare le querylogiche <strong>nel</strong>le query native che saranno poi eseguite sui dati sorgente. La Figura 3.6 mostracome il BI Server interagisce con le query dei client, le sorgenti dati, l’AdministrationTool e il repository.Presentation CatalogHa il compito <strong>di</strong> memorizzare in <strong>un</strong>a struttura <strong>di</strong> <strong>di</strong>rectory gli oggetti creati dagli utenti.Tali oggetti possono essere: analisi, dashboard, filtri, prompt, ecc. Ogni qual volta <strong>un</strong>utente salva <strong>un</strong> oggetto come quelli appena in<strong>di</strong>cati, esso verrà automaticamente memorizzatoall’interno del Presentation Catalog.


3.3 Installazione del prodotto 63Figura 3.6: Architettura del BI ServerCome per il repository esiste <strong>un</strong>’applicazione anche per la gestione del PresentationCatalog ed è il Catalog Manager.3.3 Installazione del prodottoRequisiti <strong>di</strong> sistemaOBIEE 11g offre senza dubbio <strong>un</strong>’architettura più scalabile e strumenti <strong>di</strong> gestione piùmaturi rispetto la release precedente. Per contro, la complessità <strong>di</strong> gestione è superioree sono richieste maggiori risorse <strong>di</strong> sistema. I requisiti <strong>di</strong> sistema consigliati da Oraclesono: [Ora11b]• Spazio su <strong>di</strong>sco: 20GB o più;• Memoria RAM: 4GB o più;• Spazio temporaneo: 950MB o più;• Spazio <strong>di</strong> swap: 3GB o più;• CPU: dual-core Pentium, 1.5GHz o maggiore.


64 La tecnologia Oracle BI 11gDBMS supportati:• Oracle 10.2.0.4+ , 11.1.0.7+, 11.2.0.1+;• IBM DB2 9.1+, 9.5+, 9.7+;• MS SQL Server 2005, 2008;• Teradata 12, 13.Sistemi operativi supportati: [Orae]• Oracle/Red Hat Enterprise Linux 4 (Update 7+), 5 (Update 3+);• SUSE Linux Enterprise Server 10 (SP1+), 11;• Windows 2003 SP2/R2+;• Windows Server 2008 SP1+;• Windows Server 2008 R2.InstallazioneIl pacchetto <strong>di</strong> installazione <strong>di</strong> Oracle <strong>Business</strong> <strong>Intelligence</strong>, include i seguenti prodotti:[Orab]• OBIEE 11g (Answers, Dashboards, Delivers, Repository Administration Tool, Officee Oracle <strong>Business</strong> <strong>Intelligence</strong> Publisher);• Oracle <strong>Business</strong> <strong>Intelligence</strong> Publisher;• Oracle Real-Time Decisions.È possibile installare <strong>un</strong>o, due o tutti e tre i prodotti che con<strong>di</strong>videranno la stessastruttura Oracle Fusion Middleware all’interno del medesimo dominio WebLogic. Unatipica installazione <strong>di</strong> Oracle BI prevede <strong>un</strong>a Fusion Middleware home e le seguentisotto<strong>di</strong>rectory:• wlserver 10.3 : è la home del WebLogic server e contiene: i componenti Java, <strong>un</strong>Administration Server e <strong>un</strong>o o più Managed Server;


3.3 Installazione del prodotto 65• user projects: contiene i domini dei prodotti, inclusi <strong>un</strong>o o più domini BI;• Oracle BI1 : contiene i file binari (in sola lettura) propri <strong>di</strong> Oracle <strong>Business</strong> <strong>Intelligence</strong>.Figura 3.7: Tipica struttura delle <strong>di</strong>rectory <strong>di</strong> Oracle BISono inoltre previste tre modalità <strong>di</strong> installazione:• Simple Install: l’installazione verrà eseguita con i settaggi <strong>di</strong> default, su <strong>un</strong> singolocomputer e <strong>nel</strong> minor numero <strong>di</strong> passi;• Enterprise Install: permette <strong>di</strong> effettuare <strong>un</strong>a installazione enterprise <strong>di</strong>stribuita.La configurazione non è quella <strong>di</strong> default, sarà possibile infatti specificare impostazionicome: percorsi delle <strong>di</strong>rectory, nomi degli host, numeri <strong>di</strong> porta e moltoaltro;• Software Only: con questa modalità <strong>di</strong> installazione vengono installati i soli filebinari, la configurazione dovrà per tanto essere eseguita separatamente. Per sistemia 64-bit costituisce l’<strong>un</strong>ica modalità <strong>di</strong> installazione possibile.Non esiste <strong>un</strong>’<strong>un</strong>ica procedura <strong>di</strong> installazione. Essa <strong>di</strong>pende dal sistema operativo (Windowso Linux) e dalla sua architettura (32 o 64 bit). Ciò che le accom<strong>un</strong>a è la necessità <strong>di</strong>creare <strong>un</strong>o schema su <strong>un</strong> database me<strong>di</strong>ante l’utility RCU (Repository Creation Utlity).Per installazioni su macchine a 64 bit o macchine Linux non è prevista l’installazionedei client tools, in quanto questi ultimi sono <strong>di</strong>sponibili solo per macchine Windows 32-bit. È tuttavia possibile scaricare ed installare i soli client tools, facendoli poi collegare


66 La tecnologia Oracle BI 11gin remoto con il server sul quale è installato OBIEE.Per i sistemi a 64 bit è inoltre richiesto che l’installazione della JDK e <strong>di</strong> WebLogicvenga fatta separatamente prima <strong>di</strong> procedere all’installazione, che avverrà in modalità“Software Only”.3.4 Componenti <strong>di</strong> front-endOBIEE 11g fornisce <strong>un</strong>a suite completamente integrata <strong>di</strong> prodotti complementari perfornire <strong>un</strong>a gamma completa <strong>di</strong> f<strong>un</strong>zionalità <strong>di</strong> analisi.I Presentation Services forniscono l’interfaccia utente che viene utilizzata per la visualizzazionedei dati provenienti dal BI Server. Tramite questa interfaccia gli utenti possonoaccedere agli strumenti <strong>di</strong> front end che verranno descritti <strong>di</strong> seguito [Ora11a].3.4.1 Analisi e reportisticaOBIEE 11g mette a <strong>di</strong>sposizione dell’utente <strong>un</strong> ambiente web per la creazione <strong>di</strong> analisi,reportistica e query ad-hoc. Questo ambiente era conosciuto <strong>nel</strong>la precedente versione conil nome <strong>di</strong> “BI Answers”, in OBIEE 11g si parlerà <strong>di</strong> “BI Analysis and Reporting”.Le f<strong>un</strong>zionalità messe a <strong>di</strong>sposizione dell’utente sono:• In<strong>di</strong>pendenza dai dati sorgente: gli utenti interagiscono con <strong>un</strong>a vista logica delleinformazioni, che maschera completamente la complessità della struttura dei datisorgente. Inoltre non è richiesto che gli utenti siano a conoscenza <strong>di</strong> come le regolebusiness sono calcolate. Esse infatti vengono definite <strong>nel</strong> repository (come descrittoprecedentemente);• Con<strong>di</strong>visione online delle analisi: <strong>un</strong>a volta salvata la propria analisi, l’utente potràcon<strong>di</strong>viderla online pubblicandola all’interno <strong>di</strong> <strong>un</strong>a Dashborad (trattate <strong>nel</strong>paragrafo 3.4.2);• Salvataggio delle analisi: misure, attributi descrittivi, filtri, pattern <strong>di</strong> or<strong>di</strong>namento,grafici e viste in tabelle pivot possono essere aggi<strong>un</strong>te, eliminate e mo<strong>di</strong>ficate in ognimomento. Al termine delle mo<strong>di</strong>fiche, la nuova analisi può essere salvata e con<strong>di</strong>visacon <strong>un</strong> gruppo <strong>di</strong> utenti;


3.4 Componenti <strong>di</strong> front-end 67• Potenti analisi ad-hoc: poiché il processo analitico è spesso iterativo, non vengonoimposti vincoli sull’or<strong>di</strong>ne con il quale l’analisi viene costruita. Infatti, per esempio,la selezione delle misure, l’aggi<strong>un</strong>ta o la mo<strong>di</strong>fica <strong>di</strong> filtri, l’aggi<strong>un</strong>ta o la rimozione<strong>di</strong> colonne e la possibilità <strong>di</strong> visualizzare il risultato, sono attività che possono essereeffettuate in <strong>un</strong> qualsiasi momento ed or<strong>di</strong>ne durante la costruzione delle analisi;• Personalizzazione: le informazioni a cui accedono gli utenti vengono filtrate epersonalizzate automaticamente in base all’identità e al ruolo dell’utente stesso.Una sessione <strong>di</strong> analisi in OBIEE 11g comincia con la selezione della subject area, peresempio le ven<strong>di</strong>te. Successivamente vengono mostrati all’utente tutti gli oggetti businessche avrà a <strong>di</strong>sposizione per costruire l’analisi. Una volta terminato, il BI Analysis andReporting genera la relativa query in SQL logico e la invia al BI Server che provvede aconvertirla <strong>nel</strong>la equivalente query fisica.La Figura 3.8 mostra l’interfaccia messa a <strong>di</strong>sposizione dell’utente per la creazione delleanalisi. A sinistra possiamo notare la subject area, mentre al centro la visualizzazionedel risultato.Figura 3.8: Costruzione <strong>di</strong> <strong>un</strong>’analisi con BI Analysis and ReportingUna caratteristica fondamentale che <strong>un</strong>’analisi deve possedere è la chiarezza del risultato.OBIEE 11g offre svariate modalità <strong>di</strong> visualizzazione tra cui grafici e <strong>di</strong>agrammi, tabellepivot, viste geospaziali, ecc.


68 La tecnologia Oracle BI 11g3.4.2 DashboardUna dashboard (o cruscotto) è <strong>un</strong>a collezione <strong>di</strong> oggetti che, raccolti per aree tematiche,mostrano <strong>un</strong> certo quadro della situazione. La maggior parte <strong>di</strong> tali oggetti vengonocreati me<strong>di</strong>ante BI Analysis and Reporting. Le dashboard hanno il compito <strong>di</strong> facilitarel’accesso degli utenti ad analisi costruite in precedenza e offrono le seguenti f<strong>un</strong>zionalità:• Potenza <strong>di</strong> analisi: le dashboard costituiscono <strong>un</strong> potente ambiente per l’analisiinterattiva dei dati, in quanto permettono la loro navigazione;• Con<strong>di</strong>visione online delle informazioni: la possibilità <strong>di</strong> pubblicare online le dashboardcostituisce <strong>un</strong> fondamentale metodo per la con<strong>di</strong>visione delle informazioni;• Personalizzazione: ogni cruscotto può essere personalizzato in modo tale da visualizzareautomaticamente i dati in base all’identità e al ruolo dell’utente che lirichiede;• Filtraggio dati: possono essere visualizzate analisi prefiltrate da valori <strong>di</strong> default oimmessi manualmente dagli utenti;• Con<strong>di</strong>visione offline delle informazioni: le dashboard possono essere salvate e <strong>di</strong>stribuiteper <strong>un</strong> utilizzo <strong>di</strong> tipo offline come report o Briefing Book (decritti <strong>nel</strong>paragrafo 3.4.6). Inoltre il contenuto <strong>di</strong> <strong>un</strong> cruscotto può essere scaricato in fileExcel o PowerPoint;• Salvataggio personalizzazioni: gli utenti possono mo<strong>di</strong>ficare analisi, filtri, layout,ecc. e salvare le mo<strong>di</strong>fiche sia per uso personale che con<strong>di</strong>viso;• Personalizzazione dello stile: Il look and feel delle dashboard può essere mo<strong>di</strong>ficatoutilizzando i Casca<strong>di</strong>ng Style Sheet (CSS).Gli utenti interagiscono con le dashboard filtrando i dati me<strong>di</strong>ante l’inserimento <strong>di</strong> valoriin <strong>un</strong> prompt, eseguendo operazioni <strong>di</strong> drill-down per accedere a informazioni più dettagliate,mo<strong>di</strong>ficando l’or<strong>di</strong>namento delle colonne, ecc.La creazione dei cruscotti, molto spesso, avviene per mano degli utenti stessi senza ness<strong>un</strong>coinvolgimento <strong>di</strong> specialisti IT.La Figura 3.9 mostra <strong>un</strong> esempio <strong>di</strong> dashboard.


3.4 Componenti <strong>di</strong> front-end 69Figura 3.9: Un esempio <strong>di</strong> dashboard interattiva3.4.3 Scorecard e Strategy ManagementOracle Scorecard e Strategy Management estende la suite Oracle BI con f<strong>un</strong>zionalità destinatea com<strong>un</strong>icare gli obiettivi strategici in tutta l’organizzazione e il monitoraggio deiloro progressi <strong>nel</strong> tempo. Permette <strong>di</strong> stabilire obiettivi specifici, definire le modalità permisurare il loro successo, e com<strong>un</strong>icare informazioni a tutta l’organizzazione. I <strong>di</strong>pendentipossono quin<strong>di</strong> capire il loro impatto sul raggi<strong>un</strong>gimento del successo e allineare le loroazioni <strong>di</strong> conseguenza.Figura 3.10: Un esempio <strong>di</strong> scorecard


70 La tecnologia Oracle BI 11g3.4.4 BI PublisherBI Publisher viene utilizzato per la realizzazione <strong>di</strong> report statici con personalizzazioneavanzata del layout grafico (“pixel perfect”). Permette inoltre, l’estrazione <strong>di</strong> dati da piùsorgenti e la loro pubblicazione in svariati formati, consentendo <strong>di</strong> pianificare la consegnadei report alle destinazioni.Gli utenti finali possono creare facilmente il layout grafico utilizzando strumenti desktopfamiliari come Microsoft Word, Microsoft Excel o Adobe Acrobat, oppure me<strong>di</strong>ante <strong>un</strong>nuovo strumento WYSIWYG <strong>di</strong> layout designer utilizzabile <strong>di</strong>rettamente <strong>nel</strong> browser, ilBI Publisher Layout E<strong>di</strong>tor. Gli sviluppatori invece, possono scegliere <strong>di</strong> utilizzare AdobeFlex Builder o <strong>un</strong> qualsiasi IDE XML.Figura 3.11: Costruzione <strong>di</strong> <strong>un</strong> report pixel perfect me<strong>di</strong>ante BI Publisher Layout E<strong>di</strong>tor3.4.5 Actionable <strong>Intelligence</strong>OBIEE 11g estende le f<strong>un</strong>zionalità <strong>di</strong> reporting tra<strong>di</strong>zionali appena descritte, offrendo lapossibilità <strong>di</strong>:


3.4 Componenti <strong>di</strong> front-end 71• rilevare il verificarsi <strong>di</strong> determinate con<strong>di</strong>zioni e <strong>di</strong> inviare degli alert agli utentiinteressati;• avviare <strong>di</strong>rettamente processi esterni.Queste f<strong>un</strong>zionalità vengono offerte rispettivamente dal BI Delivers e dall’Action Frameworkche saranno brevemente descritti <strong>di</strong> seguito.BI DeliversBI Delivers, attraverso la creazione <strong>di</strong> Agenti, offre la possibilità <strong>di</strong> monitorare proattivamentele informazioni <strong>di</strong> business, allertare gli utenti tramite mail, dashboard e <strong>di</strong>spositivimobili come telefoni cellulari e permette <strong>di</strong> prendere decisioni rapide in f<strong>un</strong>zione degli alertche sono stati ricevuti.Gli agenti possono essere concatenati, ovvero possono scambiarsi informazioni tra loro.Essi vengono creati me<strong>di</strong>ante <strong>un</strong>’apposita interfaccia, mostrata in Figura 3.12, <strong>nel</strong>la qualel’utente può specificare le opzioni <strong>di</strong> consegna degli alert, definire profili, programmarel’esecuzione automatica <strong>di</strong> <strong>un</strong> report e molto altro ancora.Figura 3.12: Creazione <strong>di</strong> <strong>un</strong> agente tramite BI Delivers


72 La tecnologia Oracle BI 11gAction FrameworkÈ <strong>un</strong>a particolare f<strong>un</strong>zione altamente innovativa che agisce da collegamento fra l’analisie l’azione dando agli utenti la possibilità <strong>di</strong> attivare <strong>un</strong> processo <strong>di</strong> business o <strong>un</strong> Webservice <strong>di</strong>rettamente dal proprio cruscotto.3.4.6 BI MobileSempre più frequentemente gli utenti manifestano il desiderio <strong>di</strong> avere a <strong>di</strong>sposizione o<strong>di</strong> poter reperire le informazioni business anche quando non sono in ufficio. OBIEE offretre possibili soluzioni a questo problema.Briefing BooksUn Briefing Book è <strong>un</strong> documento che cattura il contenuto <strong>di</strong> <strong>un</strong>a dashboard e ne consentela visualizzazione in modalità <strong>di</strong>sconnessa, da parte <strong>di</strong> chi<strong>un</strong>que <strong>di</strong>sponga del softwareBriefing Book reader. Offrono <strong>un</strong> metodo per creare istantanee delle dashboard, visualizzarleoffline, o con<strong>di</strong>viderle con gli altri e ne possiedono lo stesso “look and feel”. IBriefing Book forniscono anche <strong>un</strong> metodo per archiviare le informazioni <strong>di</strong> <strong>un</strong>a dashboardpoiché possono essere salvati localmente sul PC <strong>di</strong> <strong>un</strong> utente. I Briefing Bookpersonalizzati possono essere <strong>di</strong>stribuiti automaticamente (via e-mail) tramite Oracle BIDelivers a gruppi <strong>di</strong> utenti.BI MobileLe aziende richiedono che le informazioni possano essere reperibili in qualsiasi momento.I <strong>di</strong>spositivi mobili svolgono <strong>un</strong> ruolo chiave in questo contesto, per tanto OBIEE offrela possibilità <strong>di</strong> accedere a tutti i contenuti delle dashboard tramite <strong>di</strong>spositivi mobili.Si noti come <strong>un</strong> tale approccio renda ancora più efficace il ruolo giocato dagli agenti chehanno il compito <strong>di</strong> inviare gli alert.Plug-in OfficeL’Add-In <strong>di</strong> Microsoft Office integra le informazioni <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> provenientidal BI Server, BI Analysis and Reporting, dashboards e BI Publisher con l’ambiente<strong>di</strong> Microsoft Office. Questo permette <strong>di</strong> incorporare dati aziendali aggiornatissimi nei


3.5 L’Administration Tool 73documenti <strong>di</strong> Microsoft Word, Excel e PowerPoint. Gli utenti possono quin<strong>di</strong> con<strong>di</strong>viderequesti documenti sul Web per attuare <strong>un</strong> processo decisionale veramente collaborativo.3.5 L’Administration ToolÈ <strong>un</strong>o strumento facente parte dei client tool che permette <strong>di</strong> operare con efficienza suimetadati contenuti <strong>nel</strong> repository. La Figura 3.13 mostra l’interfaccia dell’AdministrationTool; si noti la netta separazione dei tre livelli del repository.Figura 3.13: Sud<strong>di</strong>visione dei tre livelli del repository <strong>nel</strong>l’Administration ToolL’Administration Tool aiuta gli amministratori a preparare le formule (per esempio <strong>un</strong>apercentuale rispetto a <strong>un</strong> totale) e ne assicura la correttezza, oppure consente <strong>di</strong> crearecentinaia <strong>di</strong> misure <strong>di</strong> confronto per le serie temporali (per esempio, ven<strong>di</strong>te dell’annoprecedente, percentuale <strong>di</strong> mo<strong>di</strong>fica rispetto all’anno precedente, rapporto <strong>di</strong> ven<strong>di</strong>tarispetto all’anno precedente, e così via) in pochi secon<strong>di</strong>. F<strong>un</strong>zionalità sofisticate <strong>di</strong>gestione del progetto permettono inoltre a più amministratori <strong>di</strong> operare simultaneamentesui repository dei metadati.Ecco alc<strong>un</strong>e delle principali f<strong>un</strong>zionalità offerte dall’Administration Tool:• Gestione delle mo<strong>di</strong>fiche: fornisce numerosi servizi per facilitare la gestione dellemo<strong>di</strong>fiche. Per esempio, <strong>un</strong> wizard <strong>di</strong> rinomina semplifica il cambiamento dei nomi


74 La tecnologia Oracle BI 11g<strong>di</strong> più oggetti simultaneamente, la sostituzione <strong>di</strong> testo, la mo<strong>di</strong>fica <strong>di</strong> maiuscole/-minuscole e l’aggi<strong>un</strong>ta <strong>di</strong> prefissi o suffissi. Questo, a sua volta, semplifica il trascinamentoe il rilascio <strong>di</strong> colonne fisiche <strong>nel</strong> livello della modellazione e mappaturabusiness e consente <strong>di</strong> attribuire loro nomi logici più leggibili e significativi;• Amministrazione dei metadati: per semplificare le operazioni con i repository <strong>di</strong>gran<strong>di</strong> <strong>di</strong>mensioni, il tool <strong>di</strong> amministrazione permette all’amministratore <strong>di</strong> strutturaree organizzare i metadati, per esempio utilizzando cartelle, per organizzare glioggetti. L’amministratore può inserire tutte le tabelle <strong>di</strong>mensionali in <strong>un</strong>a singolacartella e tutte le gerarchie in <strong>un</strong>a cartella <strong>di</strong>fferente o, alternativamente, inserire<strong>un</strong>a tabella <strong>di</strong>mensionale e le gerarchie correlate <strong>nel</strong>la stessa cartella e utilizzareicone grafiche per contrassegnare gli oggetti per finalità specifiche;• Dipendenza e analisi degli impatti: <strong>un</strong>a utility consente all’amministratore <strong>di</strong> cercarenei metadati oggetti per tipo, pur filtrando le proprietà e le relazioni con glialtri oggetti. Per esempio, <strong>un</strong> amministratore può trovare tutte le colonne logicheche <strong>di</strong>pendono da <strong>un</strong>a specifica tabella o colonna fisica per determinare quali oggetti<strong>di</strong> business vengano influenzati dall’eventuale eliminazione dal database <strong>di</strong> <strong>un</strong>aspecifica colonna fisica;• Esportazione/importazione: il tool <strong>di</strong> amministrazione offre f<strong>un</strong>zionalità <strong>di</strong> esportazionee importazione dei metadati per spostare i sistemi dagli ambienti <strong>di</strong> staginga quelli <strong>di</strong> produzione e per esportare i metadati su file a scopo <strong>di</strong> documentazione.Una utility <strong>di</strong> documentazione del repository genera <strong>un</strong> elenco <strong>di</strong> colonne <strong>di</strong> presentazione,colonne del modello <strong>di</strong> business loro corrispondenti, formule e sorgentifisiche mappate;• Collaborazione multi-utente per l’amministrazione: l’Administration Tool può essereutilizzato sia in modalità offline che online. Le mo<strong>di</strong>fiche online hanno effettoimme<strong>di</strong>atamente, senza dover riavviare il server. La modalità offline permette a<strong>di</strong>versi amministratori <strong>di</strong> operare mo<strong>di</strong>fiche in modo concomitante su <strong>un</strong>o stessorepository <strong>di</strong> metadati. Quando gli oggetti sono selezionati per la mo<strong>di</strong>fica, questi egli oggetti da cui <strong>di</strong>pendono sono <strong>di</strong>sponibili agli altri amministratori esclusivamentein formato <strong>di</strong> sola lettura;


3.6 Comparazione con gli altri competitor 75• Amministrazione degli utenti: il tool <strong>di</strong> amministrazione offre inoltre <strong>un</strong> modo pervisualizzare (e terminare) le sessioni utente correnti; per vedere le variabili utilizzatein ciasc<strong>un</strong>a sessione; per elencare le voci cache <strong>di</strong>sponibili per area tematica, utente,o tabella fisica; per riferire sulla storia recente dell’uso della cache.3.6 Comparazione con gli altri competitorIn questo paragrafo osserviamo le caratteristiche dei prodotti dei principali vendor <strong>di</strong>software per la business intelligence, caratteristiche che devono essere considerate dalleorganizzazioni che vogliono adottare soluzioni <strong>di</strong> business intelligence che sod<strong>di</strong>sfino leloro richieste.Riportiamo ora alc<strong>un</strong>e considerazioni fatte da Gartner, <strong>un</strong>a delle più importanti aziende<strong>di</strong> analisi del mercato IT. La Figura 3.14 mostra il Magic Quadrant pubblicato da Gartner<strong>nel</strong> gennaio 2011 [Gar11].Figura 3.14:Quadrante magico <strong>di</strong> Gartner relativo alle piattaforme <strong>di</strong> <strong>Business</strong><strong>Intelligence</strong> del mese <strong>di</strong> gennaio 2011


76 La tecnologia Oracle BI 11gI criteri <strong>di</strong> valutazione adottati dal Magic Quadrant sono: la completezza <strong>di</strong> visionee la capacità <strong>di</strong> esecuzione. Chi eccelle in entrambe fa parte dei leader. Chi habuona completezza <strong>di</strong> visione ma non ha <strong>un</strong>a solida capacità <strong>di</strong> esecuzione fa parte deivisionari. Chi ha buona capacità <strong>di</strong> esecuzione ma ha <strong>un</strong>a visione incompleta fa partedegli sfidanti, mentre, per concludere, chi ha <strong>un</strong>a visione incompleta e al tempo stessoha scarsa capacità <strong>di</strong> esecuzione viene definito come player <strong>di</strong> nicchia.Osserviamo ora le caratteristiche dei maggiori vendor <strong>di</strong> prodotti per la business intelligence.OraclePro: la piattaforma OBIEE è considerata lo standard <strong>di</strong> riferimento per la BI <strong>nel</strong>la maggiorparte delle aziende che la utilizzano. Inoltre permette <strong>un</strong> alto livello <strong>di</strong> integrazionecon le applicazioni aziendali e con l’infrastruttura informativa e supporta <strong>un</strong> elevato numero<strong>di</strong> utenti contemporaneamente.Contro: la release 11g ha avuto <strong>un</strong> ciclo <strong>di</strong> sviluppo e rilascio relativamente l<strong>un</strong>go. Lef<strong>un</strong>zionalità <strong>di</strong> data mining ed analisi what-if vengono offerte come parte <strong>di</strong> Oracle databasee del prodotto Oracle Real-Time Decision, entrambi i quali sono separati dallapiattaforma OBIEE.MicrostrategyPro: Microstrategy ha costruito la sua piattaforma da zero ed è specializzata <strong>nel</strong>le implementazioni<strong>di</strong> BI che girano su gran<strong>di</strong> data warehouse. È stata <strong>un</strong>a dei primi produttoriad investire pesantemente in applicazioni BI per <strong>di</strong>spositivi mobili. Fornisce <strong>un</strong> eccellentesupporto del prodotto che consente agli amministratori <strong>di</strong> risolvere in breve tempo iproblemi riscontrati. Si pone al primo posto per livello <strong>di</strong> integrazione dei componentidella piattaforma.Contro: nonostante l’ambiente <strong>di</strong> sviluppo Microstrategy sia <strong>un</strong>o dei più potenti e flessibili,presenta <strong>un</strong>a ripida curva <strong>di</strong> appren<strong>di</strong>mento. La creazione <strong>di</strong> dashboard e reportad-hoc non è particolarmente user-frendly per gli utenti business. Inoltre, i clientiMicrostrategy in<strong>di</strong>cano come limitazione più grande il costo del software.


3.6 Comparazione con gli altri competitor 77MicrosoftPro: Microsoft ha sempre investito <strong>nel</strong>la costruzione e miglioramento delle sue f<strong>un</strong>zionalità<strong>di</strong> BI in tre dei suoi prodotti: Microsoft Office, Microsoft SQL Server e MicrosoftSharePoint, al fine <strong>di</strong> aumentare il loro valore. I costi delle licenze sono tra i più bassi ela possibilità <strong>di</strong> poter utilizzare f<strong>un</strong>zionalità <strong>di</strong> business intelligence integrate in prodottigià presenti <strong>nel</strong>le aziende, conferisce ai prodotti Microsoft il più alto grado <strong>di</strong> “capacità<strong>di</strong> esecuzione” tra tutti i prodotti <strong>di</strong> BI presenti sul mercato.Contro: la scelta <strong>di</strong> offrire f<strong>un</strong>zionalità <strong>di</strong> BI in <strong>un</strong>a soluzione multi prodotto, soprattuttoconsiderando che tali prodotti svolgono anche f<strong>un</strong>zionalità non-BI, presenta per certiversi <strong>un</strong>a limitazione rispetto alle soluzioni <strong>di</strong> altri vendor, che integrano tutte (o quasitutte) le f<strong>un</strong>zionalità <strong>di</strong> business intelligence all’interno <strong>di</strong> <strong>un</strong> <strong>un</strong>ico prodotto. Un’altralimitazione è data dalla scarsa <strong>di</strong>sponibilità <strong>di</strong> strumenti orientati agli utenti business,facendo dei prodotti Microsoft BI delle soluzioni destinate agli sviluppatori. Infine, nonesiste <strong>un</strong> <strong>un</strong>ico livello per i metadati e le f<strong>un</strong>zionalità offerte per la loro modellazione sonomolto limitate.SAPPro: la combinazione <strong>di</strong> SAP e <strong>Business</strong> Object rappresenta la piattaforma più installatain assoluto. Il volume <strong>di</strong> dati e <strong>di</strong> utenti dei clienti SAP sono tra i maggiori sul mercato(quasi il doppio della me<strong>di</strong>a). Le sue f<strong>un</strong>zionalità <strong>di</strong> reporting e <strong>di</strong> costruzione <strong>di</strong> queryad-hoc vengono definite dai suoi clienti come i maggiori p<strong>un</strong>ti <strong>di</strong> forza del prodotto. Lapiattaforma SAP/BO viene completata <strong>nel</strong>le aree della collaborazione e <strong>nel</strong> supporto alledecisioni dai prodotti: StreamWork, Text-Analysis ed altri prodotti <strong>di</strong> gestione dell’informazionecon integrazione dei dati.Contro: tra le più frequenti lamentele mosse dai clienti fanno parte le basse performancee l’alto livello <strong>di</strong> <strong>di</strong>fficoltà delle implementazioni. L’esperienza dei clienti e la qualità delsoftware e del supporto tecnico sono tra i più bassi rilevati <strong>nel</strong> sondaggio Gartner.IBMPro: IBM detiene la leadership per quanto riguarda la “completezza <strong>di</strong> visione”. Il prodottoofferto per la business intelligence da IBM è IBM Cognos che offre la possibilità <strong>di</strong>effettuare sia analisi statiche sia <strong>di</strong> tipo pre<strong>di</strong>ttivo. In particolare, quest’ultima tipologia


78 La tecnologia Oracle BI 11g<strong>di</strong> analisi costituisce <strong>un</strong>o dei maggiori p<strong>un</strong>ti <strong>di</strong> forza del prodotto.Contro: Uno dei maggiori p<strong>un</strong>ti deboli del prodotto IBM è dato dalle performance, anchese la versione 10.1 <strong>di</strong> IBM Cognos <strong>di</strong>spone <strong>di</strong> f<strong>un</strong>zionalità specifiche per affrontareproblemi <strong>di</strong> performance. La scarsa <strong>di</strong>ffusione del prodotto può essere ricercata <strong>nel</strong>laelevata <strong>di</strong>fficoltà dell’implementazione dei progetti <strong>di</strong> business intelligence e dalla scarsausabilità del prodotto stesso. Infine, i costi elevati delle licenze (ben sopra alla me<strong>di</strong>a)costituiscono <strong>un</strong> ulteriore motivo <strong>di</strong> angoscia per i clienti.In cinque anni, il mercato delle piattaforme software <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> ha subitonotevoli trasformazioni, sopratutto per il susseguirsi <strong>di</strong> importanti acquisizioni. Diseguito vengono messe a confronto due istantanee con le posizioni occupate dai principaliplayer sul quadrante magico.Figura 3.15: Confronto delle posizioni occupate dai maggiori vendor <strong>di</strong> piattaforme <strong>di</strong><strong>Business</strong> <strong>Intelligence</strong> <strong>nel</strong> quadrante magico <strong>di</strong> Gartner <strong>nel</strong> 2006 e <strong>nel</strong> 2011


3.6 Comparazione con gli altri competitor 79Nel 2006 i due principali leader del mercato erano <strong>Business</strong> Objects e Cognos. A<strong>di</strong>stanza <strong>di</strong> 5 anni il quadrante dei leader si è decisamente affollato. Le strategie che hannocontrad<strong>di</strong>stinto l’evoluzione del mercato sono riconducibili a due modelli fondamentali:• l’acquisizione/fusione <strong>di</strong> più realtà per potenziare e completare l’offerta;• l’investimento interno finalizzato a sviluppare la propria vision che sia in grado <strong>di</strong>contrad<strong>di</strong>stinguere la propria offerta rispetto ai competitor.Oracle ha seguito la prima strategia e, in virtù dell’anticipo con cui ha effettuato le suemosse sul mercato, è quella che, avendo avuto il tempo necessario per realizzare <strong>un</strong>’offertacompleta, ha meglio capitalizzato gli investimenti in termini <strong>di</strong> posizionamento.3.6.1 Prodotti open sourceUn numero crescente <strong>di</strong> organizzazioni si <strong>di</strong>mostra sempre più attratto dalle promesse delsoftware open source. Sono soluzioni ricche <strong>di</strong> f<strong>un</strong>zionalità che possono ridurre il costototale <strong>di</strong> proprietà dell’infrastruttura IT. Software come Linux, OpenOffice, MySQL eFirefox sono considerate soluzioni mainstream e vengono ampiamente adottate. Osserviamoora, se anche le soluzioni open source <strong>di</strong> business intelligence sono abbastanzamature per poter essere utilizzate dalle aziende.Non si deve guardare molto lontano per avere la prova della maturità raggi<strong>un</strong>ta dalla BIopen source. Unionfi<strong>di</strong>, <strong>un</strong>’importante istituzione finanziaria italiana attiva <strong>nel</strong> cre<strong>di</strong>to apiccole e me<strong>di</strong>e aziende, ha sostituito tutte le soluzioni BI esistenti, comprese quelle <strong>di</strong>reporting, con <strong>un</strong>a suite BI open source a partire dal 2006. Un altro esempio è quello delministero della Sanità che ha scelto <strong>un</strong>a suite open source per sviluppare <strong>un</strong> nuovo sistema<strong>di</strong> supporto decisionale. Molte organizzazioni, sia pubbliche sia private, stanno attualmenteimplementando soluzioni BI open source che rispondono al nome <strong>di</strong> JasperSoft,Pentaho o SpagoBI, suite che rendono <strong>di</strong>sponibile <strong>un</strong> ampio spettro <strong>di</strong> f<strong>un</strong>zionalità,dall’ETL a f<strong>un</strong>zioni ad-hoc <strong>di</strong> analisi e reporting. Spago BI ha inoltre il vantaggio <strong>di</strong>essere <strong>un</strong> prodotto italiano, sviluppato e supportato da Engineering, <strong>un</strong> grande systemintegrator nazionale.Tuttavia è bene sottolineare che sia JasperSoft che Pentaho offrono versioni Comm<strong>un</strong>itye Professional. Mentre le prime sono completamente open source, le versioni Professionalincludono invece componenti aggi<strong>un</strong>tivi closed source.


80 La tecnologia Oracle BI 11gNonostante le tecnologie open source per la business intelligence non siano <strong>di</strong>rettamenteconfrontabili con le suite proprietarie (le più importanti descritte precedentemente) èbene riportare <strong>un</strong> concetto fondamentale che Gartner ha espresso <strong>nel</strong> seguente modo:“mentre i vendor tra<strong>di</strong>zionali possono ancora vantare <strong>un</strong>a posizione <strong>di</strong> preminenza<strong>nel</strong>l’offerta tecnologica complessiva, l’adozione dell’open source aumenta perchéconsiderata sufficientemente valida”ETL open sourceAnche <strong>nel</strong> campo dell’ETL il mondo open source offre <strong>un</strong>a vasta gamma <strong>di</strong> prodotti.Kettle, per esempio, è <strong>un</strong> tool ETL facente parte della suite BI <strong>di</strong> Pentaho. E poi Talend(utilizzato all’interno <strong>di</strong> JasperSoft dove viene chiamato JasperETL), Jitterbit, Snaplogic,CloverETL. Non saranno comparabili a quelli offerti dai “megavendor”, ma vengonoritenuti sufficientemente vali<strong>di</strong> per il loro basso costo e le adeguate f<strong>un</strong>zionalità. Possonopertanto essere <strong>un</strong>’alternativa al software proprietario.La caratteristica che consente <strong>di</strong> implementare con successo <strong>un</strong> progetto BI fa com<strong>un</strong>queriferimento alle prestazioni. In molte implementazioni <strong>di</strong> BI open source si è spesso scelto<strong>di</strong> utilizzare MySQL, che può essere considerato <strong>un</strong> buon DBMS transazionale, ma cherivela tutte le sue limitazioni quando impiegato per la costruzione <strong>di</strong> data warehouse edata mart a livello enterprise. Per questo motivo alc<strong>un</strong>i vendor open source hanno sviluppatosoluzioni <strong>di</strong> database, basate su MySql, ma che prevedono <strong>un</strong> motore <strong>di</strong> storagecompletamente <strong>di</strong>fferente, adatto a supportare carichi <strong>di</strong> lavoro BI <strong>di</strong> tipo enterprise. Naturalmentela scelta <strong>di</strong> <strong>un</strong> database analitico open source non si limita a soluzioni basatesu MySql.L’importanza della query performance non deve essere sottovalutata durante la scelta delDBMS analitico. Le soluzioni Oracle e SQL Server, grazie anche alle loro tecniche <strong>di</strong> in<strong>di</strong>cizzazionee compressione, si collocano tra le migliori per quanto riguarda le prestazioniper le attività <strong>di</strong> query.


CAPITOLO 4Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>asoluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> perl’azienda Cadey4.1 Presentazione dell’aziendaCadey s.r.l nasce <strong>nel</strong> 1959 ed è tra le aziende leader <strong>nel</strong> panorama della cosmetica italiana.Ha sede a Piacenza e conta 54 <strong>di</strong>pendenti con <strong>un</strong> fatturato <strong>di</strong> 38,8 milioni.Cadey si vuole affermare come il marchio italiano <strong>di</strong> riferimento per la cura della persona,in grado <strong>di</strong> offrire ai consumatori prodotti innovativi dall’ottimo rapporto qualità prezzopresenti in tutti i canali <strong>di</strong>stributivi: ipermercati, supermercati e profumerie.Famiglie <strong>di</strong> prodotti• Solari, marchio Bilboa (prodotti <strong>di</strong> p<strong>un</strong>ta dell’azienda).• Creme per il corpo, marchio Cambia Pelle e Staminaline.


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per82l’azienda Cadey• Depilazione, marchio Depilsoap.• Cura capelli, marchio Bilba e Luminose.Tipologia <strong>di</strong> clienti• Canale GDO.• Negozi specializzati casa toilette.• Grossisti.• Normal trade.Struttura organizzativaFigura 4.1: Struttura commerciale dell’azienda Cadey s.r.l.


4.2 Struttura data center Cadey 83Figura 4.2: Organigramma dell’azienda Cadey s.r.l.4.2 Struttura data center CadeyLa soluzione tecnologica adottata dall’azienda Cadey che andremo ad illustrare, è statascelta poiché in grado <strong>di</strong>:• fornire <strong>un</strong>a solida piattaforma iniziale che potrà crescere <strong>nel</strong> tempo senza <strong>di</strong>sperderegli investimenti <strong>di</strong> partenza;• fornire <strong>un</strong>a soluzione in grado <strong>di</strong> fornire continuità d’esercizio anche a seguito <strong>di</strong>crash <strong>di</strong> alc<strong>un</strong>e componenti.Elemento centrale della soluzione proposta è la soluzione <strong>di</strong> virtualizzazione su piattaformaVMware implementata in questa fase su due no<strong>di</strong>.VMware vSphere TM elimina la proliferazione dei server eseguendo le applicazioni all’interno<strong>di</strong> macchine virtuali installate su <strong>un</strong> numero inferiore <strong>di</strong> server e con <strong>un</strong> utilizzo


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per84l’azienda Cadeypiù efficiente delle risorse <strong>di</strong> rete e storage.Le organizzazioni che utilizzano <strong>un</strong>a talesoluzione possono conseguire rapporti <strong>di</strong> consolidamento per singolo server elevatissimi,grazie a straor<strong>di</strong>narie f<strong>un</strong>zionalità <strong>di</strong> gestione della memoria e ottimizzazione <strong>di</strong>namica.La complessità <strong>di</strong> gestione dell’hardware viene ridotta me<strong>di</strong>ante la virtualizzazione totale<strong>di</strong> server, storage e hardware <strong>di</strong> rete.VMware vSphere TM aiuta quin<strong>di</strong> a realizzare <strong>un</strong>a solida infrastruttura protetta, che garantiscela continuità aziendale anche in presenza <strong>di</strong> guasti hardware o <strong>di</strong> in<strong>di</strong>sponibilitàdel data center. Grazie a queste sue f<strong>un</strong>zionalità, la scelta <strong>di</strong> Cadey è stata VMwarevSphere Standard. Essa rappresenta <strong>un</strong>a soluzione <strong>di</strong> fascia entry-level per il consolidamentoapplicativo <strong>di</strong> base, allo scopo <strong>di</strong> ridurre sensibilmente i costi hardware, accelerando<strong>nel</strong> contempo la <strong>di</strong>stribuzione delle applicazioni.Configurazione hardwareServer:no<strong>di</strong> VMware N ◦ 2 PRIMERGY RX300 S6. Caratteristiche tecniche:• doppio processore quad core;• 16GB <strong>di</strong> RAM;• scheda fibre chan<strong>nel</strong>;• N ◦ 2 hard <strong>di</strong>sk 146GB SAS.Storage:Controller a 2 canali FC 4GB - N ◦ 4 hard <strong>di</strong>sk da 450GB SAS 15k (3 hard <strong>di</strong>sk raid 5 +1 hard <strong>di</strong>sk spare)Soluzione e strategia <strong>di</strong> backup:Sono previsti due livelli <strong>di</strong> backup, il primo su <strong>di</strong>sco mentre il secondo su nastro.Sul server è presente l’<strong>un</strong>ità nastro LTO3 per l’esecuzione del secondo livello <strong>di</strong> copia.


4.3 Struttura del data mart ven<strong>di</strong>te 854.3 Struttura del data mart ven<strong>di</strong>teLa soluzione <strong>di</strong> business intelligence che l’azienda Cadey ha deciso <strong>di</strong> adottare, consiste<strong>nel</strong>la suite Oracle <strong>Business</strong> <strong>Intelligence</strong> fondata su <strong>un</strong> Enterprise Data Warehouse realizzatosu database Oracle 11g.Il processo ETL per la costruzione del data warehouse non rientra <strong>nel</strong>le attività da mesvolte presso il cliente durante l’esperienza <strong>di</strong> tirocinio. Tuttavia propongo la strutturadel data mart relativo alle ven<strong>di</strong>te sul quale si basano le attività <strong>di</strong> sviluppo del progettoda me affrontato.Figura 4.3: Schema concettuale del data mart delle ven<strong>di</strong>teNelle prossime sezioni vengono descritti i passi che consentono <strong>di</strong> presentare i dati all’internodel data mart all’utente finale, in <strong>un</strong>a forma a lui comprensibile.


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per86l’azienda Cadey4.4 Costruzione dei metadatiIl repository dei metadati, come anticipato <strong>nel</strong>la sezione 3.2, è <strong>un</strong> file che ha il compito <strong>di</strong>memorizzare i metadati necessari al BI Server per trasformare <strong>un</strong>a query logica, ovvero<strong>un</strong>a interrogazione che viene costruita dall’utente che non è a conoscenza della strutturadelle sorgenti, <strong>nel</strong>la relativa query fisica da eseguire sui dati sorgente.Lo strumento che Oracle BI mette a <strong>di</strong>sposizione degli sviluppatori per la costruzionedei metadati è l’Administration Tool. Con esso è possibile mappare i dati presenti <strong>nel</strong>lesorgenti fisiche nei dati <strong>di</strong> presentazione, utilizzabili dall’utente finale, passando per trelivelli <strong>di</strong>stinti: livello fisico, livello logico e livello <strong>di</strong> presentazione.Di seguito vengono descritte le tre fasi, prendendo come riferimento il repository deimetadati utilizzato dall’azienda Cadey. Essendo le <strong>di</strong>mensioni del progetto troppo elevateper poterle esaminare in modo esaustivo, ho deciso <strong>di</strong> prendere in esame solo <strong>un</strong>a facttable e <strong>un</strong>a <strong>di</strong>mension table ed osservare il passaggio dei dati dalle sorgenti fisiche, finoalla loro visualizzazione in report utilizzabili dagli utenti business.4.4.1 Livello fisicoLa costruzione <strong>di</strong> questo livello inizia con l’importazione delle tabelle che andranno acostituire le sorgenti. Tali sorgenti possono essere eterogenee, tuttavia in questo <strong>caso</strong>proverranno dal medesimo data mart. La Figura 4.4 mostra il livello fisico costruito <strong>nel</strong>nostro <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o.Il database è l’oggetto collocato più in alto <strong>nel</strong> livello fisico e definisce la sorgente datialla quale il BI Server dovrà inviare le query. Il connection pool definisce le modalità<strong>di</strong> collegamento al database, mentre lo schema contiene le tabelle e le colonne delloschema fisico.Le tabelle importate sono le seguenti:• F SPED: fact table relativa alle ven<strong>di</strong>te;• L CLI: <strong>di</strong>mension table relativa ai clienti, sulla quale viene eseguita <strong>un</strong>a parziale normalizzazionecon le tabelle L GEO NAZIONE, L GEO REGIONE e L GEO PROVINCIAche contengono rispettivamente i dati relativi alla nazione, regione e provincia delcliente;


4.4 Costruzione dei metadati 87• L CLI NAZIONE, L CLI REGIONE e L CLI PROVINCIA: alias per le tabelleL GEO NAZIONE, L GEO REGIONE e L GEO PROVINCIA rispettivamente.Verranno utilizzate per riferisi alle tabelle appena elencate.Figura 4.4: Rappresentazione del livello fisico <strong>nel</strong>l’Administration ToolDefinizione dei vincoli <strong>di</strong> integrità referenzialeUna volta importate le tabelle, occorre definire i vincoli <strong>di</strong> foreign key. Nel nostro <strong>caso</strong>saranno:F SPED.DOC CLI DM ID = L CLI.CLI IDL CLI.CLI PROVINCIA ID = L CLI PROVINCIA.PROVINCIA IDL CLI PROVINCIA.REGIONE ID = L CLI REGIONE.REGIONE IDL CLI REGIONE.NAZIONE ID = L CLI NAZIONE.NAZIONE ID


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per88l’azienda CadeyFigura 4.5: Rappresentazione dei vincoli <strong>di</strong> integrità referenziale delle tabelle del livellofisicoFigura 4.6: Diagramma completo del livello fisico relativo alle ven<strong>di</strong>te


4.4 Costruzione dei metadati 894.4.2 Livello logicoÈ il livello dove gli schemi fisici vengono semplificati e riorganizzati per formare le basidella vista che l’utente avrà dei dati.La costruzione del livello logico inizia con l’importazione degli oggetti dal livello fisico econ la definizione delle relazioni tra <strong>di</strong> essi (Figura 4.7). Infatti, solo grazie a quest’ultimopassaggio si riescono a definire i ruoli degli oggetti stessi, ovvero quali sono le fact tablee quali le <strong>di</strong>mension table.Figura 4.7: Rappresentazione del livello logico e della relazione che lega la <strong>di</strong>mensiontable “ClienteDim” con la fact table “Spe<strong>di</strong>to - Ven<strong>di</strong>te”Per ogni tabella del livello logico, le source table identificano le relative tabelle sorgenti<strong>nel</strong> livello fisico. Si noti che per la <strong>di</strong>mension table ClienteDim compare la solatabella L CLI come sorgente, mentre vengono omesse le tabelle L CLI NAZIONE,L CLI REGIONE e L CLI PROVINCIA. Questo perché è possibile mappare <strong>un</strong>a sourcetable su più tabelle fisiche, a patto che siano in relazione tra loro <strong>nel</strong> modello fisico.


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per90l’azienda CadeyPer ogn<strong>un</strong>a delle misure è possibile definire <strong>un</strong>a regola <strong>di</strong> aggregazione. In questo modosi definisce il comportamento che tale misura dovrà avere ogni qualvolta si desideracambiare il livello <strong>di</strong> dettaglio con il quale analizzare i dati. Nel nostro <strong>caso</strong> ogni misurapossiede come regola <strong>di</strong> aggregazione la somma.Creazione <strong>di</strong> nuove colonne <strong>nel</strong> livello logicoAll’interno del livello logico è possibile creare nuove colonne, utilizzando colonne giàpresenti all’interno <strong>di</strong> <strong>un</strong>a formula. Possono essere utilizzate:• Colonne logiche: vengono utilizzate colonne appartenenti al livello logico. La regola<strong>di</strong> aggregazione della colonna creata viene automaticamente in<strong>di</strong>viduata sulla basedelle regole <strong>di</strong> aggregazione delle colonne logiche utilizzate <strong>nel</strong>la formula;• Colonne fisiche: vengono utilizzate colonne appartenenti al livello fisico. In questo<strong>caso</strong> la regola <strong>di</strong> aggregazione deve essere specificata manualmente, in quanto lecolonne utilizzate <strong>nel</strong>la formula non ne possiedono <strong>un</strong>a.La <strong>di</strong>fferenza tra le due metodologie risiede <strong>nel</strong>l’or<strong>di</strong>ne con il quale le aggregazioni vengonoeseguite. Nel primo <strong>caso</strong> infatti saranno effettuate a livello <strong>di</strong> colonna, mentre <strong>nel</strong> secondoa livello <strong>di</strong> riga.Creazione delle gerarchieLa creazione <strong>di</strong> <strong>un</strong>a gerarchia conferisce <strong>un</strong>a organizzazione gerarchica alle colonne logicheappartenenti ad <strong>un</strong>a <strong>di</strong>mension table. In questo modo si possono definire i percorsi <strong>di</strong>drill-down che l’utente potrà effettuare durante la fase <strong>di</strong> analisi. La struttura <strong>di</strong> <strong>un</strong>agerarchia e gestibile dal solo livello logico. La Figura 4.8 mostra la gerarchia utilizzata<strong>nel</strong> nostro <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o.L’introduzione <strong>di</strong> <strong>un</strong>a gerarchia permette <strong>di</strong> definire:• Level-based measures: Sono misure che vengono calcolate ad <strong>un</strong>o specifico livello<strong>di</strong> aggregazione e che per tanto non vengono influenzate dai drill-down su altri livelli;• Share measures: Sono misure che vengono calcolate facendo il rapporto tra lenormali misure e misure level-based. Vengono utilizzate per calcolare le percentuali.


4.4 Costruzione dei metadati 91Figura 4.8: Gerarchia relativa alla <strong>di</strong>mension table ClienteDimFigura 4.9: Diagramma completo del livello logico relativo alle ven<strong>di</strong>te


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per92l’azienda Cadey4.4.3 Livello <strong>di</strong> presentazioneRappresenta la vista che ha l’utente dei dati. Ha il compito <strong>di</strong> semplificare il livello logico.Nel livello <strong>di</strong> presentazione è infatti possibile nascondere determinate colonne oppureriorganizzare i dati in cataloghi o cartelle separate. La Figura 4.10 fornisce <strong>un</strong>a rappresentazionedel livello <strong>di</strong> presentazione.Figura 4.10: Rappresentazione del livello <strong>di</strong> presentazione <strong>nel</strong>l’Administration ToolLe presentation table possono essere utilizzate per riorganizzare i dati. Esse possonocontenere colonne logiche provenienti da più tabelle logiche e risultano essere in<strong>di</strong>pendentida queste ultime.La definizione delle subject area permette, come vedremo più avanti, la sud<strong>di</strong>visione inpiù ambiti <strong>di</strong> analisi negli strumenti <strong>di</strong> front end.4.4.4 Validazione del repositoryUna volta terminata la costruzione dei tre livelli occorre validare il repository appenacreato. Per essere considerato valido, <strong>un</strong> repository deve possedere i seguenti requisiti:


4.5 Costruzione della reportistica 93• Tutte le colonne logiche sono mappate <strong>di</strong>rettamente o in<strong>di</strong>rettamente su <strong>un</strong>a o piùcolonne fisiche;• Tutte le <strong>di</strong>mension table del livello logico hanno <strong>un</strong>a chiave logica;• Tutte le tabelle logiche sono in logical join con almeno <strong>un</strong>’altra tabella logica;• Devono essere presenti almeno due tabelle logiche: <strong>un</strong>a fact table ed <strong>un</strong>a <strong>di</strong>mensiontable. Eventualmente possono entrambe essere mappate sulla medesima tabellafisica.• Non ci devono essere cicli <strong>nel</strong>le relazioni definite <strong>nel</strong> modello logico;• Esiste almeno <strong>un</strong>a subject area per ogni modello business (si noti che <strong>nel</strong>l’esempiotrattato è presente <strong>un</strong> solo modello business, quello delle ven<strong>di</strong>te).Una volta validato il repository è possibile caricarlo all’interno del BI Server attraversol’Enterprise Manager.4.5 Costruzione della reportisticaMentre la costruzione dei metadati è <strong>un</strong> compito strettamente riservato agli sviluppatori,la costruzione della reportistica può essere fatta anche dagli utenti business.Oracle BI mette infatti a <strong>di</strong>sposizione <strong>un</strong>a semplice GUI (Figura 4.11) per la creazione<strong>di</strong> report e dashboard.Figura 4.11: Costruzione <strong>di</strong> <strong>un</strong> report tramite “Oracle BI Analysis and Reporting”


Il <strong>caso</strong> <strong>di</strong> stu<strong>di</strong>o: Realizzazione <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong> per94l’azienda CadeyNella parte sinistra è collocata la subject area. In essa si possono reperire gli oggettinecessari alla costruzione del report. OBIEE 11g permette la costruzione <strong>di</strong> analisi contenentioggetti provenienti da più subject area.Nella parte destra, invece, è possibile modellare il report mo<strong>di</strong>ficando l’or<strong>di</strong>ne e le proprietàdelle colonne (in alto), oppure definire opport<strong>un</strong>i filtri (in basso).Di seguito <strong>un</strong>a dashboard e <strong>un</strong> report <strong>di</strong> tipo grafico, relativi alle ven<strong>di</strong>te analizzateper famiglia dell’articolo.Figura 4.12: Dashboard relativa alle ven<strong>di</strong>te analizzate per famiglia dell’articoloFigura 4.13:Figura 4.12Report grafico che descrive la situazione mostrata <strong>nel</strong>la dashboard <strong>di</strong>


4.5 Costruzione della reportistica 95ConclusioniLa struttura <strong>di</strong> questo lavoro <strong>di</strong> tesi rappresenta il percorso seguito durante i mesi <strong>di</strong>tirocinio.Le prime settimane sono state infatti de<strong>di</strong>cate ad attività <strong>di</strong> stu<strong>di</strong>o in<strong>di</strong>viduale e a corsi<strong>di</strong> formazione, che mi hanno portato ad acquisire le nozioni <strong>di</strong> base dei sistemi <strong>di</strong> datawarehousing e business intelligence. I primi due capitoli riassumono il percorso formativointrapreso.La seconda parte del tirocinio è stata de<strong>di</strong>cata allo stu<strong>di</strong>o della tecnologia Oracle BI 11g,al fine <strong>di</strong> apprendere le caratteristiche tecniche del prodotto, descritte <strong>nel</strong> terzo capitolo,e le metodologie <strong>di</strong> sviluppo <strong>di</strong> <strong>un</strong> progetto <strong>di</strong> business intelligence.Quin<strong>di</strong>, solamente dopo aver seguito <strong>un</strong> percorso <strong>di</strong> formazione adeguato, sono statocoinvolto <strong>nel</strong>lo sviluppo <strong>di</strong> <strong>un</strong>a soluzione <strong>di</strong> business intelligence presso l’azienda Cadeys.r.l <strong>di</strong> Piacenza. Durante questa esperienza ho potuto partecipare alle seguenti attività:• Installazione della piattaforma <strong>di</strong> business intelligence;• Costruzione dei metadati, ovvero il processo <strong>di</strong> mappatura dei dati fisici del datamart delle ven<strong>di</strong>te nei dati <strong>di</strong> presentazione utilizzabili dall’utente;• Costruzione della reportistica, report e dashboard, in base alle esigenze mostratedal cliente.Il quarto capitolo descrive come sono state affrontate alc<strong>un</strong>e <strong>di</strong> queste attività.L’esperienza <strong>di</strong> tirocinio mi ha permesso <strong>di</strong> maturare sotto l’aspetto professionale e <strong>di</strong>acquisire conoscenze che considero <strong>di</strong> fondamentale importanza per il mio futuro.


ELENCO DELLE FIGURE1.1 Rappresentazione <strong>di</strong> <strong>un</strong> processo aziendale . . . . . . . . . . . . . . . . . 31.2 Le attività aziendali secondo Anthony . . . . . . . . . . . . . . . . . . . . 51.3 Relazioni tra i sistemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.1 Componenti <strong>di</strong> <strong>un</strong> sistema <strong>di</strong> data warehousing . . . . . . . . . . . . . . 182.2 Architettura ad <strong>un</strong> livello per <strong>un</strong> sistema <strong>di</strong> data warehousing . . . . . . 212.3 Architettura a due livelli per <strong>un</strong> sistema <strong>di</strong> data warehousing . . . . . . . 222.4 Architettura a tre livelli per <strong>un</strong> sistema <strong>di</strong> data warehousing . . . . . . . 232.5 Cubo multi<strong>di</strong>mensionale che modella le ven<strong>di</strong>te in <strong>un</strong>a catena <strong>di</strong> negozi . 272.6 Una possibile gerarchia per la <strong>di</strong>mensione negozi . . . . . . . . . . . . . . 282.7 Semplice schema <strong>di</strong> fatto delle ven<strong>di</strong>te . . . . . . . . . . . . . . . . . . . 292.8 Schema Entity/Relationship delle ven<strong>di</strong>te . . . . . . . . . . . . . . . . . . 292.9 Schema <strong>di</strong> fatto delle ven<strong>di</strong>te arricchito . . . . . . . . . . . . . . . . . . . 302.10 Star schema per le ven<strong>di</strong>te . . . . . . . . . . . . . . . . . . . . . . . . . . 312.11 Snowflake schema per le ven<strong>di</strong>te . . . . . . . . . . . . . . . . . . . . . . . 332.12 Rappresentazione del fenomeno <strong>di</strong> sparsità dei dati . . . . . . . . . . . . 342.13 Sud<strong>di</strong>visione del cubo multi<strong>di</strong>mensionale in ch<strong>un</strong>k . . . . . . . . . . . . . 352.14 Rappresentazione del portafoglio applicativo aziendale . . . . . . . . . . . 382.15 Piramide della <strong>Business</strong> <strong>Intelligence</strong> . . . . . . . . . . . . . . . . . . . . . 392.16 Operatori <strong>di</strong> slice-and-<strong>di</strong>ce . . . . . . . . . . . . . . . . . . . . . . . . . . 422.17 Operatori <strong>di</strong> roll-up e drill-down . . . . . . . . . . . . . . . . . . . . . . . 43


98 ELENCO DELLE FIGURE2.18 Il processo <strong>di</strong> knowledge <strong>di</strong>scovery . . . . . . . . . . . . . . . . . . . . . . 462.19 Fasi <strong>di</strong> <strong>un</strong>’analisi <strong>di</strong> business intelligence . . . . . . . . . . . . . . . . . . 503.1 Standar<strong>di</strong>zzazione degli strumenti e successo della BI . . . . . . . . . . . 573.2 Architettura <strong>di</strong> OBIEE 11g . . . . . . . . . . . . . . . . . . . . . . . . . 573.3 Architettura logica <strong>di</strong> OBIEE 11g su <strong>un</strong> singolo host . . . . . . . . . . . 583.4 Architettura logica <strong>di</strong> OBIEE 11g su più host . . . . . . . . . . . . . . . 593.5 Traduzione <strong>di</strong> <strong>un</strong>a query logica <strong>nel</strong>la relativa query fisica attraverso i 3livelli del repository . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 623.6 Architettura del BI Server . . . . . . . . . . . . . . . . . . . . . . . . . . 633.7 Tipica struttura delle <strong>di</strong>rectory <strong>di</strong> Oracle BI . . . . . . . . . . . . . . . . 653.8 Costruzione <strong>di</strong> <strong>un</strong>’analisi con BI Analysis and Reporting . . . . . . . . . 673.9 Un esempio <strong>di</strong> dashboard interattiva . . . . . . . . . . . . . . . . . . . . 693.10 Un esempio <strong>di</strong> scorecard . . . . . . . . . . . . . . . . . . . . . . . . . . . 693.11 Costruzione <strong>di</strong> <strong>un</strong> report pixel perfect me<strong>di</strong>ante BI Publisher Layout E<strong>di</strong>tor 703.12 Creazione <strong>di</strong> <strong>un</strong> agente tramite BI Delivers . . . . . . . . . . . . . . . . . 713.13 Sud<strong>di</strong>visione dei tre livelli del repository <strong>nel</strong>l’Administration Tool . . . . 733.14 Quadrante magico <strong>di</strong> Gartner relativo alle piattaforme <strong>di</strong> <strong>Business</strong> <strong>Intelligence</strong>del mese <strong>di</strong> gennaio 2011 . . . . . . . . . . . . . . . . . . . . . . . 753.15 Confronto delle posizioni occupate dai maggiori vendor <strong>di</strong> piattaforme <strong>di</strong><strong>Business</strong> <strong>Intelligence</strong> <strong>nel</strong> quadrante magico <strong>di</strong> Gartner <strong>nel</strong> 2006 e <strong>nel</strong> 2011 784.1 Struttura commerciale dell’azienda Cadey s.r.l. . . . . . . . . . . . . . . . 824.2 Organigramma dell’azienda Cadey s.r.l. . . . . . . . . . . . . . . . . . . . 834.3 Schema concettuale del data mart delle ven<strong>di</strong>te . . . . . . . . . . . . . . 854.4 Rappresentazione del livello fisico <strong>nel</strong>l’Administration Tool . . . . . . . . 874.5 Rappresentazione dei vincoli <strong>di</strong> integrità referenziale delle tabelle del livellofisico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 884.6 Diagramma completo del livello fisico relativo alle ven<strong>di</strong>te . . . . . . . . . 884.7 Rappresentazione del livello logico <strong>nel</strong>l’Administration Tool . . . . . . . . 894.8 Rappresentazione <strong>di</strong> <strong>un</strong>a gerarchia <strong>nel</strong>l’Administration Tool . . . . . . . 914.9 Diagramma completo del livello logico relativo alle ven<strong>di</strong>te . . . . . . . . 914.10 Rappresentazione del livello <strong>di</strong> presentazione <strong>nel</strong>l’Administration Tool . . 924.11 Costruzione <strong>di</strong> <strong>un</strong> report tramite “Oracle BI Analysis and Reporting” . . 93


ELENCO DELLE FIGURE 994.12 Dashboard relativa alle ven<strong>di</strong>te analizzate per famiglia dell’articolo . . . . 944.13 Un esempio <strong>di</strong> report grafico . . . . . . . . . . . . . . . . . . . . . . . . . 94


ELENCO DELLE TABELLE1.1 Caratteristiche dei <strong>di</strong>versi tipi <strong>di</strong> sistemi informativi. . . . . . . . . . . . 101.2 Differenze tra sistemi OLTP e sistemi OLAP. . . . . . . . . . . . . . . . . 143.1 Matrice business case per la BI. . . . . . . . . . . . . . . . . . . . . . . . 56


BIBLIOGRAFIA[ACPT06] Paolo Atzeni, Stefano Ceri, Stefano Paraboschi, and Riccardo Torlone. Basi<strong>di</strong> dati - modelli e linguaggi <strong>di</strong> interrogazione. McGraw-Hill, second e<strong>di</strong>tion,2006.[Des07]Giulio Destri. Introduzione ai sistemi informativi aziendali. Monte UniversitàParma, 2007.[Gar11] Gartner. Magic quadrant for business intelligence platform, January 2011.[GR06]Matteo Golfarelli and Stefano Rizzi. Data Warehouse - teoria e pratica dellaprogettazione. McGraw-Hill, second e<strong>di</strong>tion, 2006.[KRT + 07] Ralph Kimball, Margy Ross, Warren Thornthwaite, Joy M<strong>un</strong>dy, and BobBecker. The Datas Warehouse Lifecycle Toolkit. Wiley Publishing, seconde<strong>di</strong>tion, 2007.[LL06] Kenneth Laudon and Jane Laudon. Management dei sistemi informativi.Pearson Prentice Hall, second e<strong>di</strong>tion, 2006.[Oraa][Orab]Oracle. Company profile. http://www.oracle.com/global/it/corporate/company_profile.html.Oracle. Oracle business intelligence enterprise e<strong>di</strong>tion 11g - installation guide.[Orac] Oracle. Oracle business intelligence enterprise e<strong>di</strong>tion 11g - metadatarepository builder’s guide.


104 BIBLIOGRAFIA[Orad] Oracle. Oracle business intelligence enterprise e<strong>di</strong>tion 11g - systemadministrator’s guide.[Orae] Oracle. Oracle fusion middleware 11g - certification matrix.http://www.oracle.com/technetwork/middleware/downloads/fmw-11gr1certmatrix.xls.[Ora09] Oracle. Buil<strong>di</strong>ng a better business case for business intelligence, 2009.[Ora11a] Oracle. Oracle business intelligence fo<strong>un</strong>dation suite - technical overview.http://www.oracle.com/us/obiee-11g-technical-overview-078853.pdf, January 2011.[Ora11b][Pas04][PM05]Oracle. Oracle fusion middleware 11g - system requirements and specifications,January 2011.Paolo Pasini. I sistemi informativi <strong>di</strong>rezionali - le tecnologie dell’informazionea supporto dei processi manageriali d’azienda. Egea, 2004.Maurizio Pighin and Anna Marzona. Sistemi informativi aziendali - strutturae applicazioni. Pearson Prentice Hall, 2005.[TRS03] Marco Tagliavini, Aurelio Ravarini, and Donatella Sciuto. Sistemi per lagestione dell’informazione. Apogeo, 2003.[Ver06]Carlo Vercellis. <strong>Business</strong> <strong>Intelligence</strong> - modelli matematici e sistemi per ledecisioni. McGraw-Hill, 2006.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!