DWH : I segreti della modellazione dati svelati ( parte 1a )

Visto che negli articoli precedenti ho sempre parlato della modellazione dei dati come della regola base per poter ottenere un Datawarehouse ben fatto e quindi un progetto di Business Intelligence vincente, è doveroso iniziare a svelare questi fantomatici segreti

Segreto N.1:

Come prima cosa il guru della modellazione di un dwh : Ralph Kimball è sicuramente il punto di riferimento storico per quanto riguarda la modellazione , lo star-schema etc etc.

Si lo so quasi tutti coloro che fanno BI lo conoscono ( lui si che può essere detto uno dei massimi esperti di BI ) quindi è il segreto di Pulcinella ma penso che ogni tanto bisognerebbe rispolverare i suoi libri e articoli per rinfrescare i concetti.

Segreto N.2:

Ascoltare l’utente … si lo avevo già detto negli altri articoli quanto questo sia importante, ma ora aggiungo che non solo è importante ascoltare per capire cosa l’utente vuole o necessita ma che ascoltandolo con la giusta attenzione spesso capita che la modellazione se la fa quasi da solo … sceglie lui qual’è la soluzione migliore per le sue analisi ( es: se servono N misure e o se serve 1 misura con  un attributo che la “categorizza” )

Ascoltare è alla base della conversazione, parlare viene dopo …

Segreto N.3:

La semplicità : provate a pensare che l’utente debba usare le Pivot di Excel al posto di uno strumento di query & reporting … il dwh è ancora così semplice da usare ? fate sempre conto che l’utente finale per quanto smanettone non sarà mai in grado di poter costruire una query troppo complessa per tirarsi fuori i suoi dati quindi … Semplicità !

Mi piace usare un concetto per esprimere questa semplicità o quella che deve esistere nell’ETL ( ma questo è un altro capitolo )

“Tutto deve essere come acqua che scorre “

Avete mai visto (in Natura ) l’acqua fare dei percorsi strani ? Stessa cosa nella modellazione

Segreto N.4:

Sulla tabella del fatto è sempre meglio abbondare con colonne flag, contatori e colonne d’aiuto per la costruzione dei metadati … lasciate perdere il discorso che meno colonne esistono nella tabella e più veloce sarà il db a leggerla, perchè tanto poi rischiate di dover fare query più complesse per calcolare le misure derivate … guadagnereste 10 e perdereste 100 … pensate alle analisi che vorranno i clienti quelle dovranno essere veloci non solo la lettura del fatto … ottimizzare il tutto focalizzandosi su alcuni tecnicismi sarebbe come avere una macchina velocissima sul dritto ma che non tiene la strada in curva …

Segreto N.5:

“The middle way is the right way”: in caso di dubbi non scegliete soluzioni estreme

Segreto N.6:

“Il mattino ha l’oro in bocca”,”La notte porta consiglio” : Come ? sono solo detti popolari ? … No! Questa è saggezza popolare … io modello di prima mattina perchè spesso mi sveglio e la soluzione si presenta da sola …

Segreto N.7:

“In caso di dubbi chiedete all’utente” : si ricollega al saper ascoltare il cliente, ma io spesso e volentieri propongo all’utente le varie soluzioni di modellazione e lascio che sia lui a scegliere quella che fa per lui

Beh direi che per oggi basta, questa è solo la 1a parte e più che segreti sono dei consigli (altrimenti che segreti sarebbero ?) … i segreti veri sono altri 🙂 … e non ho ancora parlato di esempi di modellazione e tecniche da applicare … calma per il momento.

Come ? No … tutti questi consigli , segreti etc non sono raccolti in nessun libro purtroppo .. al massimo esistono dei corsi che raccontano il tutto con esempi  reali . Questo è il link Corsi di modellazione DWH

Alla prossima …

%d blogger hanno fatto clic su Mi Piace per questo: