Il data mining per tutti

Non voglio essere noioso ma vorrei entrare nel dettaglio di quanto scritto a proposito della mia differente visione rispetto ai big vendor in merito al data mining (vedi questo articolo )

Cosa è il Data Mining ?

Piccola premessa su cosa è il data mining ( clicca per la definizione su Wikipedia ) :

Per data mining si intende una serie di algoritmi che permettono di estrarre, in maniera automatica e autonoma, dai propri dati informazioni che non sono state inserite nei database ma che si possono derivare imparando dagli stessi dati, ad esempio :

  • Suddividere i clienti in gruppi (cluster ) in base alle loro abitudini di spesa (valore, tipo articoli, frequenza )
  • Trovare relazione tra articoli che vengono spesso venduti assieme
  • Capire qual’e’ la promozione migliore per un cliente
  • etc

Il data mining per tutti

Mi aggancio ad una famosa frase di Henry Ford :

“C’è vero progresso solo quando i vantaggi di una nuova tecnologia diventano per tutti” 

attualmente mi sembra che i Big Vendor abbiano i mente che il data mining sia un qualcosa che possa essere di interesse e di beneficio per tutte le aziende, non solo le grandi multinazionali, e infatti spingono i loro prodotti e parlano di analisi predittiva etc … ma mi sembra che il modello di proposizione sia ancora vecchio del tipo : costo software “importante”, consulenza specializzata o pesanti corsi di formazione, approccio con creazione di modelli statistici, dove possibile hardware dedicata ( i famosi BI appliance ) etc …

Risultato costi e modi inaccettabili per la PMI, proporre un qualcosa a tutti dimostrando che ne avrebbero dei benefici non vuol dire rendere la tecnologia disponibile a tutti , bisogna adattarsi alle possibilità del cliente per fare in modo che il miglioramento proposto sia compatibile con spesa e possibilità tecniche.

Se vogliamo tagliare i costi e guardiamo al mondo opensource attualmente (ma felice di essere smentito ) penso che le soluzioni siano abbastanza da specialisti e che richiedano delle conoscenze statistiche

Eppure il datamining forse ancor più della business intelligence classica potrebbe essere realmente un qualcosa che da una spinta anche alle piccole aziende, pensiamo all’analisi del carrello proposta ad un qualsiasi negozio di alimentari (un mini-market o come si chiamavano una volta cooperativa ) che abbia un database con le righe degli scontrini e magari anche il collegamento al cliente (carta fedeltà) … penso che questo tipo di negozio possa essere ben felice di sapere quali sono le associazioni dei prodotti acquistati, capire se chi compra una marca ne predilige anche un’altra o meno, stessa cosa nelle analisi degli scontrini legate ai clienti … basterebbe poco per capire se una promozione su un prodotto potrebbe dare dei benefici o meno,  creare delle promozioni personalizzate o per cluster di cliente, pensiamo magari a quale aiuto potrebbe esserci con il datamining quando si compongono i cesti di Natale etc

Perchè applicare algoritmi di datamining non può essere semplice come avere dei report dal proprio gestionale o avere una email ?

Perchè bisogna avere solo una via inaccessibile per i piccoli ? … liberiamo il potere delle informazioni !

Proposta per un data mining per tutti

Questa è la mia via per arrivare a fare in modo che tutta la PMI possa trarre benefici dal data mining.

1. Per prima cosa una serie di algoritmi di interesse ma configurabili per fare in modo che lo stesso codice possa essere riutilizzato per N progetti o per N modelli di calcolo … ovvero se devo fare un albero decisionale o un clustering al posto di creare un modello per ogni richiesta facciamo in modo che la richiesta sia solo una parametrizzazione del mio algoritmo

2. Conseguenza del punto 1, algoritmi e modelli non perfetti ma che comunque diano dei benefici (suvvia tra avere una analisi predittiva che mi dice i clienti interessati ad un prodotto o a rischio abbandono , corretta al 95% o all’75% cosa è meglio quando la prima costa tanto e la seconda poco ? proviamo a ragionare su un rapporto costi benefici quando parliamo con clienti il cui budget è “limitato” )

3. Dove manca la capacità di calcolo spostare il tutto su motori posti su soluzioni cloud ( Database as a service ) creando delle black box che ricevono in input dei dati ( meglio se anonimizzati🙂 ) e sparano in output il risultato degli algoritmi, come se fosse un file excel che ti da i risultati e ti evidenzia cosa fare

4. Visto che ai clienti piccoli tutti questi discorsi potrebbero piacere ma avere un nuovo giocattolo in casa vorrebbe dire anche doverlo gestire, imparare etc … offriamo un servizio … mi prendo i tuoi dati (oppure ci collego la mia black-box ) e ti do il risultato una-tantum o quando ti serve

5. … e qui viene il bello : se il cliente è piccolo ( tipo < 1M€ di fatturato ) e gli va bene avere un servizio al posto di un qualcosa da installare etc … bene allora la prima volta è gratis ! così poi con i risultati in mano capisce se e quali benefici può avere e diventa più semplice definire anche quanto può/vuole spendere per avere quei risultati aggiornati o con nuovi tipi di analisi

FOLLIA ? NON E’ FOLLIA QUESTO E’ IL METODO ALBAREX !

Sono tutti bravi a vendere licenze, hardware, progetti e consulenti a chi ha i soldi da buttare, a volte non devi neanche preoccuparti della concorrenza, ci sono clienti che comprano tutto e non si fanno mancare nulla

Ma chi realmente ama quello che fa, farà in modo che tutti possano avere benefici dal suo lavoro …

Penso che ci sia più soddisfazione a vendere una 500 Abarth a qualcuno che non si può permettere la Ferrari ma che con la sua 500 saprà divertirsi piuttosto che vendere un TIR di Ferrari e Lamborghini a qualche sultano che le terrà nel garage come se fossero dei quadri.

Lascia un commento

4 commenti

  1. Questo è anche il mio metodo. Perchè non uniamo le forze?

    Rispondi
  2. Condivido totalmente. Il nostro applicativo Know4Business, scritto in Python e funzionante anche in modalità cloud, risponde ai requisiti descritti nell’articolo. Anch’io dico: uniamo le forze.

    Rispondi
  3. anlater

     /  18 agosto 2012

    Mi piace e mi piacerebbe perseguire l’idea.

    Rispondi
  4. ROberto G.

     /  23 agosto 2012

    Buona Idea: dal punto di vista BI solo PowerPivot può forse avvinicarsi a quello che hai espresso ma dal punto di vista Mining… siamo veramente anni Luce.
    L’unico consiglio che posso proporre agli interessati in materia è utilizzare R: nonostante abbia un'”anima” statistica in pochi passaggi si possono fare cose interessanti.

    Rispondi

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger cliccano Mi Piace per questo: