Che cosa pensereste se vi dicessero che in Italia i Big Data non esistono?

Dipende ovviamente dalle definizioni. Ma secondo Marco Russo (che invia per mail questo pezzo qui sotto usando un ufficio stampa) in Italia non ci sono organizzazioni che raccolgono veri e propri Big Data. (Blog di Marco Russo)

marco russo marco russo

IN ITALIA I BIG DATA NON SERVONO

Marco Russo, tra i maggiori esperti di business intelligence in Europa, spiega perché in Italia la politica, le banche e le Pmi possono fare a meno di questo processo.

«Partiamo dalla questione semantica» esordisce Marco Russo, consulente, speaker internazionale e socio di EventHandler, la società che organizza le Technical Conferences, tra cui la più importante conferenza italiana sulla Business Intelligence. «La definizione di “big data” si presta ad essere confusa con quella di “data mining”. Un aspetto fondamentale, però, è che con i Big Data gli ordini di grandezza sono molto elevati: l’unita di misura dell’informazione, nel caso dei Big Data, è lo Zetta-Byte ovvero di una mole di Byte dell’ordine di 10^21 e quindi di miliardi di Terabyte. Nella realtà, poche aziende al mondo hanno questo genere di volumi e in particolare in Italia è quasi impossibile trovare volumi di dati di tali dimensioni».

Alcuni esempi:

Analisi politiche sui social network: «Twitter ha numeri da Big Data ma le analisi effettuate sui tweet del corpo elettorale italiano (3,5 milioni di italiani hanno utilizzato Twitter durante la campagna elettorale, ndr) sono fatte con strumenti tradizionali. L’ultima edizione di Sanremo, che per numero di tweet è stata un evento da record in Italia, ha registrato 150 mila tweet durante la finale; un volume che può essere racchiuso in 77 MB (Megabyte), senza compressioni, caricato su strumenti di produttività personale (Excel, ndr), e analizzato per correlazione senza ricorrere ai big data»

Le banche. «Le transazioni economiche delle banche sono sempre effettuate su sistemi transazionali (database tradizionali, ndr), non con tecnologie Big Data. In Italia ci sono 30 milioni di conti correnti bancari e 8 milioni di conti correnti postali; calcolando una media di 20 operazioni al mese su conti retail (persone fisiche a uso personale, non business, ndr), ci sono 600 milioni di operazioni al mese su tutti i conti correnti. In un anno sono 7 miliardi. È un numero alto, ma gestibile tranquillamente da normali server aziendali. Il volume complessivo è di alcuni TB, distante dai volumi di traffico di big data».

Le società che impiegano strumenti che possono inquadrarsi nei “big data” sono molto poche; ad esempio Facebook, Twitter, Amazon, Microsoft e Google. In Italia, spesso, l’etichetta “Big Data” viene associata a operazioni più tradizionali (ma altrettanto efficaci) quali Business Intelligence e Data Mining. L’analisi dei dati con algoritmi di data mining, come le regole associative, portano a evidenziare correlazioni tra i dati che talvolta sono inaspettate (il caso più famoso è Wal Mart, che scelse di disporre i prodotti in maniera diversa quando scopri che chi acquistano pannolini probabilmente acquista anche birra, ndr). «La conoscenza di queste correlazioni – spiega Marco Russo – può portare a modelli predittivi di comportamento e a segmentazioni della popolazione in base a caratteristiche qualitative e comportamentali. Nei fatti, molte delle tecniche di data mining sono oggi associate a volumi di dati sempre maggiori, magari ottenuti da strumenti di big data, anche se a oggi le analisi sono effettuate in momenti (e con tecnologie) differenti».

Comments

5 Comments so far. Leave a comment below.
  1. Breve auto-precisazione: la storia di Wal Mart è talmente famosa da non ricordare che non è nemmeno vera: la ricostruzione su http://www.dssresources.com/newsletters/66.php (ormai quasi preistoria informatica, basta guardare il layout in modalità testo).

  2. Saluto Marco Russo che è uno dei miei idoli.
    In realtà un po’ di BD in italia c’è. Se i tuoi dati sono già nel Cloud è sensato utilizzarlo anche per volumi non così elevati. Anche nella ristretta cerchia delle mie conoscenze so di una startup che usa hadoop e sta pensando di usare Redshift (di amazon) che mi sembra un prodotto interessante. E’ vero che tutto questo hype sui BD è dannoso, lo scrive anche Stephen Few (per esempio qua http://www.perceptualedge.com/blog/?p=1671 ma anche in molti altri posti). Chiudo con una osservazione: chiunque abbia visto un bilancio di un’azienda italiana sa che “dati giusti” sono ancora molto meglio che “molti dati”. PS: il riferimento ai Zettabyte è esagerato ma credo volesse essere un’iperbole.

    • Massimo, “idolo” è un termine che mi imbarazza un po’!! :-)
      Su una startup è certamente più facile adottare da subito certe tecnologie, più per la facile scalabilità ottenibile in ambito cloud che altro. La mia “provocazione” è rispetto all’immagine “salvifica” che vedo nell’uso (e abuso) del termine Big Data che si fa, in Italia ma anche all’estero. Il problema che percepisco in Italia è soprattutto rispetto alla confusione che si fa tra principi di memorizzazione dei dati (propri del mondo NoSQL) che possono assolvere a certi scopi (tra cui la discesa dei costi per dati “non transazionali” – quindi perfetto per social network) e l’analisi che si fa su tali dati. La stragrande maggioranza delle PMI, la totalità delle banche e delle istituzioni finanziarie… abilitano nuove analisi grazie a Big Data? Credo di no. Se andiamo in ambito manifatturiero, beh, si può pensare di acquisire dati che un tempo costavano troppo (si pensi a tutti i sensori che puoi avere su una linea di produzione e ad analisi specifiche su controllo qualità che puoi fare), ma se non acquisisci dati nuovi e sposti dati che hai già… ok magari abbassiamo i costi di memorizzazione (che è bellissimo) ma non abilitiamo realmente analisi prima impossibili.
      Ecco, se chiariamo questa confusione, io smetto di spiegare che cosa non è Big Data a giorni alterni… :-)

      • Sono anni che dico che (almeno in Italia) la BI è completamente rovinata da chi la vende. Big Data non è che l’ultimo esempio di una lunga lista di falsi hype. In italia se tu vendi Excel vai dal cliente a dirgli che può lo può usare per fare il bilancio consolidato, se vendi Sap vai dal panettiere e gli dici che è indispensabile. Sgonfiare l’hype è necessario e importante.

  3. La provocazione ci sta tutta per evitare falsi hype.
    Credo che la questione di fondo è: quanto mi devo ampliare alla dimensione esterna dei dati per avere migliori decisioni aziendali?
    Come percepire i segnali deboli dei mercati?
    Forse non abbiamo nenache bisogno di Big Data ma di Data significativi attinti nell’ecosistema distribuito all’interno ed all’esterno alle aziende.
    Quindi un lavoro da Data scientist ed un pò anche da Markettari.

Add Your Comments

Disclaimer
Your email is never published nor shared.
Required
Required
Tips

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <ol> <ul> <li> <strong>

Ready?