#Panorama de l’écosystème #BigData à mai 2014 – #BigDataBx

Panorama du Big Data v 3.0 - Matt Turck (FirstMark)

Panorama du Big Data mai 2014 par Matt Turck et Sutian Dong  (FirstMark) – http://mattturck.com/

Quelques réflexions sur ce schéma et sur le marché du Big Data en général avec le regard d’un « Capital-Risqueur » (VC) :

Il commence à y avoir foule
Matt Turck le reconnait avec son panorama de l’écosystème Big Data il a clairement atteint la limite du nombre de sociétés pouvant être indiquées sur une seule page et il n’est pas certain qu’il ait représenté tous les acteurs les plus importants.

Le Big Data a attiré de nombreux entrepreneurs, les capital-risqueurs ont investi dans les startups prometteuses et par conséquent, le marché commence à devenir saturé. Certaines domaines commencent à être mûrs pour la consolidation ou l’acquisition par des grands acteurs de l’informatique (cf BlueKai par Oracle, Cloudant par IBM, Karmasphere par FICO, …) ou du web (Twitter a racheté Lucky Sort et les spécialistes de l’analyse des médias sociaux BlueFin Labs et GNIP; Salesforce.com a racheté Prior Knowledge). Même s’il y aura toujours de la place pour de nouvelles startups, il semble que beaucoup des premiers entrants ont mis la barre très haut pour leurs challengers – ce qui ne veut pas dire que l’argent des capital-risqueurs va s’arrêter de couler.

Le marché est encore jeune
Dans l’ensemble, nous sommes encore dans les premières périodes de ce marché.  Au cours des deux dernières années, certaines entreprises prometteuses ont échoué (par exemple : Drawn to Scale), un certain nombre ont eu une fin prématurée (telles : Precog, Prior Knowledge, Lucky Sort, Rapleaf, Nodeable, Karmasphere, etc), une poignée ont eu des résultats plus significatifs (Infochimps, Causata, StreamBase, ParAccel, Aspera, etc). Pendant ce temps, certaines entreprises se sont nettement démarquées et ont réalisé des levées de fonds spectaculaires tels MongoDB (+230M $), Palantir (presque 900 millions $) ou Cloudera (1 Milliard $; dont 740 millions $ auprès de Intel). Cependant, dans l’ensemble (hormis les sociétés Splunk ou Tableau Software), nous en sommes encore au début de la courbe du succès. Dans de nombreux secteurs, les startups et les grandes entreprises sont au coude à coude et aucun véritable leader n’a encore émergé .

Au battage médiatique succède la réalité
Après quelques années d’incroyable couverture médiatique du Big Data, les années qui viennent vont être importantes par de nombreuses sociétés vont passer de l’expérimentation à la mise en production. Si cela va se traduire par  l’augmentation rapide des revenus pour certains fournisseurs Big Data, ces déploiements vont aussi permettre de vérifier si le Big Data tient vraiment ses promesses.

Quoiqu’il en soit, la nécessité des technologies Big Data ne va pas cesse de se faire sentir, car le déluge des données va continuer de s’accélérer (4,4 Zettabytes en 2013 et 44 Zettabytes projetés en 2020), alimenté en partie par l’Internet des choses (objets & périphériques connectés + M2M).

Infrastructure
Hadoop semble avoir consolidé sa position comme la pierre angulaire de tout l’écosystème, mais il y a encore un certain nombre de distributions concurrentes – ce qui va probablement la faire évoluer. Spark, un autre framework open source qui s’appuie sur HDFS (le système de fichiers distribués Hadoop), fait actuellement beaucoup parler de lui, parce qu’elle promet de combler les faiblesses d’Hadoop, notamment en vitesse des traitements interactifs et avec de bonnes API (interfaces de programmation). Les premiers retours d’expérience semblent confirmer ses promesses. Parmi les évolution, certains thèmes sont dans tous les esprits (tels que les traitements en mémoire ou en temps réel); d’autres apparaissent comme par exemple une nouvelle génération d’outils de transformation de données (cf Trifacta, Paxata et DataTamer) .

Une autre question est de savoir si les données des entreprises vont vraiment partir dans le cloud (public ou privé) et si oui, dans quels délais. Beaucoup disent que les sociétés Fortune 500 conserveront chez elles leurs données (et leurs logiciels de traitement associés) pour les années à venir. Une génération de startups « Hadoop dans le cloud » (Qubole, Mortar, Joyent, Skytap …) font valoir que tôt ou tard toutes les données vont migrer vers le cloud. Elles viennent s’ajouter à des acteurs du Cloud Computing qui élargissent leur offre, comme Amazon Web Services AWS avec Elastic MapReduce Service, Microsoft avec Windows Azure HDInsight (support de Apache Hadoop et Hortonworks Data Platform (HDP), ou OVH avec Cloudera Hadoop (CDH3) + MongoDB, qui proposent aussi des traitements en ligne Big Data.

Logiciels d’analyse
Ce segment de l’écosystème Big Data a été particulièrement actif en termes de création de startups et d’investissement des capital-risqueurs. Depuis les interfaces de type feuille de calcul en passant par l’animation de chronologies et les visualisations 3D, de nombreuses start-up offrent toutes sortes d’outils d’analyse et de types d’interfaces. Comme chaque client a ses propres préférences, il y a probablement de la place pour un certain nombre de fournisseurs. Les stratégies de mise sur le marché diffèrent aussi : certaines startups se concentrent sur la vente d’outils pour les « Data Scientists » (Scientifiques des données), groupe encore restreint mais dont le nombre et les moyens budgétaires sont en croissance. D’autres adoptent la démarche inverse et proposent des solutions automatisées qui ciblent directement les utilisateurs professionnels et contournent les spécialistes des données .

Applications
Comme prévu, lentement mais sûrement l’action s’est déplacée vers la couche application du Big Data. Le schéma proposé ci-dessus met en évidence un certain nombre d’acteurs (la liste n’est pas exhaustive) qui exploitent des outils et des techniques Big Data. Certains offrent des applications horizontales – par exemple, d’application de Big Data Marketing (marketing prédictif notamment), outils de CRM ou de solutions de détection de fraudes. D’autres utilisent le Big Data dans des applications verticales spécifiques. La finance et les technologies publicitaires (notamment retargeting cf Criteo ou Pretargeting cf Ezakus) ont été les premières à adopter le Big Data, bien des années avant qu’on ne l’appelle comme ça. Peu à peu les usages du Big Data se répandent dans d’autres secteurs d’activité comme l’industrie pétrolière, l’aéronautique (tels les motoristes pour la maintenance prédictive), la santé ou les biotechnologies (génomique en particulier) ou l’éducation. Ce n’est que le début.

[Inspiré et traduction partielle de l’article de Matt Turk]

Une réflexion sur “#Panorama de l’écosystème #BigData à mai 2014 – #BigDataBx

  1. Super Blog, merci ! Continuez comme ça !!!
    http://www.startup365.fr/

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s