Review : Yajug Apache Spark

Yajug

Review : Yajug Apache Spark

Yajug

 

Lundi 23 novembre, s’est tenue à l’Université de Luxembourg, l’avant-dernière conférence du Java User Group of Luxembourg de l’année 2015. Le sujet de cette session s’est porté sur : “What is a distributed data science pipeline. how with apache spark and friends”. La conférence était présentée par Andy Petrella et Xavier Tordoir.

 

Mais de quoi ont-ils bien pu parler ?

Dans un monde qui produit des données en masse, données qu’il faut récolter, stocker, analyser et synthétiser avec une bonne dose d’agilité (voir schéma ci-contre), nos deux compères se sont tournés vers Apache Spark qui répond aux exigences suivantes :

Yajug_Apache_Spark

  • Un système de stockage facilement extensible.
  • L’usage de systèmes d’analyse robustes et très performantes capable de gérer des volumes énormes de données.
  • La capacité d’intégrer l’analyse statistique, l’apprentissage machine et d’autres méthodes avancées dans les outils d’analyse.
  • La possibilité d’interroger de grands ensembles de données en quasi temps réel lorsque l’immédiateté est une préoccupation.

 

 

La mise en place d’une telle solution nous ramène encore et toujours à DevOps car elle fait intervenir de très nombreux acteurs.

Les sessions Yajug vous intéressent ? Voici les reviews des différents sujets abordés précédemment.

Damien Visca

<p>Marketing / Communication</p>

No Comments

Post a Comment

Comment
Name
Email
Website