Exploration et visualisation de données avec Orange

exploration de données

Exploration et visualisation de données avec Orange

Exploration de données gratuite avec Orange, s’intégrant avec la distribution Anaconda.

 

Orange est parmi les outils d’exploration des données le plus jeune, mais a déjà 20 ans d’existence !

exploration de données

(Cet article fait suite à l’article sur la distribution Anaconda)

 

Tout scientifique dispose d’instruments de mesure pour lui permettre de comprendre et d’analyser son domaine d’expérimentation: un biologiste aura besoin d’un microscope pour comprendre l’infiniment petit, un chimiste d’un chromatographe et il en est de même pour tous les autres domaines scientifiques. Dans celui des données, le data scientist dispose d’outils lui permettant d’explorer les données de façon intuitive, de les visualiser et d’interagir avec elles. On les appelle généralement des outils de data mining et ils mettent en œuvre des algorithmes de machine learning pour chercher les propriétés des données à analyser. Orange entre dans cette même catégorie de produits que sont WekaKnime , RapidMiner ou SPSS Modeler …

Les auteurs d’Orange ont sûrement voulu faire un clin d’œil à Clémentine, qui a été rachetée par SPSS en 2009, et qui s’appelle maintenant SPSS Modeler.

Nous allons vous présenter dans la suite de cet article cet outil gratuit qu’est Orange, que tout data scientist peut mettre en œuvre rapidement dès qu’il dispose de la distribution Anaconda sur son ordinateur.

Analyse par Angelo Pacifico – Directeur chez Agile Partner

 

Carte d’identité

Nom : Orange

Genre : Logiciel d’exploration des données multi-plateforme basé sur la distribution Anaconda

Date clef : Les développements du logiciel ont commencé en 1997

Dernière version en date : 3.6, le 29 Septembre 2017

Orange est développé et maintenu par le laboratoire de bio-informatique de l’université de Ljubljana  sous la direction du docteur Blaz Zupan et du professeur Janez Demsar.

 

En bref

Orange est développé en langage python et les sources sont disponibles sur GitHub. Orange se compose d’un designer permettant de construire un workflow en connectant des objets graphiques (widget). Cette partie du produit s’appelle le canevas et c’est la partie qui est la plus utilisée. Orange offre ainsi une programmation visuelle permettant à des utilisateurs, non-familiers avec les outils de développement, de le prendre en main rapidement. Orange expose une API en python permettant d’appeler ses services par code. Le model de composant est ouvert pour être étendu et un gestionnaire d’extension intégré au produit permet de rechercher des extensions et de les ajouter facilement.

Le logiciel est disponible sous Windows, Mac OSX et Linux grâce au choix de la plateforme graphique QT qui dispose d’une API python.

Depuis la version 3.6 il est possible avec miniconda d’installer encore plus rapidement Orange sur un ordinateur.

 

Lire la suite sur ITnation

 

 

Maeva Pitou
No Comments

Post a Comment

Comment
Name
Email
Website