TANAGRA est un logiciel gratuit de data science (data mining, machine learning, statistique) destiné à l'enseignement et à la recherche. Il implémente une série de méthodes de fouilles de données issues du domaine de la statistique exploratoire, de l'analyse de données, de l'apprentissage automatique et des bases de données.

L'objectif principal du projet TANAGRA est d'offrir aux chercheurs, aux enseignants et aux étudiants une plate-forme de data science facile d'accès, respectant les standards des logiciels du domaine, notamment en matière d'interface et de mode de fonctionnement, et permettant de mener des études sur des données réelles et/ou synthétiques.

Puisque le code source est libre d'accès et modifiable, le second objectif de TANAGRA est de proposer aux chercheurs une architecture leur permettant d'implémenter aisément les techniques qu'ils veulent étudier, de comparer les performances des algorithmes. TANAGRA se comporte plus comme une plate-forme d'expérimentation qui leur permettrait d'aller à l'essentiel en leur épargnant toute la partie ingrate de la programmation de ce type d'outil : la gestion des données.

L'utilisation de TANAGRA est totalement libre, dans quelque contexte que ce soit. Si vous souhaitez le citer dans vos travaux de recherche, voici la référence à utiliser : Ricco Rakotomalala, "TANAGRA : un logiciel gratuit pour l'enseignement et la recherche", in Actes de EGC'2005, RNTI-E-3, vol. 2, pp.697-702, 2005.

Une description approfondie du logiciel (version longue de l'article ci-dessus) est disponible dans le numéro 32 de la revue Modulad (Janvier 2005).

Enfin, Tanagra est également référencé par ailleurs, entres autres sur Wikipédia ou encore dans un article consacré aux logiciels utilisés dans les IUT STID (Mars 2012).

Ricco Rakotomalala