Reverend est une librairie python qui permet de faire de la classification par inférence Bayésienne. L’utilisation de cette librairie est facile et rapide et permet de trier de documents et manière très élégante.
Pour utiliser cet outil dans votre application il suffit importer la librairie, de l’initialiser avec un premier jeu de données. Ensuite la classification sera automatique. Le principal avantage de cette méthode et qu’elle est moins sensible aux petits volume que de la statistique de base.
Voici quelques exemples d’applications :
- Classer automatiquement des flux RSS
- Détecter la langue d’un document
- Analyser automatiquement des commentaires
- etc..
Pour illustrer le propos voici ce que serais l’initialisation de l’outil pour en faire un détecteur de langue (guesser)
from reverend.thomas import Bayes
guesser = Bayes()
guesser.train('french', 'le la les du un une je il elle de en')
guesser.train('german', 'der die das ein eine')
guesser.train('spanish', 'el uno una las de la en')
guesser.train('english', 'the it she he they them are were to')
guesser.guess('they went to el cantina')
guesser.guess('they were flying planes')
guesser.train('english', 'the rain in spain falls mainly on the plain')
guesser.save('my_guesser.bay')
Pour information il existe aussi un portage de cette outil en Ruby ici : Bishop.
Pour le python la derniere version est ici : Trunk: svn co http://divmod.org/svn/Divmod/trunk/Reverend