Classifier des documents par inférence Bayésienne (Python-Reverend)

juillet 25, 2008

Reverend est une librairie python qui permet de faire de la classification par inférence Bayésienne. L’utilisation de cette librairie est facile et rapide et permet de trier de documents et manière très élégante.

Pour utiliser cet outil dans votre application il suffit importer la librairie, de l’initialiser avec un premier jeu de données. Ensuite la classification sera automatique. Le principal avantage de cette méthode et qu’elle est moins sensible aux petits volume que de la statistique de base.

Voici quelques exemples d’applications :

  • Classer automatiquement des flux RSS
  • Détecter la langue d’un document
  • Analyser automatiquement des commentaires
  • etc..

Lire le reste de cette entrée »