Classification automatique

On nomme classification automatique la catégorisation algorithmique d'objets. Celle-ci consiste à attribuer une classe ou catégorie à chaque objet à classer, en se basant sur des données statistiques.



Catégories :

Analyse des données - Statistiques - Philosophie de la connaissance - Apprentissage automatique

Page(s) en rapport avec ce sujet :

  • on les regroupe en plusieurs classes de telle sorte que les individus d'une même classe soient.... CLASSIFICATION AUTOMATIQUE : INTRODUCTION. 8.6 Exercices... (source : math.unice)
  • vecteurs individus est calculée selon une distance bien définie. La classification automatique se base sur la maximisation de la distance inter classes et ... (source : dahak.esi)
  • individus /observations identifiés. V. Jalby – M1 SM - Cours d'analyse des données – 2009-2010 – IV. Méthodes de classification automatique. Page 3. (source : unilim)

On nomme classification automatique la catégorisation algorithmique d'objets. Celle-ci consiste à attribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se basant sur des données statistiques. Cela fait fréquemment appel à l'apprentissage automatique et est beaucoup utilisé en reconnaissance de formes.

Fondements

Nos moyens limités d'entendement nous obligent, pour tenter de comprendre quelque chose au réel, à effectuer des classifications des objets que nous devons traiter en catégories. Celles-ci ont été reconnues par la philosophie :

La classification automatique vise à créer ces catégories à partir de procédés ne faisant intervenir que les données et pas la subjectivité de l'expérimentateur. Il serait d'ailleurs plus exact de dire : «ne faisant pas intervenir la subjectivité de l'expérimentateur par autre chose que le choix des représentations qu'il utilise» : si on classifie des objets en considérant leur plus grande dimension, on n'obtiendra pas généralement le même classement qu'en les classifiant par leurs poids.

Bien que les premières bases de l'approche algorithmique de la classification automatique soient assez anciennes, ce n'est qu'avec le développement de l'informatique que celles-ci sont devenues envisageables à mettre en œuvre sur de grands échantillons de données. Le résultat d'une classification peut être soit une partition mathématique soit une hiérarchie (mathématiques) .

Méthodes

Parmi les différentes méthodes, on considère généralement deux grands types d'approches.

Non paramétriques

Les approches dites non paramétriques (classification hiérarchique, méthode des centres mobiles) ne considèrent qu'une seule hypothèse : plus deux individus sont proches, plus ils ont de chances de faire partie de la même classe.

Probabilistes

La seconde grande famille de méthodes de classification automatique, dites probabilistes, utilise une hypothèse sur la distribution des individus à classifier. A titre d'exemple, on considère généralement que les individus de chacune des classes suivent une loi normale. Le problème qui se pose alors est de déterminer quels sont les paramètres des lois (moyenne, variance) ainsi qu'à quelle classe les individus ont le plus de chances d'appartenir. Les paramètres d'une loi peuvent être déterminés de maintes façons, et surtout en utilisant l'algorithme espérance-maximisation.

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Classification_automatique.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu