Université Pierre et Marie Curie

Analyse de données - Ordinations et groupements

Chapitre 1. Introduction
Chapitre 2. L'Analyse en Composantes Principales (ACP)
Chapitre 3. L'Analyse des Correspondances (AFC)
Chapitre 4. L'Analyse des Correspondances Multiples(AFCM)
Chapitre 5. Méthodes de classifications
5.1. Présentation
5.2. Calcul de la matrice de distance (ou de ressemblance)
5.3. Choix du critére d'agrégation.
5.4. Représentation graphique : le dendrogramme.
Chapitre 6. Autres types de groupements.
Chapitre 7. Références
Page d'accueilTable des matièresNiveau supérieurPage précédenteBas de la pagePage suivante

5.3. Choix du critére d'agrégation.

 Différents critères peuvent être utilisées pour construire la classification. Parmi les plus courants, on peut citer : 

  • Saut minimal ou plus petite distance (single linkage).
    Si x, y, z sont trois objets et si les objets x et y sont regroupés en un seul élément noté h, on peut définir la distance de ce groupement à z par la plus petite distance des divers éléments de h à z :

    Exemple
  • Saut maximal ou la plus grande distance.
  • Distance moyenne.

    plus généralement :
    Exemple
  • Critère d’agrégation selon l’inertie. (Critère de Ward)
    Si n objets (ou indivdus) sont à classer dans un espaces à p dimensions (espaces des variables ou descripteurs).
    Chaque point xi (vecteur à p composantes) est muni d’une masse mi, on note m la masse totale du nuage : .
    Le carré de la distances entre les points xi et xi’ :
    L’inertie totale du nuage  :
    ou g est le centre de gravité du nuage :
    S’il existe une partition de l’ensemble des éléments en s classes, la qe classes a pour masse : et pour centre de gravité
    La décomposition de la quantité I en inertie intra et interclasses se fait suivant :

    Le critère revient à minimiser l’inertie intra-classes :
    ou encore à maximiser l’inertie interclasse :

 

Page d'accueilTable des matièresNiveau supérieurPage précédenteHaut de la pagePage suivante