Généralité de l'espace : R1, R2, R3,...Rn.
Type de données.
Notion de distance et de ressemblance ou dissimilarité et similarité.
Indice de similarité, mesure l'association entre objets
Coefficient de dépendance : covariance, coéfficient de corrélation.
Coefficient de similarité:
Données binaires :
|
descripteur 1 |
descripteur 2 |
|
descripteur q |
objet 1 |
0 |
1 |
. |
0 |
objet 2 |
1 |
1 |
. |
1 |
|
. |
. |
. |
|
objet p |
0 |
0 |
. |
1 |
|
objet x1 |
|
1
|
0
|
objet x2 |
1 |
a
|
b
|
0 |
c
|
d
|
|
a+c
|
b+d
|
n=a+b+c+d
|
Coefficient de simple concordance (Sokal et Michener, 1958):

Pb du zéro : exclusion les doubles zéros :
Coefficient de communauté (Jaccard, 1908) :

Données continues
Matrice des données : m objets (ou individus), p descripteurs (ou variables) :

Centrage et réduction des données :

Distances métriques :
Distances euclidienne entre objets:

ou pj est une pondération qui est en général égale à 1.
Tableau de comptage:
m modalités en ligne,
p modalités en colonnes,
Données du type espéces/stations, la distance euclidienne trés sensible aux espéces abondantes

Distance du Chi2 :
Passage aux fréquences :

Calcul des marges (sommes des lignes et des colonnes):

Expression de la distance du CHI-2

