La variabile di test Q di Yule è un indice di associazione, ideato dallo statistico scozzese George Udny Yule, e usato in tabelle statistiche dette di contingenza 2 × 2 {\displaystyle 2\times 2} .

Un indicatore ideato dallo stesso autore è la Y di Yule. Rispetto quest'ultima il valore assoluto è sempre maggiore ( | Q | > | Y | {\displaystyle |Q|>|Y|} ) a meno che non vi sia indipendenza o completa associazione.

Storia

L'indice venne presentato da Yule nell'articolo On the association of attributes in statistics e fu al centro di una controversia con il matematico e statistico inglese Karl Pearson. La posizione di Pearson era che alla base di una tabella di contingenza vi fosse un fenomeno continuo e gaussiano, invece che un fenomeno discreto come sostenuto da Yule, che considerava poco scientifico fare ipotesi non desiderate e non verificabili.

Pearson, inoltre, notava che "collassando" una tabella N × N {\displaystyle N\times N} , riducendola a 2x2, si ottengono risultati differenti a seconda di come vengono aggregati i valori.
Questa osservazione rimane tuttora valida.

Metodologia

Q = ( α 1 ) / ( α 1 ) {\displaystyle Q=(\alpha -1)/(\alpha 1)}

ove

α = ( P 11 / P 21 ) / ( P 12 / P 22 ) {\displaystyle \alpha =(P_{11}/P_{21})/(P_{12}/P_{22})} è il cosiddetto odds ratio
P i j = P ( A i B j ) {\displaystyle P_{ij}=P(A_{i}B_{j})} ove sia i {\displaystyle i} che j {\displaystyle j} assumono i valori 1 e 2

Tale indice Q {\displaystyle Q} varia tra -1 e 1, ove 0 indica l'indipendenza.

Q {\displaystyle Q} può essere stimato da

q = ( a 1 ) / ( a 1 ) {\displaystyle q=(a-1)/(a 1)}

dove in questo caso

a = ( f 11 / f 21 ) / ( f 12 / f 22 ) {\displaystyle a=(f_{11}/f_{21})/(f_{12}/f_{22})} in analogia a α {\displaystyle \alpha } (con il vincolo che f i j {\displaystyle f_{ij}} sia sempre maggiore di zero

mentre la varianza di q {\displaystyle q} viene stimata con

s 2 ( q ) = 1 / 4 ( 1 q ) 2 i = 1 N j = 1 N 1 / f i j {\displaystyle s^{2}(q)=1/4(1-q)^{2}\sum _{i=1}^{N}\sum _{j=1}^{N}1/f_{ij}}

Esempio

 Valori assoluti
  ------------- ------- ------ 
 |     \ Abile |   Si  |  No  |
 |Sesso \      |       |      |
  ------------- ------- ------ 
 |Uomini       |  20   |  80  |
 |Donne        |  90   |  80  |
  ------------- ------- ------ 

 Valori relativi (f)
  ------------- ------- ------ 
 |     \ Abile |   Si  |  No  |
 |Sesso \      |       |      |
  ------------- ------- ------ 
 |Uomini       | 0,074 | 0,296|
 |Donne        | 0,333 | 0,296|
  ------------- ------- ------ 
a = ( 0 , 074 / 0 , 333 ) / ( 0 , 296 / 0 , 296 ) = 0 , 222 {\displaystyle a=(0,074/0,333)/(0,296/0,296)=0,222}
q = ( 0 , 222 1 ) / ( 0 , 222 1 ) = 0 , 636 {\displaystyle q=(0,222-1)/(0,222 1)=-0,636}

Valori di q differenti

Collassando una tabella N × N {\displaystyle N\times N} a una 2 × 2 {\displaystyle 2\times 2} , a causa del criterio di aggregazione dei valori, si possono ottenere valori di q {\displaystyle q} differenti. (cf. osservazione di Karl Pearson)

Se per esempio i dati di partenza fossero stati

 
  ------------- ------- ------ ------ 
 |     \ Abile |   Si  | boh! |  No  |
 |Sesso \      |       |      |      |
  ------------- ------- ------ ------ 
 |Uomini       |  20   |  10  |  70  |
 |Donne        |  90   |   0  |  80  |
  ------------- ------- ------ ------ 

assegnando il "Boh!" ai "No" si ottiene la tabella e il q = 0 , 636 {\displaystyle q=-0,636} di cui sopra, mentre assegnandolo ai "Si" si ottiene la tabella seguente:

  ------------- ------- ------ 
 |     \ Abile |   Si  |  No  |
 |Sesso \      |       |      |
  ------------- ------- ------ 
 |Uomini       |  30   |  70  |
 |Donne        |  90   |  80  |
  ------------- ------- ------ 

con l'indicatore q {\displaystyle q} che si attenua diventando q = 0 , 448 {\displaystyle q=-0,448}

Note


Home Die Quelle in dir

Gedichte Die Quelle von Darkjuls

Yule's Q and hierarchical clustering tutorial in R Step By Step Data

Quale Bilder Durchsuchen 222 Archivfotos, und Videos

Die Quelle Younity