scipy.estadísticas.chi2_contingency¶

scipy.stats.chi2_contingency(observado, corrección=Verdadero, lambda_=Ninguno)¶

Prueba de Chi-cuadrado de independencia de variables en una tabla de contingencia.

Esta función calcula el estadístico chi-cuadrado y el valor de p para la prueba de tipotesis de independencia de las frecuencias observadas en la tabla de coincidencia observada. Las frecuencias esperadas se calculan en base a las sumas marginales bajo el supuesto de independencia; véasescipy.stats.contingency.expected_freq. El número de grados offreedom es (expresado con numpy funciones y atributos):

dof = observed.size - sum(observed.shape) + observed.ndim - 1

Parámetros observedarray_like

La tabla de contingencia. La tabla contiene las frecuencias observadas (es decir, el número de ocurrencias) en cada categoría. En el caso bidimensional, la tabla a menudo se describe como una»tabla R x C».

correctionbool, opcional

Si es True, y los grados de libertad son 1, aplique la corrección de Yates para la continuidad. El efecto de la corrección es ajustar cada valor observado en 0,5 hacia el valor esperado correspondiente.

lambda_float o str, opcional.

De forma predeterminada, la estadística calculada en esta prueba es la estadística cuadriculada de Pearson . lambda_ permite utilizar en su lugar una estadística de la familia de divergencia de potencia de lectura cruzada. Consultepower_divergence para obtener más información.

Devuelve chi2float

El estadístico de prueba.

pfloat

El valor p de la prueba

dofint

Grados de libertad

esperadodarray, la misma forma que se observa

Las frecuencias esperadas, basadas en las sumas marginales de la tabla.

Notas

Una pauta frecuentemente citada para la validez de este cálculo es que la prueba debe usarse solo si las frecuencias observadas y esperadas en cada celda son al menos 5.

Esta es una prueba para la independencia de diferentes categorías de población. La prueba solo es significativa cuando la dimensión de observado es dos o más. La aplicación de la prueba a una tabla unidimensional siempre dará como resultado una estadística esperada igual a la observada y una estadística achi-cuadrada igual a 0.

Esta función no maneja matrices enmascaradas, porque el cálculo no tiene sentido si faltan valores.

Estadísticas similares.chisquare, esta función calcula una estadística de chi-cuadrado; la conveniencia que proporciona esta función es calcular las frecuencias esperadas y los grados de libertad de la tabla de contingencia dada.Si estos ya eran conocidos, y si la corrección de los Yates no era necesaria, uno podría usar estadísticas.chisquare. Es decir, si uno llama:

chi2, p, dof, ex = chi2_contingency(obs, correction=False)

entonces se cumple lo siguiente:

(chi2, p) == stats.chisquare(obs.ravel(), f_exp=ex.ravel(), ddof=obs.size - 1 - dof)

El lambda_ argumento fue añadido en la versión 0.13.0 de scipy.

1

«Tabla de contingencia»,https://en.wikipedia.org/wiki/Contingency_table

2

«Prueba de chi cuadrado de Pearson»,https://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test

3

Cressie, N. and Read, T. R. C.,» Pruebas de aptitud Multinomial», J. Royal Stat. Soc. Series B, Vol. 46, No. 3 (1984), págs. 440 a 464.

Ejemplos

Un ejemplo bidireccional (2 x 3):

>>> from scipy.stats import chi2_contingency>>> obs = np.array(, ])>>> chi2_contingency(obs)(2.7777777777777777, 0.24935220877729619, 2, array(, ]))

Realice la prueba utilizando la relación de log-verosimilitud (es decir, la «prueba G») en lugar del estadístico chi cuadrado de Pearson.

>>> g, p, dof, expctd = chi2_contingency(obs, lambda_="log-likelihood")>>> g, p(2.7688587616781319, 0.25046668010954165)

Una de cuatro vías ejemplo (2 x 2 x 2 x 2):

Deja una respuesta

Tu dirección de correo electrónico no será publicada.