sklearn.selección de características.chi2¶

sklearn.feature_selection.chi2(X, y)¶

Calcula las estadísticas de chi cuadrado entre cada entidad y clase no negativas.

Esta puntuación se puede usar para seleccionar las características n_features con los valores más altos para la estadística chi-cuadrado de prueba de X, que debe contener solo características no negativas, como booleanos o frecuencias(por ejemplo, recuentos de términos en la clasificación de documentos), en relación con las clases.

Recuerde que la prueba chi-cuadrado mide la dependencia entre variables estocásticas, por lo que el uso de esta función «elimina» las características que tienen más probabilidades de ser independientes de la clase y, por lo tanto, irrelevantes para la clasificación.

Lea más en la Guía del usuario.

Parámetros X{matriz dispersa tipo matriz} de forma (n_muestras, n_features)

Vectores de muestra.

forma tipo yarray (n_samples,)

Vector de destino (etiquetas de clase).

Devuelve chi2array, shape = (n_features,)

estadísticas chi2 de cada entidad.

pvalarray, shape = (n_features,)

valores p de cada entidad.

Consulte también

f_classif

ANOVA Valor F entre etiqueta/característica para tareas de clasificación.

f_regression

Valor F entre etiqueta / entidad para tareas de regresión.

Notas

la Complejidad de este algoritmo es O(n_classes * n_features).

Ejemplos usando sklearn.selección de características.chi2¶

Deja una respuesta

Tu dirección de correo electrónico no será publicada.