sklearn.feature_selection.chi2¶

sklearn.feature_selection.chi2(X, y)¶

Compute chi-squared stats between each non-negative feature and class.

Esta pontuação pode ser usado para selecionar o n_features recursos com thehighest valores para o teste de chi-quadrado estatística a partir de X, que mustcontain não só aspectos negativos, tais como booleanos ou frequências(por exemplo, prazo conta na classificação de documentos), em relação às classes.

lembre-se que o teste Qui-quadrado mede a dependência entre variáveis estocásticas, então usando esta função “elimina” as características que são mais susceptíveis de ser independentes da classe e, portanto, irrelevantes para a classificação.leia mais no Guia do utilizador.

Parameters X{array-like, sparse matrix} of shape (n_samples, n_features)

Sample vectors.

yarray-like of shape (n_samples,)

Target vector (class labels).o

Devolve chi2array, shape = (n_features)

chi2 estatísticas de cada funcionalidade.

pvalarray, shape = (n_features,)

p-values of each feature.

Ver também

f_classif

ANOVA f-value between label / feature for classification tasks.

f_regression

f-valor entre etiqueta / característica para tarefas de regressão.

Notes

a complexidade deste algoritmo é O(n_classes * n_features).

exemplos usando sklearn.feature_selection.chi2¶

Deixe uma resposta

O seu endereço de email não será publicado.