sklearn.feature_selection.
chi2
(X, y)¶
Compute chi-squared stats between each non-negative feature and class.
Esta pontuação pode ser usado para selecionar o n_features recursos com thehighest valores para o teste de chi-quadrado estatística a partir de X, que mustcontain não só aspectos negativos, tais como booleanos ou frequências(por exemplo, prazo conta na classificação de documentos), em relação às classes.
lembre-se que o teste Qui-quadrado mede a dependência entre variáveis estocásticas, então usando esta função “elimina” as características que são mais susceptíveis de ser independentes da classe e, portanto, irrelevantes para a classificação.leia mais no Guia do utilizador.
Parameters X{array-like, sparse matrix} of shape (n_samples, n_features)
Sample vectors.
yarray-like of shape (n_samples,)
Target vector (class labels).o
Devolve chi2array, shape = (n_features)
chi2 estatísticas de cada funcionalidade.
pvalarray, shape = (n_features,)
p-values of each feature.
Ver também
f_classif
ANOVA f-value between label / feature for classification tasks.
f_regression
f-valor entre etiqueta / característica para tarefas de regressão.
Notes
a complexidade deste algoritmo é O(n_classes * n_features).