sklearn.feature_selection.
chi2
(X, y) Portuguese
beräkna Chi-kvadrerad statistik mellan varje icke-negativ funktion och klass.
denna poäng kan användas för att välja n_features-funktionerna med de högsta värdena för test chi-squared-statistiken från X, som endast måste innehålla icke-negativa funktioner som booleaner eller frekvenser(t.ex. termräkningar i dokumentklassificering), i förhållande till klasserna.
minns att chi-square-testet mäter beroendet mellan stokastiska variables, så att använda denna funktion ”rensar ut” de funktioner som ärmest sannolikt att vara oberoende av klass och därför irrelevant förklassificering.
Läs mer i användarhandboken.
parametrar X{array-liknande, gles matris} av form (n_samples, n_features)
Provvektorer.
yarray-liknande form (n_samples,)
Målvektor (klassetiketter).
returnerar chi2array, shape = (n_features,)
chi2 statistik för varje funktion.
pvalarray, shape = (n_features,)
p-värden för varje funktion.
Se även
f_classif
ANOVA F-värde mellan etikett / funktion för klassificeringsuppgifter.
f_regression
F-värde mellan etikett/funktion för regressionsuppgifter.
anteckningar
komplexiteten i denna algoritm är O (n_classes * n_features).