sklearn.feature_selection.chi2 Portuguese

sklearn.feature_selection.chi2(X, y) Portuguese

beräkna Chi-kvadrerad statistik mellan varje icke-negativ funktion och klass.

denna poäng kan användas för att välja n_features-funktionerna med de högsta värdena för test chi-squared-statistiken från X, som endast måste innehålla icke-negativa funktioner som booleaner eller frekvenser(t.ex. termräkningar i dokumentklassificering), i förhållande till klasserna.

minns att chi-square-testet mäter beroendet mellan stokastiska variables, så att använda denna funktion ”rensar ut” de funktioner som ärmest sannolikt att vara oberoende av klass och därför irrelevant förklassificering.

Läs mer i användarhandboken.

parametrar X{array-liknande, gles matris} av form (n_samples, n_features)

Provvektorer.

yarray-liknande form (n_samples,)

Målvektor (klassetiketter).

returnerar chi2array, shape = (n_features,)

chi2 statistik för varje funktion.

pvalarray, shape = (n_features,)

p-värden för varje funktion.

Se även

f_classif

ANOVA F-värde mellan etikett / funktion för klassificeringsuppgifter.

f_regression

F-värde mellan etikett/funktion för regressionsuppgifter.

anteckningar

komplexiteten i denna algoritm är O (n_classes * n_features).

exempel med sklearn.feature_selection.chi2 oc.

Lämna ett svar

Din e-postadress kommer inte publiceras.