sklearn.feature_valinta.chi2¶

sklearn.feature_selection.chi2(X, y)¶

lasketaan chi-potenssitilastot kunkin Ei-negatiivisen ominaisuuden ja luokan välillä.

tällä pisteellä voidaan valita n_features-ominaisuudet, joilla on testin chi-potenssitilaston korkeimmat arvot X: stä, jossa on oltava vain ei-negatiivisia ominaisuuksia, kuten booleja tai frekvenssejä(esim.asiakirjan luokittelun termimäärät), suhteessa luokkiin.

muista, että khiin neliötesti mittaa stokastisvarianttien välistä riippuvuutta, joten tämän funktion avulla ”kitketään” ominaisuudet, jotka ovat todennäköisimmin luokasta riippumattomia ja siten luokituksen kannalta merkityksettömiä.

Lue lisää käyttöohjeesta.

parametrit X{array-like, harva matriisi} muotoa (n_samples, n_features)

Otosvektorit.

yarrayn kaltainen muoto (n_samples,)

Kohdevektori (luokkanimikkeet).

palauttaa chi2array, shape = (n_features,)

chi2-tilastot jokaisesta ominaisuudesta.

pvalarray, shape = (n_features,)

p-arvot jokaiselle ominaisuudelle.

Katso myös

f_classif

ANOVA F-arvo etiketin / ominaisuuden välillä luokitustehtävissä.

f_regression

f-arvo merkin / ominaisuuden välillä regressiotehtävissä.

toteaa

tämän algoritmin monimutkaisuus on O(n_classes * n_features).

esimerkkejä käyttäen sklearnia.feature_valinta.chi2¶

Vastaa

Sähköpostiosoitettasi ei julkaista.