osztályozási modellek teljesítményértékelés – CAP Curve

kezdjük azzal, hogy meghatározzuk, mit értünk osztályozás alatt, az osztályozás az a folyamat, amikor megpróbálunk valamit hozzárendelni az elérhető csoportok egyikéhez. Lehet, hogy 2 csoport (bináris osztályozás) vagy több mint 2 csoport (több osztályú osztályozás).

osztályozási algoritmusok a következőket tartalmazzák: (logisztikai regresszió, K-legközelebbi szomszéd, támogató Vektor gép, naiv Bayes…stb.)

egy adattudós számára nagyon fontos megbizonyosodni arról, hogy mennyire jó az osztályozási modell. Van néhány híres módszer a modell értékelésére. Ezek a következők lehetnek:

Confusion Matrix – könnyen kiszámítható a Scikit-Learn Könyvtár megvalósításával. Csak egy vektort kell betáplálnia, amely tartalmazza az Y függő változó előrejelzéseit ^ valamint az Y függő változó tényleges értékeinek vektorát