modele klasyfikacyjne Ocena wydajności – Krzywa CAP

zacznijmy od zdefiniowania, co oznacza Klasyfikacja, klasyfikacja jest procesem próby przypisania czegoś do jednej z dostępnych grup. Możesz mieć 2 grupy (Klasyfikacja binarna) lub więcej niż 2 grupy (Klasyfikacja Wieloklasowa).

algorytmy klasyfikacji obejmują: (regresję logistyczną, K-najbliższy sąsiad, maszynę wektorów wsparcia i naiwnych Bayesa … itd.)

dla analityka danych bardzo ważne jest, aby upewnić się, jak dobry jest twój model klasyfikacji. Istnieje kilka znanych sposobów oceny modelu. Można je wymienić w następujący sposób:

macierz pomieszania-można ją łatwo obliczyć za pomocą implementacji Biblioteki Scikit-Learn. Wystarczy podać mu wektor zawierający przewidywania zmiennej zależnej y ^ i Wektor rzeczywistych wartości zmiennej zależnej y

scikit-dowiedz się moduł macierzy splątania

teraz po obliczeniu macierzy splątania, która będzie macierzą 2*2 dla dowolnego problemu klasyfikacji binarnej, otrzymana macierz będzie wyglądać następująco

analizując matrycę zamieszania możemy powiedzieć, że mamy całkiem niezły klasyfikator z dokładnością = 9,800/ 10,000 = 98%

ale analityk danych ma dość dziwny pomysł, że chce spróbować; Chodzi o to, aby klasyfikator nie zaklasyfikował żadnej z transakcji jako oszustwo (dodatnia klasa '1′), a następnie obliczył nową matrycę zamieszania i wyglądało to następująco:

KGSAU

modele klasyfikacyjne Ocena wydajności – Krzywa CAP

Dodaj komentarz Anuluj pisanie odpowiedzi