Često je teško započeti s terminologijom određene domene. S pozadinom softverskog inženjeringa, strojno učenje ima mnogo takvih pojmova za koje smatram da se moram sjetiti da koristim alate i pročitam članke.
Neki od osnovnih pojmova su Precision, Recall i F1-Score. One se odnose na stjecanje sitnije predstave o tome koliko je klasifikator dobar, za razliku od samo gledanja na ukupnu točnost. Pisanje objašnjenja tjera me da razmislim i pomaže mi da se i sam sjetim teme. Zato volim pisati ove članke.
U ovom članku gledam binarni klasifikator. Isti se koncepti primjenjuju šire, samo zahtijevaju malo više razmatranja o problemima više klasa. Ali to je nešto o čemu treba razmisliti drugi put.
Prije nego uđemo u detalje, uvijek je zgodan pregledni prikaz:
Hijerarhija metrike od sirovih mjerenja / označenih podataka do F1-bodova. Slika autora.
Na prvi pogled to je pomalo neuredna mreža. Za sada se ne morate brinuti oko detalja, ali možemo se osvrnuti na to u sljedećim odjeljcima kada objašnjavamo detalje odozdo prema gore. Metrike tvore hijerarhiju koja počinje s _istinitim/lažno negativnim/pozitivnim _ (pri dnu), a nadovezuje se sve do _F1-ocjene _ da ih sve poveže. Ajmo dalje graditi.
Točni/lažni pozitivni i negativni
Binarni klasifikator može se promatrati kao klasificiranje instanci kao pozitivan ili negativan:
- Pozitivan : Instanca je klasificirana kao član klase koju klasifikator pokušava identificirati. Na primjer, klasifikator koji traži fotografije mačaka klasificirao bi fotografije s mačkama kao pozitivne (ako su točne).
- Negativan : Instanca je klasificirana kao pripadnik klase koju pokušavamo identificirati. Na primjer, klasifikator koji traži fotografije mačaka trebao bi klasificirati fotografije sa psima (i bez mačaka) kao negativne.
#pozovi #f1-rezultat #preciznost #znanost o podacima
premadatascience.com
Pogled na preciznost, opoziv i F1-rezultat
Pogled na preciznost, opoziv i F1-rezultat. Istraživanje odnosa između metrika strojnog učenja