conversation_by_gj4
-
Czy F-score jest uniwersalną metryką?
F-score nie jest uniwersalną metryką. Jak wskazano w tekście, F-score bierze pod uwagę tylko 3 z 4 ćwiartek macierzy pomyłek, ignorując przykłady true negative (TN) - prawdziwie negatywne. To oznacza, że F-score nie uwzględnia wyników prawdziwie negatywnych, co może prowadzić do nieprawidłowych ocen modeli w niektórych sytuacjach.
Przykładem tego jest sytuacja, w której model klasyfikacji zawsze wskazuje, że osoba jest chora, nawet jeśli jest zdrowa. W takim przypadku model ma 100% dokładność, ponieważ poprawnie zdiagnozował wszystkie osoby, które rzeczywiście były chore, ale jego F-score może być niski, ponieważ błędnie zaklasyfikował wszystkie osoby zdrowe jako chore.
W takich sytuacjach, lepszym wyborem może być inna metryka, taką jak współczynnik korelacji Matthews'a, świadomość (Informedness) lub kappa Cohena, które uwzględniają wyniki prawdziwie negatywne.
-
Czy F-score = 2precyzjarecall/(precyzja + recall) ?
-
Czy F-score = 2precyzjarecall/(precyzja + recall) ?
Tak, to prawidłowa definicja F-score. F-score to średnia harmoniczna precyzji i czułości, która jest obliczana według następującego wzoru:
F-score = 2precyzjarecall/(precyzja + recall)
To samo zostało opisane w tekście jako:
F1 = 2precisionrecall/(precision + recall)
lub
F1 = 2TP/(2TP + FP + FN)
gdzie TP to liczba prawdziwych pozytywnych, FP to liczba fałszywych pozytywnych, a FN to liczba fałszywych negatywnych.