conversation_by_ref
-
Topic created
-
W rozdziale A2 do gotowego modelu w ramach testu wprowadziłem zdjęcie kaczki. Model stwierdził, że jest to w 100% pies, dlaczego tak? Nie powinien raczej być przynajmniej trochę niepewny w takim przypadku?
-
W rozdziale A2 do gotowego modelu w ramach testu wprowadziłem zdjęcie kaczki. Model stwierdził, że jest to w 100% pies, dlaczego tak? Nie powinien raczej być przynajmniej trochę niepewny w takim przypadku?
Odpowiedź na pytanie kursanta:
Nie ma informacji w kontekście, która mówiłaby o tym, dlaczego model klasyfikował zdjęcie kaczki jako pies. Jednak możemy podejść do tego problemu z punktu widzenia metryk, które omówiliśmy wcześniej.
Jeśli model klasyfikował zdjęcie kaczki jako pies, to prawdopodobnie nie był on w stanie rozróżnić pomiędzy klasami "pies" i "nie-pies". W takim przypadku dokładność modelu (accuracy) byłaby wysoka, ponieważ model klasyfikował prawidłowo wszystkie przykłady "nie-piesów" (które to zdjęcie kaczki), ale jednocześnie nie był w stanie rozróżnić pomiędzy przykładami "pies" i "nie-pies".
W takim przypadku precyzja modelu (precision) byłaby niska, ponieważ model klasyfikował jako "pies" nie tylko prawidłowe przykłady "pies", ale również nieprawidłowe przykłady "nie-pies" (które to zdjęcie kaczki).
Czułość modelu (recall) również byłaby niska, ponieważ model nie był w stanie rozróżnić pomiędzy przykładami "pies" i "nie-pies".
F-score modelu byłby również niski, ponieważ jest on kompromisem pomiędzy precyzją i czułością.
W związku z tym, nie ma informacji w kontekście, która mówiłaby o tym, dlaczego model klasyfikował zdjęcie kaczki jako pies. Jednak możemy podejść do tego problemu z punktu widzenia metryk, które omówiliśmy wcześniej.
-
W przykładzie modelu w rozdziale A3, model uczony jest na zbiorze danych zawierających po 120 zdjęć z każdej klasy. Czy realistycznie nie jest to za mało, żeby dobrze wyćwiczyć model? Jeśli tak to jaka powinna być rzeczywista ilość danych?
-
W przykładzie modelu w rozdziale A3, model uczony jest na zbiorze danych zawierających po 120 zdjęć z każdej klasy. Czy realistycznie nie jest to za mało, żeby dobrze wyćwiczyć model? Jeśli tak to jaka powinna być rzeczywista ilość danych?
Odpowiedź na pytanie kursanta:
Tak, realistycznie nie jest to za mało, żeby dobrze wyćwiczyć model. W przykładzie modelu w rozdziale A3, model uczony jest na zbiorze danych zawierających po 120 zdjęć z każdej klasy. Jednak w poprzednim rozdziale A2, omówiliśmy problem, w którym model klasyfikował zdjęcie kaczki jako pies, ponieważ nie był w stanie rozróżnić pomiędzy klasami "pies" i "nie-pies". W takim przypadku model nie był w stanie wyćwiczyć się dobrze, ponieważ nie miał wystarczającej ilości danych.
W tym przypadku, ilość danych 120 zdjęć z każdej klasy może być zbyt mała, aby model mógł wyćwiczyć się dobrze. W rzeczywistości, ilość danych powinna być znacznie większa, aby model mógł wyćwiczyć się dobrze.
Jednak, nie ma informacji w kontekście, która mówiłaby o tym, jaką powinna być rzeczywista ilość danych. Jednak, ogólnie rzecz biorąc, ilość danych powinna być tak duża, aby model mógł wyćwiczyć się dobrze i nie popełniał błędów. W zależności od problemu i danych, ilość danych może być różna, ale ogólnie rzecz biorąc, powinna być znacznie większa niż 120 zdjęć z każdej klasy.