conversation_by_183
-
czy podział danych na zbiór uczący i testowy, to jedyny prosty podział?
Nie, podział danych na zbiór uczący i testowy nie jest jedynym prostym podziałem. W Uczeniu Maszynowym spotyka się także inne proporcje, takie jak zbiór testowy obejmujący 20% wszystkich danych, 10% lub nawet mniej przy bardzo dużych zbiorach danych.
-
jaka jest różnica między zmianą tempa uczenia się modelu a liczby epok?
-
jaka jest różnica między zmianą tempa uczenia się modelu a liczby epok?
Różnica między zmianą tempa uczenia się modelu a liczbą epok jest taka, że zmiana tempa uczenia się modelu odnosi się do współczynnika uczenia (learning rate), który określa, jak szybko model koryguje swoje wyniki w czasie treningu. Im wyższy współczynnik uczenia, tym model koryguje swoje wyniki szybciej, ale może również "przeskoczyć" przez oczekiwane rozwiązanie.
Z kolei liczba epok odnosi się do liczby iteracji, które model wykonuje w czasie treningu. Im większa liczba epok, tym model wykonuje więcej iteracji i może osiągnąć lepsze wyniki, ale również może być bardziej narażony na nadmierną adaptację do danych szkoleniowych.
Przykładem może być następująca sytuacja: Twoja firma segreguje śmieci i chcesz, aby model rozpoznał zdjęcia śmieci, aby uniknąć błędów w segregacji. Jeśli model ma zbyt niski współczynnik uczenia, może rozpoznać nieśmieci jako śmieci, co może prowadzić do niepożądanych konsekwencji. W takim przypadku, zwiększenie liczby epok może pomóc modelowi osiągnąć lepsze wyniki, ale również może prowadzić do nadmiernego adaptowania się modelu do danych szkoleniowych.
Warto zauważyć, że zmiana tempa uczenia się modelu i liczba epok są dwoma niezależnymi parametrami, które mogą być dostosowane oddzielnie w zależności od potrzeb modelu.
-
dlaczego w modelach strata(loss) nie zmienia się liniowo z każdą kolejną epoką?
-
dlaczego w modelach strata(loss) nie zmienia się liniowo z każdą kolejną epoką?
Strata (loss) w modelach nie zmienia się liniowo z każdą kolejną epoką, ponieważ jest to wynik interakcji między modelami a danymi. W każdej kolejnej epoce model koryguje swoje wyniki w oparciu o dane, ale zmiana straty nie jest liniowa ze względu na fakt, że model może się nadmiernie dostosowywać do danych szkoleniowych.
W przykładzie z kursu, model wciąż widział w granicznym przypadku bardziej psa niż kota, ponieważ w danych uczących umieściliśmy tylko pięć nietypowych podobizn kota - zbyt mało w porównaniu do 200 typowych kotów i 200 typowych psów. W takim przypadku, model może się nadmiernie dostosowywać do danych szkoleniowych, co prowadzi do zmiany straty w sposób nieliniowy.
Dodatkowo, zmiana straty może być również wpływana przez różne czynniki, takie jak współczynnik uczenia (learning rate), liczba epok, a także sama struktura modelu. Wszystkie te czynniki mogą wpływać na sposób, w jaki model koryguje swoje wyniki w czasie treningu, co prowadzi do zmiany straty w sposób nieliniowy.
Warto zauważyć, że zmiana straty w modelach jest zależna od wielu czynników, a nie tylko od liczby epok. W związku z tym, nie można przewidzieć, jak zmieni się strata w każdej kolejnej epoce, a jedynie można obserwować, jak zmienia się strata w czasie treningu.