conversation_by_7u2

student_1137_7u2

Proporcje podziału danych na zbiór uczący i zbiór testowy

bot_eduexe

[eduexe-intent]other[/eduexe-intent]
W Google Teachable Machine dane są automatycznie dzielone na zbiór uczący i zbiór testowy w proporcji 85:15. Nie można ręcznie zmienić tej proporcji w GTM.

Ogólnie w Uczeniu Maszynowym, zbiór uczący powinien być znacząco większy od testowego, zbiór testowy powinien być reprezentatywny dla całości danych i wystarczająco duży. [eduexe-source]15:4[/eduexe-source][eduexe-source]15:7[/eduexe-source]

student_1137_7u2

Załóżmy, że korzystając z Google Teachable Machine, trenujemy model dla trzech klas. Dla każdej z klas dostarczyliśmy po 200 przykładów. Z ilu łącznie przykładów będzie składał się cały zbiór testowy dla tego modelu?

bot_eduexe

[eduexe-intent]other[/eduexe-intent]
Cały zbiór testowy dla tego modelu będzie składał się łącznie z 90 przykładów.

W Google Teachable Machine dane są automatycznie dzielone na zbiór uczący i zbiór testowy w proporcji 85:15. Oznacza to, że 15% wszystkich przykładów trafia do zbioru testowego.
Dla 3 klas po 200 przykładów każda, daje to łącznie 600 przykładów (3 * 200 = 600).
15% ze 600 przykładów to 90 przykładów (600 * 0.15 = 90). [eduexe-source]15:9[/eduexe-source]

student_1137_7u2

Wielkość wsadu to

bot_eduexe

[eduexe-intent]other[/eduexe-intent]
Wielkość wsadu (ang. batch size) to rozmiar porcji treningowej, czyli liczba przykładów, jaką model otrzymuje na raz do trenowania w pojedynczej iteracji swojego działania. Jest to parametr, który można regulować, np. w Google Teachable Machine. [eduexe-source]16:5[/eduexe-source]

student_1137_7u2

Załóżmy, że trenujemy model, którego zbiór uczący składa się z 340 przykładów. Parametr wielkość wsadu ustalony jest na 16. Ile wsadów będzie potrzebne do ukończenia jednej epoki

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Do ukończenia jednej epoki będzie potrzebne 22 wsady. Oblicza się to, dzieląc liczbę przykładów w zbiorze uczącym (340) przez wielkość wsadu (16) i zaokrąglając wynik w górę (340 / 16 = 21.25, co daje 22 wsady). [eduexe-source]16:5[/eduexe-source]

student_1137_7u2

współczynnik uczenia to

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Współczynnik uczenia (ang. learning rate), nazywany także stałą uczenia się, to wielkość kroku, o jaki model ma w czasie treningu korygować otrzymany wynik w kierunku wyniku oczekiwanego. Zbyt mała wartość tego parametru wydłuża proces treningu, natomiast zbyt duża może sprawić, że model "przeskoczy" oczekiwane rozwiązanie, nie osiągając optymalnego wyniku. [eduexe-source]16:7[/eduexe-source]

student_1137_7u2

strata to

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Strata (ang. loss) to różnica pomiędzy prawidłową odpowiedzią a odpowiedzią zwróconą przez model. Celem procesu trenowania modelu jest minimalizowanie funkcji straty (ang. loss function), ponieważ idealny model, który nigdy się nie myli, miałby wartość funkcji straty na poziomie 0. [eduexe-source]17:2[/eduexe-source]

student_1137_7u2

Przeuczenie - inaczej: nadmierne dopasowanie to

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Przeuczenie, inaczej nadmierne dopasowanie (ang. overfitting), to zjawisko, w którym model za bardzo dostosowuje się do danych treningowych. W efekcie nie jest w stanie poprawnie radzić sobie z danymi testowymi, których "nie widział" w czasie uczenia się. [eduexe-source]17:4[/eduexe-source]

student_1137_7u2

macierz pomyłek to

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Macierz pomyłek (ang. confusion matrix), nazywana też tablicą pomyłek, to macierz przygotowywana dla zbioru testowego. Pozwala odczytać, ile przykładów testowych z poszczególnych klas zostało sklasyfikowanych przez model poprawnie, a ile błędnie. Jest kluczowa dla oceny i porównywania modeli oraz podstawą do obliczania metryk. [eduexe-source]20:1[/eduexe-source]

student_1137_7u2

Czym są metryki i do czego ich używamy?

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Metryki w kontekście Uczenia Maszynowego to miary oceny wytrenowanych modeli. Używamy ich do porównywania modeli między sobą; im wyższa wartość metryki, tym wyższa ocena modelu. Podstawą do ich obliczania jest macierz pomyłek. [eduexe-source]21:1[/eduexe-source][eduexe-source]21:2[/eduexe-source]

student_1137_7u2

Czym jest dokładność modelu UM?

bot_eduexe

[eduexe-intent]course_content[/eduexe-intent]
Dokładność (ang. Accuracy) to podstawowa i najczęściej wykorzystywana metryka służąca do oceny jakości modelu w Uczeniu Maszynowym. Jest to stosunek poprawnie zaklasyfikowanych przez model przykładów testowych do wszystkich przykładów testowych. Im większa wartość dokładności, tym lepiej – dokładność wyniesie 0, jeśli model będzie się zawsze mylił, a 1, jeśli wszystkie przypadki testowe zostaną zaklasyfikowane poprawnie. [eduexe-source]22:1[/eduexe-source]

Eduexe Forum

conversation_by_7u2