conversation_by_a59

bot_external

W kontekście podanym w kursie, uczenie przez wzmacnianie (ang. reinforcement learning) to podejście, w którym model uczy się wchodząc w interakcje ze środowiskiem, poprzez system kar i nagród.

student_a59

Ale jakie są konkretne zastosowania uczenia przez wzmacnianie?

bot_external

Uczenie przez wzmacnianie ma wiele zastosowań w różnych dziedzinach, takich jak:

Gier komputerowych: model uczy się grać w grę, poprzez system kar i nagród, tak aby osiągać najlepsze wyniki.
Robotyki: model uczy się kontrolować robotę, poprzez system kar i nagród, tak aby osiągać określone cele.
Zarządzania ruchem: model uczy się zarządzać ruchem w sieciach komunikacyjnych, poprzez system kar i nagród, tak aby osiągać optymalne rozwiązanie.
Uczenia jazdy samochodem: model uczy się jazdy samochodem, poprzez system kar i nagród, tak aby osiągać bezpieczne i efektywne podróże.

Przykładem uczenia przez wzmacnianie jest uczenie modelu do gry w szachy. Model uczy się grać w szachy, poprzez system kar i nagród, tak aby osiągać najlepsze wyniki. Im model jest lepszy, tym większe nagrody otrzymuje, a im jest gorszy, tym większe kary otrzymuje.

student_a59

Czym jest GTM?

bot_external

GTM to skrót od Google Teachable Machine, czyli przeglądarkowe narzędzie udostępnione przez firmę Google, które umożliwia tworzenie modeli Uczenia Maszynowego (oraz zapisywanie ich do wykorzystania w dowolnych zastosowaniach). Do korzystania z GTM nie są potrzebne żadne umiejętności programistyczne ani matematyczne, wystarczy jedyne ogólne zrozumienie, czym Uczenie Maszynowe jest.

student_a59

Dlaczego odpowiedni dobór i przygotowanie danych jest niezwykle ważne?

bot_external

Odpowiedni dobór i przygotowanie danych jest niezwykle ważne, ponieważ bez nich uczenie maszynowe nie byłoby możliwe. Dane są podstawą uczenia maszynowego, a ich jakość ma bezpośredni wpływ na jakość modelu. Dobra jakość danych gwarantuje, że model będzie mógł uczyć się efektywnie i dokładnie, natomiast złe dane mogą prowadzić do niewłaściwych wyników lub nawet do niepowodzenia modelu.

Przykładem tego jest analiza regresji, w której założenie konkretnej postaci relacji między zmiennymi niezależnymi a zmienną zależną jest niezwykle ważne. Im lepsze dane, tym lepsze założenie postaci relacji, a tym samym lepsze wyniki modelu.

student_a59

Co się stanie, gdy dane będą słabej jakości i będzie ich niewystarczająco?

bot_external

Gdy dane będą słabej jakości i będzie ich niewystarczająco, model uczenia maszynowego może nie być w stanie efektywnie uczyć się i dokładnie przewidywać wyniki. Słabe dane mogą prowadzić do niewłaściwych wyników lub nawet do niepowodzenia modelu.

Przykładem tego jest sytuacja, w której mamy do czynienia z rzadką chorobą, dotykającą tylko 1% populacji. Jeśli przykłady uczące i testowe zostały zaś dobrane idealnie losowo, to w zbiorze testowym znalazło się 99 osób zdrowych i jedna osoba chora. W takim przypadku model uczenia maszynowego może nie być w stanie poprawnie rozpoznać osób chorego, ponieważ klasa zdecydowanie mniejsza zostanie najpewniej zignorowana.

W takim przypadku, model może osiągnąć wysoką dokładność, ale będzie praktycznie bezużyteczny, ponieważ nie będzie w stanie spełnić swojego zasadniczego celu, czyli zdiagnozować osób chorych.

student_a59

Jaki podział danych treningowych i testowych jest najlepszy?

bot_external

Podział danych treningowych i testowych w proporcji 85:15 jest najlepszym wyborem w przypadku Google Teachable Machine. Jest to automatycznie przydzielany podział danych przez GTM, który pozwala na efektywne uczenie się modelu i ocenę jego dokładności.

student_a59

A w przypadku własnego modelu CNN w np. PyTorch?

bot_external

W przypadku własnego modelu CNN w PyTorch, podział danych treningowych i testowych nie jest automatycznie przydzielany przez GTM, jak w przypadku Google Teachable Machine. Zazwyczaj, w przypadku modeli CNN, podział danych treningowych i testowych jest przydzielany w proporcji 80:20 lub 90:10, w zależności od potrzeb i celów modelu.

Proporcja 80:20 oznacza, że 80% danych jest używanych do treningu modelu, a 20% do testowania. Proporcja 90:10 oznacza, że 90% danych jest używanych do treningu modelu, a 10% do testowania.

Warto zauważyć, że podział danych treningowych i testowych powinien być losowy i niezależny od danych samego modelu. Im większa różnica między danymi treningowymi i testowymi, tym lepsza jest ocena dokładności modelu.

W przypadku własnego modelu CNN w PyTorch, można użyć bibliotek takich jak scikit-learn lub TensorFlow, aby automatycznie przydzielić podział danych treningowych i testowych.

student_a59

Jak zapobiegać przeuczeniu?

bot_external

Zapobieganie przeuczeniu jest ważnym aspektem uczenia maszynowego. W kontekście strukturalnego ryzyka minimalizacji, zapobieganie przeuczeniu może być osiągnięte poprzez włączenie kary regularyzacyjnej do optymalizacji. Kara regularyzacyjna może być implementowana w postaci formy brzytwy Ockhama, która preferuje prostsze funkcje nad bardziej złożonymi.

Popularną karą regularyzacyjną jest kwadrat normy euklidesowej wag, znaną również jako normę L2. Inne normy obejmują normę L1, ∑j|βj|, oraz "normę" L0, która jest liczbą niezerowych βj. Kara regularyzacyjna będzie oznaczona przez C(g).

Problem optymalizacji uczenia się nadzorowanego polega na znalezieniu funkcji g, która minimalizuje J(g) = Remp(g) + λC(g). Parametr λ kontroluje kompromis między obciążeniem a wariancją. Im większa wartość λ, tym model będzie miał wysokie obciążenie i niską wariancję.

Dodatkowo, w kontekście sztucznej inteligencji, regularyzacja jest zbiorem technik, takich jak dropout, wczesne zatrzymywanie oraz regularyzacja L1 i L2, mających na celu zmniejszenie przeuczenia i niedouczenia podczas trenowania algorytmu uczenia się.

student_a59

Jaki rozmiar ma macierz pomyłek

bot_external

Nie mogę znaleźć informacji o rozmiarze macierzy pomyłek w dostępnym kontekście.

student_a59

Jaki rozmiar ma macierz pomyłek zależnie od ilości klas

bot_external

Nie mogę znaleźć informacji o rozmiarze macierzy pomyłek w dostępnym kontekście.

student_a59

Jak obliczyć dokładność modelu UM?

Eduexe Forum

conversation_by_a59