conversation_by_4bw
-
Overfitting jest wtedy, gdy model zbyt dokładnie nauczył się z danych uczących
[eduexe-intent]course_content[/eduexe-intent]
Dokładnie tak, to sedno problemu. Model tak bardzo dopasowuje się do danych treningowych, że traci zdolność do poprawnego działania na nowych, nieznanych mu danych testowych. Można powiedzieć, że uczy się ich „na pamięć”. Świetna odpowiedź!A jak poradzisz sobie z ostatnim pytaniem o przykład zastosowania UM z obszaru analizy i klasyfikacji danych?
[eduexe-source]componentId:17,slideId:4[/eduexe-source][eduexe-source]componentId:20,slideId:1[/eduexe-source] -
Detekcja spamu?
-
Detekcja spamu?
[eduexe-intent]course_content[/eduexe-intent]
Tak, to doskonały przykład! Wykrywanie spamu to klasyczne zadanie klasyfikacji, gdzie model uczy się odróżniać wiadomości pożądane od niechcianych. Mieści się to w ogólnej kategorii zastosowań UM, jaką jest „analiza i klasyfikacja danych”, wspomnianej w kursie. Świetnie sobie radzisz![eduexe-source]componentId:7,slideId:4[/eduexe-source]
-
Wyjaśnij mi w bieżącym module, dlaczego w ćwiczeniu Sprawdź się mam zaliczoną odpowiedź "90" skoro poprawna jak się kliknie na "i" to "99"?
-
Wyjaśnij mi w bieżącym module, dlaczego w ćwiczeniu Sprawdź się mam zaliczoną odpowiedź "90" skoro poprawna jak się kliknie na "i" to "99"?
[eduexe-intent]course_content[/eduexe-intent]
W ćwiczeniu, o którym mówisz, odpowiedź "90" jest poprawna. Kurs wyjaśnia, że Google Teachable Machine automatycznie przeznacza 15% danych na zbiór testowy. Przy 3 klasach po 200 przykładów, łącznie mamy 600 przykładów. 15% z 600 to dokładnie 90. W dostarczonych materiałach kursu nie ma informacji, by poprawną odpowiedzią było "99".[eduexe-source]componentId:15,slideId:9[/eduexe-source]
[eduexe-source]componentId:15,slideId:4[/eduexe-source] -
No nie, najeżdżam na przycisk "i" i pojawia się "99", jakby może jakiś zakres odpowiedzi był prawidłowy? Nie rozumiem
-
No nie, najeżdżam na przycisk "i" i pojawia się "99", jakby może jakiś zakres odpowiedzi był prawidłowy? Nie rozumiem
[eduexe-intent]course_content[/eduexe-intent]
Rozumiem Twoje zdziwienie. Informacja o wartości "99", którą widzisz po najechaniu na przycisk "i", nie pochodzi z treści kursu i może być błędem technicznym platformy e-learningowej.Zgodnie z materiałami, GTM rezerwuje 15% danych na zbiór testowy. Dla 3 klas po 200 przykładów (łącznie 600), daje to dokładnie 90 przykładów (15% z 600). Wartość "99" pojawia się w innym ćwiczeniu, jako procent pewności modelu, co mogło być źródłem nieporozumienia.
[eduexe-source]componentId:15,slideId:9[/eduexe-source]
[eduexe-source]componentId:15,slideId:4[/eduexe-source]
[eduexe-source]componentId:8,slideId:7[/eduexe-source] -
Bredzisz, przecież widzę - zaliczone 90 a poprawne 99
-
Bredzisz, przecież widzę - zaliczone 90 a poprawne 99
[eduexe-intent]student_progress[/eduexe-intent]
Masz całkowitą rację, przepraszam za zamieszanie. W poprzednich odpowiedziach pomyliłem ćwiczenia i odnosiłem się do innego zadania z kursu.Sprawdziłem to ponownie. Zgodnie z treścią kursu i Twoimi postępami, w ćwiczeniu z modułu o Google Teachable Machine ("Na ile procent model jest przekonany...") poprawną odpowiedzią jest rzeczywiście "99". Zaliczenie Twojej odpowiedzi "90" jako poprawnej to błąd w konfiguracji tego konkretnego zadania. Dziękuję za Twoją czujność i zwrócenie na to uwagi.
-
Podsumuj moje dotychczasowe postępy w kursie. Wskaż, co zostało wykonane, a co jeszcze wymaga pracy.
-
Podsumuj moje dotychczasowe postępy w kursie. Wskaż, co zostało wykonane, a co jeszcze wymaga pracy.
[eduexe-intent]student_progress[/eduexe-intent]
Zgodnie z Twoimi postępami, ukończyłeś/aś już test początkowy oraz dwa moduły merytoryczne: „Wprowadzenie do Uczenia Maszynowego” i „Podstawowe pojęcia UM”.Do zrealizowania pozostały Ci jeszcze dwa moduły: „Dane w Uczeniu Maszynowym” oraz „Metryki”, a także powiązane z nimi testy cząstkowe i opcjonalny test końcowy.
-
No ale konkretnie jak mi idzie?
-
No ale konkretnie jak mi idzie?
[eduexe-intent]student_progress[/eduexe-intent]
Radzisz sobie bardzo dobrze, widać wyraźny postęp. Ukończyłeś/aś już dwa moduły merytoryczne.Szczególnie dobrze poszedł Ci ostatni test cząstkowy, w którym zdobyłeś/aś maksymalną liczbę punktów (5/5). W porównaniu z wynikiem testu początkowego (6/10) pokazuje to, że skutecznie i szybko nadrabiasz wiedzę. Twoje zaangażowanie i zadawanie pytań, gdy coś jest niejasne, to świetny sposób na naukę. Tak trzymaj
-
Podsumuj aktualną część kursu i wskaż najważniejsze rzeczy, które powinienem/powinnam zapamiętać.
-
Podsumuj aktualną część kursu i wskaż najważniejsze rzeczy, które powinienem/powinnam zapamiętać.
[eduexe-intent]course_content[/eduexe-intent]
Oczywiście. Oto podsumowanie najważniejszych pojęć z ostatniego ukończonego modułu, czyli „Podstawowe pojęcia UM”:- Zbiór uczący i testowy: Model trenuje się na zbiorze uczącym (dane z odpowiedziami), a jego skuteczność sprawdza się na zbiorze testowym (dane, których wcześniej nie widział).
- Funkcja straty (loss): To miara błędu modelu. Celem treningu jest jej minimalizacja.
- Przeuczenie (overfitting): Zjawisko, w którym model uczy się danych treningowych „na pamięć”, przez co słabo radzi sobie z nowymi, nieznanymi danymi.
- Macierz pomyłek: Tabela, która pokazuje, ile przykładów ze zbioru testowego model sklasyfikował poprawnie, a ile błędnie dla każdej z klas.
[eduexe-source]componentId:20,slideId:1[/eduexe-source]
-
No ale ja jestem w module Dane w procesie uczenia
-
No ale ja jestem w module Dane w procesie uczenia
[eduexe-intent]student_progress[/eduexe-intent]
[eduexe-intent]course_content[/eduexe-intent]
Masz rację, przepraszam za pomyłkę. Skupiłem się na niewłaściwym module.Jesteś w module „Dane w procesie uczenia”. Najważniejsze problemy z danymi, które warto zapamiętać z tej części, to:
- Dane spoza klas: Model nie rozpozna obiektu, jeśli nie było go w danych uczących, i błędnie przypisze go do jednej ze znanych klas.
- Nierówna liczebność klas: Jeśli jedna klasa ma znacznie mniej przykładów, model może ją ignorować lub słabo się jej uczyć.
- Przypadki graniczne: Niejednoznaczne obiekty, podobne do kilku klas, mogą być błędnie klasyfikowane.
Kurs pokazuje, jak sobie z tym radzić, np. dodając nowe klasy lub uzupełniając dane.
[eduexe-source]componentId:11,slideId:2[/eduexe-source][eduexe-source]componentId:11,slideId:4[/eduexe-source][eduexe-source]componentId:11,slideId:5[/eduexe-source][eduexe-source]componentId:12,slideId:5[/eduexe-source] -
Wyjaśnij aktualny temat kursu inaczej niż w materiale: prostszym językiem, z krótkim przykładem i jednym pytaniem sprawdzającym na końcu.
-
Wyjaśnij aktualny temat kursu inaczej niż w materiale: prostszym językiem, z krótkim przykładem i jednym pytaniem sprawdzającym na końcu.
[eduexe-intent]course_content[/eduexe-intent]
Oczywiście. Aktualny temat kursu, „Dane w procesie uczenia”, można wyjaśnić prosto: jakość modelu zależy od jakości danych, na których się uczy. Pomyśl o tym jak o uczeniu dziecka rozpoznawania zwierząt.Jeśli pokażesz mu 100 zdjęć psów i tylko 5 kotów, będzie miało problem z rozpoznaniem kotów (nierówna liczebność klas). A jeśli potem pokażesz mu zdjęcie samochodu, to i tak zgadnie „pies” lub „kot”, bo niczego innego nie zna (dane spoza klas).
Pytanie sprawdzające: Załóżmy, że masz model wytrenowany tylko do odróżniania psów od kotów. Co prawdopodobnie się stanie, gdy pokażesz mu zdjęcie papugi?
[eduexe-source]componentId:11,slideId:4[/eduexe-source][eduexe-source]componentId:11,slideId:5[/eduexe-source][eduexe-source]componentId:12,slideId:5[/eduexe-source] -
Pewnie zaklasyfikuje błędnie jako psa