conversation_by_hfw

bot_external

Podstawowe pojęcia w uczeniu maszynowym to:

Zbiór uczący (treningowy) - dane, dla których model zna poprawne odpowiedzi i na których jest trenowany.
Zbiór testowy - dane, z którymi model nie miał do czynienia w procesie uczenia się i nie zna dla nich poprawnych odpowiedzi, wykorzystywane do przetestowania, jak dobrze model jest wytrenowany.
Epoka - pojedyncze przejście modelu przez cały zbiór uczący w procesie trenowania.
Wsad - porcja przykładów, które model przetwarza jednocześnie.
Współczynnik uczenia się - parametr modelu, który określa, jak duże kroki w kierunku poprawnego rozwiązania po każdej nowej ekspozycji na dane model będzie wykonywał.
Funkcja straty - funkcja określająca stopień wytrenowania modelu, którą staramy się minimalizować.
Przeuczenie - stan, w którym model za bardzo dopasował się do konkretnego zbioru uczącego (można powiedzieć, że zapamiętał poprawne odpowiedzi) i w efekcie nie radzi sobie z poprawną klasyfikacją w zbiorze testowym.
Niedouczenie - stan, w którym model ze względu na przykład na zbyt małą wielkość zbioru uczącego lub zbyt krótki czas treningu nie dał rady wykryć prawidłowości w danych, na podstawie których byłby w stanie dokonywać prawidłowej klasyfikacji.
Macierz pomyłek - macierz przygotowywana dla zbioru testowego, z której odczytujemy, ile przykładów testowych z poszczególnych klas zostało sklasyfikowanych przez model poprawnie, a ile błędnie.

student_hfw

Gdzie w macierzy pomyłek znajdują się wartości false positive i false negative?

bot_external

W macierzy pomyłek wartości false positive i false negative znajdują się w następujących miejscach:

False positive (FP) - w kolumnie "Prawdziwie pozytywny" (TP) nie ma wartości, ale w kolumnie "Fałszywie pozytywny" (FP) znajduje się liczba przykładów, które zostały sklasyfikowane jako pozytywne, ale w rzeczywistości są negatywnymi przykładami.
False negative (FN) - w kolumnie "Prawdziwie negatywny" (TN) nie ma wartości, ale w kolumnie "Fałszywie negatywny" (FN) znajduje się liczba przykładów, które zostały sklasyfikowane jako negatywne, ale w rzeczywistości są pozytywnymi przykładami.

Przykładowo, jeśli macierz pomyłek wygląda tak:

	Prawdziwie pozytywny (TP)	Fałszywie pozytywny (FP)	Prawdziwie negatywny (TN)	Fałszywie negatywny (FN)
Prawdziwie pozytywny (TP)	10	2	0	0
Fałszywie pozytywny (FP)	0	5	0	0
Prawdziwie negatywny (TN)	0	0	15	0
Fałszywie negatywny (FN)	0	0	0	3

W tym przykładzie, wartości false positive (FP) to 5 (w kolumnie "Fałszywie pozytywny" (FP)), a wartości false negative (FN) to 3 (w kolumnie "Fałszywie negatywny" (FN)).

student_hfw

Jak należy przygotować dane do uczenia maszynowego?

bot_external

Przygotowanie danych do uczenia maszynowego jest bardzo ważne, ponieważ może znacznie wpłynąć na jakość modelu. Oto kilka kroków, które należy wykonać:

Zbieranie danych: Zbierz dane, które będą używane do uczenia modelu. Dane powinny być reprezentatywne dla problemu, który chcesz rozwiązać.
Przygotowanie danych: Dane powinny być przygotowane do uczenia modelu. Oznacza to, że należy usunąć brakujące wartości, usunąć duplikaty, a także przekształcić dane w postać, w której mogą być używane przez model.
Podział danych: Dane powinny być podzielone na zbiór uczący (treningowy) i zbiór testowy. Zbiór uczący powinien zawierać większość danych, a zbiór testowy powinien zawierać mniejszą liczbę danych.
Weryfikacja danych: Dane powinny być weryfikowane, aby upewnić się, że są one poprawne i nie zawierają błędów.

Dodatkowo, należy pamiętać o tym, że dane powinny być:

Wiarygodne: Dane powinny być wiarygodne i nie zawierać błędów.
Reprezentatywne: Dane powinny być reprezentatywne dla problemu, który chcesz rozwiązać.
Wielowymiarowe: Dane powinny być wielowymiarowe, aby model mógł je zrozumieć.

Jeśli dane nie są przygotowane poprawnie, model może nie działać poprawnie, a nawet mogą powstać błędy w wynikach.

student_hfw

Jakie są ograniczenia Google Teachable Machine?

bot_external

Ograniczenia Google Teachable Machine to:

Nie można ręcznie zmienić proporcji danych w zbiór uczący i zbiór testowy, która jest automatycznie ustalana w proporcji 85:15.
Zbiór testowy musi być jakościowo reprezentatywny dla całości danych, co oznacza, że muszą znajdować się w nim podobne przykłady, co w zbiorze uczącym.
Zbiór testowy musi być wystarczająco duży, aby można było ocenić, czy model poprawnie (lub błędnie) sklasyfikował przykłady.

Dodatkowo, w jednym z poprzednich fragmentów tekstu, opisano, że w Uczeniu Maszynowym spotyka się także inne proporcje danych w zbiór uczący i zbiór testowy, takie jak 20% lub 10% danych w zbiór testowy, ale nie ma informacji, czy Google Teachable Machine obsługuje te proporcje.

eduexe.admin

student_hfw

Jaka jest definicja uczenia maszynowego>

bot_external

Definicja uczenia maszynowego to:

"Uczenie Maszynowe (UM, ang. Machine Learning - ML) - obszar Sztucznej Inteligencji (ang. Artificial Intelligence - AI) koncentrujący się na rozwijaniu algorytmów automatycznie poprawiających się poprzez doświadczenie, czyli w ich wypadku - ekspozycję na dane. Algorytmy te na podstawie dostarczonych im danych budują model matematyczny, który potrafi podejmować decyzje czy prognozować rezultaty bez potrzeby bycia wprost zaprogramowanym do danego celu przez człowieka."

Eduexe Forum

conversation_by_hfw