conversation_by_hfw
-
Jakie są podstawowe pojęcia w uczeniu maszynowym?
Podstawowe pojęcia w uczeniu maszynowym to:
- Zbiór uczący (treningowy) - dane, dla których model zna poprawne odpowiedzi i na których jest trenowany.
- Zbiór testowy - dane, z którymi model nie miał do czynienia w procesie uczenia się i nie zna dla nich poprawnych odpowiedzi, wykorzystywane do przetestowania, jak dobrze model jest wytrenowany.
- Epoka - pojedyncze przejście modelu przez cały zbiór uczący w procesie trenowania.
- Wsad - porcja przykładów, które model przetwarza jednocześnie.
- Współczynnik uczenia się - parametr modelu, który określa, jak duże kroki w kierunku poprawnego rozwiązania po każdej nowej ekspozycji na dane model będzie wykonywał.
- Funkcja straty - funkcja określająca stopień wytrenowania modelu, którą staramy się minimalizować.
- Przeuczenie - stan, w którym model za bardzo dopasował się do konkretnego zbioru uczącego (można powiedzieć, że zapamiętał poprawne odpowiedzi) i w efekcie nie radzi sobie z poprawną klasyfikacją w zbiorze testowym.
- Niedouczenie - stan, w którym model ze względu na przykład na zbyt małą wielkość zbioru uczącego lub zbyt krótki czas treningu nie dał rady wykryć prawidłowości w danych, na podstawie których byłby w stanie dokonywać prawidłowej klasyfikacji.
- Macierz pomyłek - macierz przygotowywana dla zbioru testowego, z której odczytujemy, ile przykładów testowych z poszczególnych klas zostało sklasyfikowanych przez model poprawnie, a ile błędnie.
-
Gdzie w macierzy pomyłek znajdują się wartości false positive i false negative?
-
Gdzie w macierzy pomyłek znajdują się wartości false positive i false negative?
W macierzy pomyłek wartości false positive i false negative znajdują się w następujących miejscach:
- False positive (FP) - w kolumnie "Prawdziwie pozytywny" (TP) nie ma wartości, ale w kolumnie "Fałszywie pozytywny" (FP) znajduje się liczba przykładów, które zostały sklasyfikowane jako pozytywne, ale w rzeczywistości są negatywnymi przykładami.
- False negative (FN) - w kolumnie "Prawdziwie negatywny" (TN) nie ma wartości, ale w kolumnie "Fałszywie negatywny" (FN) znajduje się liczba przykładów, które zostały sklasyfikowane jako negatywne, ale w rzeczywistości są pozytywnymi przykładami.
Przykładowo, jeśli macierz pomyłek wygląda tak:
Prawdziwie pozytywny (TP) Fałszywie pozytywny (FP) Prawdziwie negatywny (TN) Fałszywie negatywny (FN) Prawdziwie pozytywny (TP) 10 2 0 0 Fałszywie pozytywny (FP) 0 5 0 0 Prawdziwie negatywny (TN) 0 0 15 0 Fałszywie negatywny (FN) 0 0 0 3 W tym przykładzie, wartości false positive (FP) to 5 (w kolumnie "Fałszywie pozytywny" (FP)), a wartości false negative (FN) to 3 (w kolumnie "Fałszywie negatywny" (FN)).
-
Jak należy przygotować dane do uczenia maszynowego?
-
Jak należy przygotować dane do uczenia maszynowego?
Przygotowanie danych do uczenia maszynowego jest bardzo ważne, ponieważ może znacznie wpłynąć na jakość modelu. Oto kilka kroków, które należy wykonać:
- Zbieranie danych: Zbierz dane, które będą używane do uczenia modelu. Dane powinny być reprezentatywne dla problemu, który chcesz rozwiązać.
- Przygotowanie danych: Dane powinny być przygotowane do uczenia modelu. Oznacza to, że należy usunąć brakujące wartości, usunąć duplikaty, a także przekształcić dane w postać, w której mogą być używane przez model.
- Podział danych: Dane powinny być podzielone na zbiór uczący (treningowy) i zbiór testowy. Zbiór uczący powinien zawierać większość danych, a zbiór testowy powinien zawierać mniejszą liczbę danych.
- Weryfikacja danych: Dane powinny być weryfikowane, aby upewnić się, że są one poprawne i nie zawierają błędów.
Dodatkowo, należy pamiętać o tym, że dane powinny być:
- Wiarygodne: Dane powinny być wiarygodne i nie zawierać błędów.
- Reprezentatywne: Dane powinny być reprezentatywne dla problemu, który chcesz rozwiązać.
- Wielowymiarowe: Dane powinny być wielowymiarowe, aby model mógł je zrozumieć.
Jeśli dane nie są przygotowane poprawnie, model może nie działać poprawnie, a nawet mogą powstać błędy w wynikach.
-
Jakie są ograniczenia Google Teachable Machine?
-
Jakie są ograniczenia Google Teachable Machine?
Ograniczenia Google Teachable Machine to:
- Nie można ręcznie zmienić proporcji danych w zbiór uczący i zbiór testowy, która jest automatycznie ustalana w proporcji 85:15.
- Zbiór testowy musi być jakościowo reprezentatywny dla całości danych, co oznacza, że muszą znajdować się w nim podobne przykłady, co w zbiorze uczącym.
- Zbiór testowy musi być wystarczająco duży, aby można było ocenić, czy model poprawnie (lub błędnie) sklasyfikował przykłady.
Dodatkowo, w jednym z poprzednich fragmentów tekstu, opisano, że w Uczeniu Maszynowym spotyka się także inne proporcje danych w zbiór uczący i zbiór testowy, takie jak 20% lub 10% danych w zbiór testowy, ale nie ma informacji, czy Google Teachable Machine obsługuje te proporcje.
-
-
Jaka jest definicja uczenia maszynowego>
-
Jaka jest definicja uczenia maszynowego>
Definicja uczenia maszynowego to:
"Uczenie Maszynowe (UM, ang. Machine Learning - ML) - obszar Sztucznej Inteligencji (ang. Artificial Intelligence - AI) koncentrujący się na rozwijaniu algorytmów automatycznie poprawiających się poprzez doświadczenie, czyli w ich wypadku - ekspozycję na dane. Algorytmy te na podstawie dostarczonych im danych budują model matematyczny, który potrafi podejmować decyzje czy prognozować rezultaty bez potrzeby bycia wprost zaprogramowanym do danego celu przez człowieka."