conversation_by_6yg
-
Co to jest model uczenia maszynowego?
Model uczenia maszynowego to rodzaj modelu matematycznego, który po "nauczeniu" się na danym zbiorze danych może być wykorzystywany do dokonywania przewidywań lub klasyfikacji na nowych danych. Dodatkowo, termin "model" może odnosić się do kilku poziomów szczegółowości, od ogólnej klasy modeli i związanych z nimi algorytmów uczenia, po w pełni wytrenowany model z wszystkimi dostrojonymi parametrami wewnętrznymi.
-
Co to jest zbiór uczący?
-
Co to jest zbiór uczący?
Zbiór uczący (inaczej treningowy, ang. train set) - to dane, dla których model zna poprawne odpowiedzi i na których jest trenowany. Przykładem zbiór uczący może być zbiór zdjęć kanarków podpisanych jako kanarki oraz zbiór zdjęć wróbli podpisanych jako wróble.
-
Czym jest funkcja kosztu?
-
Jakie są główne zastosowania ML?
-
Jakie są główne zastosowania ML?
Główne zastosowania ML to:
- Przetwarzanie języka naturalnego
- Widzenie komputerowe
- Rozpoznawanie mowy
- Filtrowanie poczty elektronicznej
- Rolnictwo
- Medycyna
- Analityka predykcyjna (zastosowanie ML do rozwiązywania problemów biznesowych)
Informacje te znajdują się w treści kursu, w sekcji "Machine learning - Introduction".
-
Czym różni się zbiór testowy od walidacyjnego?
-
Czym różni się zbiór testowy od walidacyjnego?
-
Czym różni się zbiór testowy od walidacyjnego?
Zbiór testowy i zbiór walidacyjny są często mylone, ale mają różne cele i znaczenie w procesie uczenia maszynowego.
Zbiór testowy (ang. test set) to zbiór danych, których model nie wykorzystał w procesie uczenia się i nie zna dla nich poprawnych odpowiedzi. Jest on używany do przetestowania, jak dobrze model jest wytrenowany, a jego wyniki są miarą jego skuteczności.
Zbiór walidacyjny (ang. validation set) to zbiór danych, który jest używany do dostrajania hiperparametrów modelu i oceny jego wydajności. Jest on używany do porównywania wyników różnych modeli i wybierania najlepszego.
Warto zauważyć, że zbiór testowy powinien być niezależny od zbioru treningowego i walidacyjnego, aby uniknąć przeuczenia. Zbiór walidacyjny powinien być używany tylko do dostrajania hiperparametrów i oceny wydajności modelu, a nie do trenowania modelu.
Przykładem może być następująca sytuacja: mamy zbiór zdjęć ptaków, z których 80% to zdjęcia kanarków i 20% to zdjęcia wróbli. Zbiór treningowy może zawierać 60% zdjęć kanarków i 40% zdjęć wróbli, zbiór walidacyjny może zawierać 10% zdjęć kanarków i 90% zdjęć wróbli, a zbiór testowy może zawierać 10% zdjęć kanarków i 90% zdjęć wróbli. W tym przypadku zbiór walidacyjny jest używany do dostrajania hiperparametrów modelu, a zbiór testowy jest używany do przetestowania jego wydajności.
-
Co to jest precision, recall i F1-score?
-
Co to jest precision, recall i F1-score?
Precision, recall i F1-score to miary używane w klasyfikacji binarnej do oceny skuteczności modelu.
Precision (precyzja) to miara, która określa, jak często model poprawnie przewiduje klasę pozytywną. Jest to stosunek liczby prawidłowych przewidywań pozytywnych (TP) do liczby wszystkich przewidywań pozytywnych (TP + FP), czyli:
Precision = TP / (TP + FP)
Recall (czułość) to miara, która określa, jak często model poprawnie przewiduje klasę pozytywną, w porównaniu z wszystkimi rzeczywistymi przypadkami pozytywnymi. Jest to stosunek liczby prawidłowych przewidywań pozytywnych (TP) do liczby wszystkich rzeczywistych przypadków pozytywnych (TP + FN), czyli:
Recall = TP / (TP + FN)
F1-score to miara, która łączy precyzję i czułość. Jest to średnia harmoniczna precyzji i czułości, czyli:
F1-score = 2 * (Precision * Recall) / (Precision + Recall)
F1-score jest również znany jako wynik F1. Jest to szczególny przypadek ogólnej miary Fβ, gdzie β = 1.
Warto zauważyć, że F1-score jest wklęsły względem wskaźnika prawdziwie pozytywnych (TPR), co oznacza, że im wyższy F1-score, tym niższy TPR.
-
Jak podzielić dane na treningowe i testowe?
-
Jak podzielić dane na treningowe i testowe?
-
Jak podzielić dane na treningowe i testowe?