conversation_by_6yg

bot_external

Model uczenia maszynowego to rodzaj modelu matematycznego, który po "nauczeniu" się na danym zbiorze danych może być wykorzystywany do dokonywania przewidywań lub klasyfikacji na nowych danych. Dodatkowo, termin "model" może odnosić się do kilku poziomów szczegółowości, od ogólnej klasy modeli i związanych z nimi algorytmów uczenia, po w pełni wytrenowany model z wszystkimi dostrojonymi parametrami wewnętrznymi.

student_6yg

Co to jest zbiór uczący?

bot_external

Zbiór uczący (inaczej treningowy, ang. train set) - to dane, dla których model zna poprawne odpowiedzi i na których jest trenowany. Przykładem zbiór uczący może być zbiór zdjęć kanarków podpisanych jako kanarki oraz zbiór zdjęć wróbli podpisanych jako wróble.

student_6yg

Czym jest funkcja kosztu?

student_6yg

Jakie są główne zastosowania ML?

bot_external

Główne zastosowania ML to:

Przetwarzanie języka naturalnego
Widzenie komputerowe
Rozpoznawanie mowy
Filtrowanie poczty elektronicznej
Rolnictwo
Medycyna
Analityka predykcyjna (zastosowanie ML do rozwiązywania problemów biznesowych)

Informacje te znajdują się w treści kursu, w sekcji "Machine learning - Introduction".

student_6yg

Czym różni się zbiór testowy od walidacyjnego?

student_6yg

Czym różni się zbiór testowy od walidacyjnego?

bot_external

Zbiór testowy i zbiór walidacyjny są często mylone, ale mają różne cele i znaczenie w procesie uczenia maszynowego.

Zbiór testowy (ang. test set) to zbiór danych, których model nie wykorzystał w procesie uczenia się i nie zna dla nich poprawnych odpowiedzi. Jest on używany do przetestowania, jak dobrze model jest wytrenowany, a jego wyniki są miarą jego skuteczności.

Zbiór walidacyjny (ang. validation set) to zbiór danych, który jest używany do dostrajania hiperparametrów modelu i oceny jego wydajności. Jest on używany do porównywania wyników różnych modeli i wybierania najlepszego.

Warto zauważyć, że zbiór testowy powinien być niezależny od zbioru treningowego i walidacyjnego, aby uniknąć przeuczenia. Zbiór walidacyjny powinien być używany tylko do dostrajania hiperparametrów i oceny wydajności modelu, a nie do trenowania modelu.

Przykładem może być następująca sytuacja: mamy zbiór zdjęć ptaków, z których 80% to zdjęcia kanarków i 20% to zdjęcia wróbli. Zbiór treningowy może zawierać 60% zdjęć kanarków i 40% zdjęć wróbli, zbiór walidacyjny może zawierać 10% zdjęć kanarków i 90% zdjęć wróbli, a zbiór testowy może zawierać 10% zdjęć kanarków i 90% zdjęć wróbli. W tym przypadku zbiór walidacyjny jest używany do dostrajania hiperparametrów modelu, a zbiór testowy jest używany do przetestowania jego wydajności.

student_6yg

Co to jest precision, recall i F1-score?

bot_external

Precision, recall i F1-score to miary używane w klasyfikacji binarnej do oceny skuteczności modelu.

Precision (precyzja) to miara, która określa, jak często model poprawnie przewiduje klasę pozytywną. Jest to stosunek liczby prawidłowych przewidywań pozytywnych (TP) do liczby wszystkich przewidywań pozytywnych (TP + FP), czyli:

Precision = TP / (TP + FP)

Recall (czułość) to miara, która określa, jak często model poprawnie przewiduje klasę pozytywną, w porównaniu z wszystkimi rzeczywistymi przypadkami pozytywnymi. Jest to stosunek liczby prawidłowych przewidywań pozytywnych (TP) do liczby wszystkich rzeczywistych przypadków pozytywnych (TP + FN), czyli:

Recall = TP / (TP + FN)

F1-score to miara, która łączy precyzję i czułość. Jest to średnia harmoniczna precyzji i czułości, czyli:

F1-score = 2 * (Precision * Recall) / (Precision + Recall)

F1-score jest również znany jako wynik F1. Jest to szczególny przypadek ogólnej miary Fβ, gdzie β = 1.

Warto zauważyć, że F1-score jest wklęsły względem wskaźnika prawdziwie pozytywnych (TPR), co oznacza, że im wyższy F1-score, tym niższy TPR.

student_6yg

Jak podzielić dane na treningowe i testowe?

student_6yg

Jak podzielić dane na treningowe i testowe?

student_6yg

Jak podzielić dane na treningowe i testowe?

Eduexe Forum

conversation_by_6yg