Co to jest nadzorowane uczenie się?

click fraud protection

Uczenie nadzorowane jest rodzajem nauczanie maszynowe który używa oznaczonych zestawów danych do uczenia sztuczna inteligencja (AI). Oto, na czym polega nadzorowane uczenie się, jak działa i jakie ma zastosowania.

Jak działa nadzorowane uczenie się?

W uczeniu nadzorowanym sztuczna inteligencja algorytm jest zasilany danymi treningowymi (wejścia) z wyraźnymi etykietami (wyjścia). Na podstawie zestawu szkoleniowego sztuczna inteligencja uczy się, jak oznaczać przyszłe dane wejściowe nieoznakowanych danych. Idealnie byłoby, gdyby algorytm poprawiał swoją dokładność, gdy uczy się na podstawie wcześniejszych doświadczeń.

Gdybyś chciał wytrenować algorytm sztucznej inteligencji do klasyfikowania kształtów, pokazałbyś mu przykłady dokładnie oznaczonych kształtów wraz z instrukcjami wyjaśnienie znaczenia każdej etykiety (na przykład „kształt, który ma trzy boki, to trójkąt” lub „kształt, który ma cztery boki, to trójkąt kwadrat.")

Po dostarczeniu danych treningowych można przetestować algorytm, pokazując mu kształty bez etykiet. Następnie sztuczna inteligencja wykorzysta swoją wiedzę z zestawu szkoleniowego, aby przypisać odpowiednie etykiety/wyjścia do każdego kształtu.


Zastosowania nadzorowanego uczenia się

Uczenie nadzorowane służy do szkolenia algorytmów sztucznej inteligencji w celu wykonywania wielu zadań, w tym:

  • Rozpoznawanie obrazu: Rozpoznawanie obiektów lub osób na filmach i obrazach.
  • Rozpoznawanie mowy: Dopasowywanie głosów do osób i tłumaczenie dźwięku na tekst.
  • Rozpoznawanie pisma odręcznego: Tłumaczenie odręcznych listów na tekst cyfrowy.
  • Wykrywanie spamu: Filtrowanie wiadomości e-mail i wiadomości tekstowych, które wyglądają jak spam.
  • Wykrywanie oszustw: Oznaczanie nieprawidłowych transakcji finansowych.
  • Mapowanie geograficzne: Klasyfikacja formacji terenu na podstawie zdjęć satelitarnych.
  • Kategoryzacja wiadomości: Sortowanie wiadomości na podstawie tematu lub regionu.
  • Marketing: kierowanie reklam na podstawie danych demograficznych użytkowników (wiek, lokalizacja itp.)
  • Analityka predykcyjna: Podejmowanie decyzji finansowych w oparciu o pożądane wyniki.

Ograniczenia nadzorowanego uczenia się

Aby odpowiednio wyszkolić algorytm uczenia nadzorowanego, potrzebujesz wielu dokładnie oznaczonych danych. Zestaw danych treningowych musi być również wystarczająco zróżnicowany, aby algorytm mógł zidentyfikować niewielkie odchylenia wzorców.

Jedną z zalet nadzorowanego uczenia się jest to, że może być bardzo dokładne, ale wysoka dokładność nie zawsze jest dobra. To dlatego, że może to wskazywać na nadmierne dopasowanie, czyli gdy dane treningowe i testowe są zbyt podobne. Podczas testowania algorytmu dane testowe powinny różnić się na tyle od zbioru uczącego, aby mieć pewność, że będzie działać w rzeczywistych warunkach.

Nadzorowany vs. Uczenie się bez nadzoru

Dane treningowe nie są oznaczone w nauka bez nadzoru, więc sztuczna inteligencja musi identyfikować wzorce i tworzyć własne etykiety. W uczeniu częściowo nadzorowanym część danych wejściowych jest już oznaczona.

Uczenie nadzorowane może być czasochłonne, ponieważ wymaga od człowieka lub nadzorcy oznaczenia wszystkich danych w zbiorze uczącym. Przełożony musi również przetestować algorytm pod kątem dokładności. Wprowadza to możliwość wystąpienia błędu ludzkiego, więc osoba oznaczająca dane szkoleniowe musi być ekspertem ds. danych.

W przeciwieństwie do uczenia bez nadzoru, algorytmy uczenia nadzorowanego nie mogą niezależnie klasyfikować danych. Tak więc, jeśli algorytm uczenia nadzorowanego przeszkolony w rozpoznawaniu trójkątów i kwadratów zostanie przedstawiony za pomocą sześciokąta, nie będzie w stanie go oznaczyć. Gdyby był to algorytm nienadzorowany, zidentyfikowałby sześciokąt jako ani trójkąt, ani kwadrat i utworzyłby nową kategorię.

Nadzorowany vs. Uczenie się bez nadzoru: jaka jest różnica?

Rodzaje algorytmów uczenia nadzorowanego

Algorytmy uczenia nadzorowanego można podzielić na dwa typy:

  • Klasyfikacja: W algorytmach klasyfikacji wyjściem jest kategoria. Algorytmy te są idealne do klasyfikacji binarnych, takich jak decydowanie, czy wiadomość e-mail jest spamem, ale można ich używać do bardziej skomplikowanego sortowania, na przykład organizowania listy leków według klas.
  • Regresja:W algorytmach regresji wynikiem jest wartość liczbowa. Algorytmy te dokonują prognoz, takich jak zgadywanie wartości nieruchomości na podstawie kodu pocztowego lub prognozowanie temperatury na podstawie pory dnia.

W ramach tych dwóch kategorii znajduje się kilka popularnych algorytmów uczenia nadzorowanego, takich jak regresja liniowa, regresja logistyczna i naiwne klasyfikatory Bayesa. Niektóre algorytmy, takie jak maszyny wektorów nośnych (SVM) i lasy losowe, łączą elementy klasyfikacji i regresji.

Algorytmy uczenia nadzorowanego można łączyć z sieci neuronowe ponownej oceny własnych wyników i dostrojenia się.

Często zadawane pytania

  • Co to jest uczenie się samonadzorowane?

    Samonadzorowane uczenie się jest podobne do nadzorowanego uczenia się, ponieważ algorytm wykorzystuje wcześniejsze przykłady do identyfikowania nowych danych. Różnica polega na tym, że w samonadzorowanym uczeniu się ludzie nie nadają etykiet. Różni się to jednak od uczenia się bez nadzoru, ponieważ późniejsze etapy samonadzorowanego programu szkoleniowego mogą obejmować pewne nadzorowane zadania.

  • Kiedy używasz nadzoru nadzorowanego vs. nauka bez nadzoru?

    Uczenie nadzorowane jest najbardziej przydatne, gdy masz obiekty, których rozpoznawania zdecydowanie chcesz nauczyć program. Na przykład programiści autonomicznych samochodów naprawdę chcą, aby pojazdy znały znak stopu, gdy go zobaczą. Zastosowanie uczenia się bez nadzoru służy bardziej budowaniu zrozumienia określonej dziedziny (np. Fizyki).