Co to jest uczenie maszynowe?

click fraud protection

Uczenie maszynowe to coraz bardziej powszechna technologia komputerowa, która umożliwia algorytmom analizowanie, kategoryzowanie i dokonywanie prognoz przy użyciu dużych zbiorów danych. Uczenie maszynowe jest mniej złożone i mniej wydajne niż technologie pokrewne, ale ma wiele zastosowań i jest stosowane przez wiele dużych firm na całym świecie.

Co to jest uczenie maszynowe (ML)?

Uczenie maszynowe ma pomóc komputerom uczyć się w sposób podobny do tego, w jaki uczy się ludzki mózg. ML wykorzystuje duże zbiory danych i algorytmy (modele) do analizowania i kategoryzowania danych lub tworzenia prognoz. Im częściej model uczenia maszynowego jest używany, tym więcej danych przetwarza, tym lepiej radzi sobie z zadaniami. Modele mogą się poprawiać samodzielnie i mogą być aktualizowane przez ludzi.

W przeciwieństwie do podobnych technologii, takich jak głębokie uczenie się, uczenie maszynowe nie używa sieci neuronowe. Podczas gdy ML jest powiązany z takimi wydarzeniami jak Sztuczna inteligencja), nie jest ani tak zaawansowany, ani tak potężny jak te technologie.

Uczenie maszynowe istnieje w różnych formach od lat 60. XX wieku i jest coraz szerzej stosowane. Około 70% firm świadczących usługi finansowe stosuje w jakiś sposób jakąś formę uczenia maszynowego.

Definicja uczenia maszynowego

Uczenie maszynowe zaczyna się od dwóch elementów: an algorytm i zestaw danych. Algorytm instruuje model ML, co ma robić (analizować obrazy, wykrywać wzorce, przewidywać). Zestaw danych może być lub nie sklasyfikowany lub oznaczone, aby wspomóc algorytm. Następnie algorytm przetwarza dane w celu uzyskania danych wyjściowych.

Im więcej danych przetwarza algorytm, tym dokładniejszy powinien być. Zwykle model dokonuje ulepszeń w oparciu o wbudowaną logikę, ale ludzie mogą również aktualizować algorytm lub wprowadzać inne zmiany w celu poprawy jakości danych wyjściowych.

To właśnie oznacza „uczenie się”. Ludzie uczą się podstawowych pojęć lub umiejętności, a następnie doskonalą się poprzez powtarzanie i ekstrapolację. Taki jest też cel ML. Tradycyjne programy komputerowe są zaprojektowane do wykonywania określonej funkcji, ale funkcje te są stosunkowo ograniczone i mogą się zmienić tylko wtedy, gdy zmieni je programista. Dzięki ML model jest zaprojektowany tak, aby sam się zmieniał w oparciu o doświadczenie z większą liczbą danych i zadań.

Na przykład algorytm wykrywania obrazu może analizować zdjęcia przedstawiające osobę z rudymi włosami. Przy pierwszym użyciu modelu jego dane wyjściowe będą mniej dokładne niż za drugim razem, a za trzecim razem będą dokładniejsze. To ulepszenie ma miejsce, ponieważ model rozwija lepsze techniki odróżniania człowieka od drzewa lub krowy oraz odróżniania włosów rudych od włosów blond.

Cztery rodzaje pochylenia maszynowego

Chociaż w każdej kategorii istnieją podtypy, cztery podstawowe typy uczenia maszynowego to:

  • Nadzorowana ML: Wykorzystuje to oznaczone, ustrukturyzowane dane i najbardziej ludzką interwencję w celu znalezienia wzorców, których szuka twórca modelu. Najlepiej nadaje się do stosunkowo prostych zadań, które można zautomatyzować, z łatwymi do zdefiniowania i zrozumiałymi regułami oraz tam, gdzie dostępnych jest dużo danych.
  • Uczenie maszynowe bez nadzoru: W przeciwieństwie do nadzorowanego uczenia maszynowego nie są dostępne żadne oznaczone ani ustrukturyzowane dane. Zamiast tego model wykrywa wzorce i wyciąga wnioski na podstawie danych, w tym rzeczy, których twórca modelu nie szuka. Służy do wykrywania wzorców i klasyfikacji (np. grupowania klientów na podstawie zachowania), a następnie podejmowania działań w oparciu o te wzorce.
  • Częściowo nadzorowana ML: Łączy dwa powyższe typy, początkowo ucząc model z danymi z etykietami, a następnie przetwarzając dane bez etykiet. Częściowo nadzorowana ML jest pomocna, gdy nie ma wystarczającej ilości danych z etykietami lub generowanie tych danych jest niepraktyczne.
  • Wzmocnienie: Ten typ uczenia maszynowego opiera się na nagrodach lub pozytywnych informacjach zwrotnych i najlepiej sprawdza się w systemach, w których można łatwo zdefiniować dobre/złe odpowiedzi i w których istnieje najlepsze działanie w danej sprawie. Modele ML, które grają w gry takie jak szachy, są często modelami wzmacniającymi.

Typowe zastosowania uczenia maszynowego

Aplikacje uczenia maszynowego, z którymi spotkało się wiele osób, obejmują następujące typowe zastosowania:

  • Algorytmy rekomendacji: funkcje wykrywania wzorców i kategoryzacji modeli ML leżą u podstaw algorytmów rekomendujących treści lub produkty.
  • Rozpoznawanie mowy: ML jest używany w oprogramowaniu przetwarzającym tekst na mowę i aplikacjach do przetwarzania języka naturalnego.
  • Chatboty: Chatboty wykorzystywane do sprzedaży i obsługi klienta, zwłaszcza te, które są stosunkowo prostymi drzewami decyzyjnymi, często bazują na ML.
  • Wizja komputerowa: Zapewnienie komputerom możliwości „widzenia” i rozumienia obrazów — w przypadku rzeczy tak złożonych, jak autonomiczne pojazdy lub tak prostych, jak analiza zdjęć — opiera się na uczeniu maszynowym.
  • Wykrywanie oszustw i ochrona przed spamem: Wykrywanie wzorców pomaga firmom świadczącym usługi finansowe oznaczać potencjalnie nieuczciwe transakcje i pozwala Twojemu kontu e-mail usuwać spam ze skrzynki odbiorczej.

Obszary zainteresowania związane z uczeniem maszynowym

Chociaż uczenie maszynowe jest potężne i szeroko stosowane, spotkało się również z krytyką za takie kwestie, jak:

  • Prywatność: Ponieważ modele ML wymagają dużych ilości danych, istnieje szansa, że ​​ML może przetwarzać poufne dane osobowe. W niektórych przypadkach wykorzystanie tych danych mogło nie zostać autoryzowane lub w pełni zrozumiane przez osoby fizyczne. W rezultacie ML może wykorzystywać lub ujawniać poufne informacje.
  • Brak przejrzystości: Ze względu na ich zdolność uczenia się zrozumienie każdego kroku, który doprowadził model do wniosku lub zalecenia, może być bardzo trudne — czasem wręcz niemożliwe. To ograniczenie bardzo utrudnia regulację, aby upewnić się, że nie naruszają przepisów (takich jak sprawiedliwe warunki mieszkaniowe lub przepisy dotyczące pożyczek).
  • Uprzedzenia i dyskryminacja: Stronniczość (świadoma lub nieświadoma) ze strony twórców modelu lub w danych wykorzystywanych do trenowania modelu będzie miała wpływ na sposób uczenia się modelu i jego wyniki. Tak więc, o ile szczególna uwaga nie zostanie zwrócona na korygowanie błędu systematycznego, modele ML mogą nieumyślnie wzmacniać błąd systematyczny. Dobrym przykładem jest to, że systemy rozpoznawania twarzy są dokładniejsze w przypadku niektórych odcieni skóry niż inne w oparciu o dane użyte do ich szkolenia i rasę, do której należą twórcy modeli. Może to prowadzić na przykład do poważnych problemów w egzekwowaniu prawa.
Uczenie maszynowe vs. Głębokie uczenie się: jaka jest różnica?
Co to jest uczenie się przez wzmacnianie?

Często zadawane pytania

  • Czym jest nadmierne dopasowanie w uczeniu maszynowym?

    Nadmierne dopasowanie to błąd związany z danymi wyjściowymi programu uczenia maszynowego. Ogólnie oznacza to, że dane wyjściowe zbyt bardzo przypominają (pasują) dane treningowe, co sugeruje, że algorytm nie dokonuje wnioskowania ani ekstrapolacji, jak powinien, i dlatego nie jest użyteczny wyniki.

  • Czym jest walidacja krzyżowa w uczeniu maszynowym?

    Walidacja krzyżowa to metoda testowania modelu uczenia maszynowego; programiści zwykle używają go do walki z nadmiernym dopasowaniem. Jedna wersja walidacji krzyżowej polega na podziale oryginalnego zestawu danych na mniejsze części. Niektóre są powstrzymywane, podczas gdy inne przebiegają przez model. Następnie porównujesz grupy „kontrolne” z grupami „testowymi” pod kątem działania algorytmu.