Шта је учење без надзора?
Учење без надзора је врста Машинско учење користи се за идентификацију образаца у скуповима неозначених података. Овај чланак објашњава о чему се ради, укључујући његове примене вештачка интелигенција (АИ).
Како функционише машинско учење без надзора?
Учење без надзора алгоритми пронађите обрасце у великим несортираним скуповима података без људског вођења или надзора. Они могу да групишу тачке података унутар огромних скупова, омогућавајући им да извуку увид брже и ефикасније од било ког научника који се бави људским подацима.
Процес учења је потпуно аутоматизован када се алгоритам унесе неструктурираним подацима. У идеалном случају, ови алгоритми ће се побољшати у категоризацији у реалном времену како успостављају нове односе између тачака података (или улаза).
На пример, алгоритам за учење без надзора датим сликама различитих облика може почети да сортира сваки облик према његовој величини и боји. Затим, алгоритам може постати конкретнији класификовањем облика на основу њиховог броја страна.
Примене ненадгледаног учења
Учење без надзора је било од помоћи у многим областима АИ, укључујући:
- Циберсецурити: Откривање и пресретање сајбер напада пре него што се догоде.
- Компјутерски вид: Препознавање објеката на сликама, видео снимцима и стварном животу.
-
Откривање преваре: Означавање сумњивих докумената или финансијских трансакција.
- Здравствена заштита: Дијагностиковање болести и развој лекова.
- Маркетинг: Циљање огласа на клијенте на основу њихових преференција.
- Агрегација вести: Сортирање вести на основу теме, региона и интересовања.
-
Гаранција квалитета: Идентификовање абнормалности и одступања у опреми и производима.
Надгледани вс. Учење без надзора
Ненадгледано учење се често користи са учење под надзором, који се ослања на податке о обуци које је означио човек. У надгледаном учењу, човек одлучује о критеријумима сортирања и резултатима алгоритма. Ово људима даје већу контролу над врстама информација које желе да извуку из великих скупова података. Међутим, надгледано учење захтева више људског времена и стручности.
Приступ без надзора је прикладан када имате велику количину неорганизованих података. Уз учење без надзора, нико не треба ништа да анализира или етикетира. Дакле, учење без надзора кошта мање од учења под надзором јер захтева мање људског рада.
Полу-надгледани алгоритми за учење комбинују оба приступа упоређивањем означених и неозначених података у почетном скупу за обуку.
Ограничења ненадгледаног учења
Резултати учења без надзора могу бити непредвидиви, а понекад чак и бескорисни. Ако алгоритам постане превише специфичан, могао би створити превише категорија, што отежава људима да извуку значајне увиде из резултата. Са друге стране, ако је алгоритам превише уопштен, биће премало категорија.
Може бити тешко проверити тачност пошто су сви подаци неозначени, а може бити тешко одредити како тачно алгоритми учења без надзора доносе своје одлуке. Учење без надзора захтева више рачунарске снаге и времена, али је и даље јефтиније од учења под надзором јер није потребно људско учешће.
Врсте алгоритама за учење без надзора
Многи алгоритми учења без надзора засновани су на кластер анализи, или груписању, што укључује груписање објеката на основу њихових сличности и разлика. Неке од метода које алгоритми учења без надзора користе укључују:
- Ексклузивно груписање: Свака тачка података може припадати само једном кластеру или групи (нпр. К-значи груписање).
- Груписање преклапања: Тачке података могу бити део више кластера са различитим нивоима повезаности.
- Агломеративно груписање: Тачке података су раздвојене у групе и спојене у један кластер.
- Пробабилистичко груписање: Тачке података су груписане на основу дистрибуције вероватноће.
- Априори алгоритми: Тачке података које се често појављују се користе за предвиђање и препоруке.
- Смањење димензионалности: Вишак података је елиминисан да би се скуп података смањио на величину којом се може управљати.
- Аутоенцодинг: А неуронске мреже користи се за компресију и различито представљање истих података.
ФАК
-
Шта је К кластерисање?
К кластерисање, које се често назива кластерисањем К-средстава, је када су подаци организовани на основу сличности и на основу тога како се кластери разликују један од другог. К се користи за представљање броја кластера.
-
Шта је хијерархијско груписање?
Ово је метод прикупљања информација о информацијама. Дакле, када се подаци прикупе, онда се сортирају у сличне групе и затим, коначно, организују у секције и пододељке. Неки од фискално одговорнијих међу нама то већ раде тако што своју потрошњу групишу у склониште, кућу и превоз. Али када се још више групишете, видећете да би транспорт могао бити додатно груписан у масовни превоз, наш аутомобил итд. А онда, испод аутомобила, можда имате одржавање, гориво, чишћење и тако даље. Рачунари то раде у далеко већим размерама и много различитих скупова података, а обично не о томе колико латтеа конзумира пре 10:30 ујутру.