Како функционише Гоогле-ова функција Хум то Сеарцх
Кључне Такеаваис
- Гугл је лансирао нову алатку која омогућава корисницима да траже песме певушећи, певајући или звиждањем.
- Нова алатка користи машинско учење да усклади певану нумеру са базом података од више од пола милиона песама која се стално ажурира.
- Корисници Гоогле-а питају која песма се пушта скоро 100 пута сваког месеца.
Гоогле је лансирао нову функцију под називом „Хум то Сеарцх" да решите фрустрирајући проблем: да вам се песма заглавила у глави и да не можете да схватите како се зове.
Идеја пјевушења да бисте пронашли пјесму изгледа невероватно једноставна, па зашто Гоогле покреће ову функцију тек 2020.? Па, испоставило се да је идентификовање песама на овај начин заправо прилично компликовано, делом зато што се наше пјевушене верзије прилично разликују од оригиналне нумере. У недавном посту на свом АИ блогу, Гугл објашњава како је користио машинско учење да решимо овај проблем и на крају помогнемо људима да пронађу песму певушећи, звиждајући или певајући мелодију чак и када је њихово извођење мање него тачно.
„Наш фокус за Хум то Сеарцх је да помогнемо људима да идентификују и пронађу музику која им је заглављена у глави“, рекао је портпарол Гугла Лифевире у мејлу.
Само почни да пјевушиш
Корисници Гоогле-а питају која се песма пушта скоро 100 милиона пута сваког месеца, Апарна Ченапрагада, Гоогле-ов потпредседник и генерални менаџер потрошачке куповине, рекао је видео представљајући неколико нових функција претраге. Сада постоји начин да сазнате.
"Хум то Сеарцх" функција је уграђена у Гоогле-ову мобилну апликацију, виџет за Гоогле претрагу и Гоогле помоћник. Да бисте јој приступили преко апликације, додирните икону микрофона и реците „Која је ово песма?“ Одабир дугмета „Тражи песму“ такође функционише.
Да би радила исправно, функција захтева да певушите најмање 10-15 секунди. Корисници Андроид-а могу да певуше како би пронашли песме на више од 20 језика, док само енглеске песме раде на иПхоне уређајима. Алат није увек у могућности да одмах идентификује песму, али када то учини, резултати су прилично добри.
„Више од половине песама широког скупа варијабли (тон, висина, јачина, итд.) препознају наши алгоритми, али, наравно, тачност зависи од квалитета певања, типа песме и још много тога“, портпарол Гугла рекао Лифевире у мејлу. "Али када се препозна, отприлике четири од пет одговора су тачна."
Међутим, ово није први пут да се пјевушење користи у апликацији за идентификацију музике. СоундХоунд нуди сличну карактеристику, као што је приметио ЦНН Бусинесс, а доступан је и на Андроид-у и иОС-у. Према гласноговорнику Гоогле-а, нова функција не изазива никакве забринутости за приватност, нити „мења начин на који Гоогле управља интеракцијама заснованим на звуку“, рекли су Лифевире у мејлу.
Машинско учење
Упркос једноставности концепта, пјевушити мелодију како би се пронашао студијски снимак технички је прилично тешко. Постоји неколико разлога за то, објашњава Кристијан Франк из Гоогле Ресеарцх-а у а Нема в. 12 блог пост. Пре свега, пјевушена верзија песме може се у великој мери разликовати од стварног снимка, што отежава њихово подударање. Дакле, док Шазам и а мноштво других апликација већ постоји да бисте идентификовали песму коју чујете у ресторану или другом јавном месту, а коришћење пјевушене мелодије као основе за ту претрагу може бити теже.
„Са текстовима, позадинским вокалом и инструментима, звук мјузикла или студијског снимка може бити прилично другачији од пјевушене мелодије“, пише Франк. „Грешком или дизајном, када неко певуше своју интерпретацију песме, често висина, тоналитет, темпо или ритам могу мало да варирају или чак значајно."
Будући да пјевушене верзије пјесама могу бити толико различите од оригинала, Франк напомиње да су многе прошле методе имале потребно је ускладити певање особе са верзијом песме која има само мелодију или нумеру која укључује зујање. Ово је учинило случајеве употребе у стварном свету изазовним, јер базе података са тим песмама могу бити ограничене и морају се ручно ажурирати.
Гоогле објашњава да за функцију Хум то Сеарцх користи моделе машинског учења за претварање звука у а „секвенца заснована на бројевима“ која представља мелодију песме—оно што она каже може се сматрати "отисак прста."
Више прилагођен корисницима
Коришћење машинског учења у Гоогле-овој функцији Хум то Сеарцх на крају чини алат много лакшим за коришћење у стварном свету. Пошто Хум то Сеарцх одговара пјевушеној мелодији претраживача са стварном пјесмом, алатка може радити са новом песме како се објављују уместо базе података коју стално треба ажурирати пјевушеним верзијама сваке од њих трацк. Осим тога, није вам потребан савршени тон да бисте га користили.
„Тренутни систем достиже висок ниво тачности у бази података песама која садржи преко пола милиона песама које стално ажурирамо“, рекао је Гугл у својој најави Хум то Сеарцх. „Овај корпус песама још увек има простора да расте како би укључио више од многих мелодија света.“