Kaip veikia „Google Hum to Search“ funkcija
Key Takeaways
- „Google“ pristatė naują įrankį, leidžiantį vartotojams ieškoti dainų niūniuojant, dainuojant ar švilpaujant.
- Naujasis įrankis naudoja mašininį mokymąsi, kad suderintų skambantį takelį su daugiau nei pusės milijono dainų duomenų baze, kuri nuolat atnaujinama.
- „Google“ vartotojai kiekvieną mėnesį klausia, kuri daina grojama beveik 100 kartų.

„Google“ pristatė naują funkciją „Hum to Search“, kad išspręstumėte varginančią problemą: galvoje įstrigo daina ir negalite suprasti, kaip ji vadinasi.
Idėja niūniuoti ieškant dainos atrodo neįtikėtinai paprasta, tad kodėl „Google“ šią funkciją paleidžia tik 2020 m.? Na, pasirodo, kad tokiu būdu atpažinti dainas iš tikrųjų gana sudėtinga, iš dalies todėl, kad mūsų niūniuojamos versijos paprastai gerokai skiriasi nuo originalaus takelio. Neseniai paskelbtame savo AI tinklaraštyje „Google“ paaiškina, kaip naudojo mašininį mokymąsi Norėdami išspręsti šią problemą ir galiausiai padėti žmonėms rasti dainą niūniuojant, švilpdami arba dainuojant melodiją, net jei jos perteikimas nėra toks tikslus.
„Mūsų „Hum to Search“ tikslas – padėti žmonėms atpažinti ir rasti muziką, kuri įstrigo jų galvoje“, – sakė „Google“ atstovas. Lifewire el. laiške.
Tiesiog pradėkite niūniuoti
„Google“ naudotojai klausia, kuri daina kas mėnesį grojama beveik 100 milijonų kartų, Aparna Chennapragada, „Google“ viceprezidentas ir vartotojų apsipirkimo generalinis direktorius, sakoma pristatančiame vaizdo įraše keletas naujų paieškos funkcijų. Dabar yra būdas sužinoti.
"Hum to Search" funkcija yra integruota į "Google" programą mobiliesiems, "Google" paieškos valdiklį ir "Google" padėjėją. Norėdami ją pasiekti naudodami programą, bakstelėkite mikrofono piktogramą ir pasakykite „What’s this song? Taip pat veikia ir mygtuko „Ieškoti dainos“ pasirinkimas.
Kad funkcija veiktų tinkamai, reikia niūniuoti bent 10–15 sekundžių. „Android“ naudotojai gali niūniuoti ieškodami dainų daugiau nei 20 kalbų, o „iPhone“ įrenginiuose veikia tik angliškos dainos. Įrankis ne visada gali iš karto atpažinti dainą, bet kai tai pavyksta, rezultatai yra gana geri.
„Mūsų algoritmai atpažįsta daugiau nei pusę daugybės kintamųjų (tono, tono, garsumo ir kt.) dainų, bet, žinoma, tikslumas priklauso nuo dūzgimo kokybės, dainos tipo ir dar daugiau“, – sakė „Google“ atstovas. pasakojo Lifewire el. laiške. "Tačiau kai tai atpažįstama, maždaug keturi iš penkių atsakymų yra teisingi."
Tačiau tai ne pirmas kartas, kai niūniavimas naudojamas muzikos identifikavimo programoje. SoundHound siūlo panašią funkciją, kaip pažymėjo CNN verslas, taip pat galima naudoti „Android“ ir „iOS“. Pasak „Google“ atstovo, naujoji funkcija nekelia jokių problemų dėl privatumo ir „nekeičia būdo, kaip „Google“ tvarko garsu pagrįstą sąveiką“, – sakė jie. Lifewire el. laiške.
Mašininis mokymasis
Nepaisant koncepcijos paprastumo, niūniuoti melodiją norint rasti studijinį įrašą techniškai gana sunku. Tam yra keletas priežasčių, aiškina „Google Research“ Christianas Frankas Lapkričio mėn. 12 dienoraščio įrašas. Visų pirma, niūniuota dainos versija gali labai skirtis nuo tikrojo įrašo, todėl jas sunku suderinti. Taigi, nors Shazam ir a daugybė kitų programų jau egzistuoja, kad atpažintumėte tą dainą, kurią girdite restorane ar kitoje viešoje vietoje, naudojant niūniuojamą melodiją kaip tos paieškos pagrindą, gali būti sudėtingiau.
„Su dainų tekstu, foniniu vokalu ir instrumentais miuziklo ar studijinio įrašo garsas gali visiškai skirtis nuo niūniuotos melodijos“, – rašo Frankas. „Per klaidą ar sumanymą, kai kas nors niūniuoja savo dainos interpretaciją, dažnai tonas, klavišas, tempas ar ritmas gali šiek tiek ar net labai skirtis.

Kadangi niūniuotos dainų versijos gali labai skirtis nuo originalių, Frankas pažymi, kad daugelis praeities metodų turi reikia suderinti asmens dūzgimą su dainos versija, kurioje yra tik melodija, arba takeliu, kuriame yra dūzgiantis. Dėl to naudojimo realiame pasaulyje atvejai tapo sudėtingi, nes tų dainų duomenų bazės gali būti ribotos ir jas reikia atnaujinti rankiniu būdu.
„Google“ paaiškina, kad funkcijai „Hum to Search“ ji naudoja mašininio mokymosi modelius, kad garsą paverstų a „skaičiais pagrįsta seka“, vaizduojanti dainos melodiją – tai, kas joje sakoma, gali būti laikoma a "pirštų atspaudai".
Patogesnis vartotojui
Naudojant mašininį mokymąsi „Google Hum to Search“ funkcijoje, įrankį daug lengviau naudoti realiame pasaulyje. Kadangi Hum to Search suderina ieškotojo niūniuojamą melodiją su tikrąja daina, įrankis gali veikti su nauja dainas, kai jos išleidžiamos, o ne duomenų bazėje, kuri nuolat turi būti atnaujinama su niūniuojamomis kiekvienos jų versijomis takelis. Be to, norint jį naudoti, nereikia tobulo žingsnio.
„Dabartinė sistema pasiekia aukštą tikslumo lygį dainų duomenų bazėje, kurioje yra daugiau nei pusė milijono dainų, kurias nuolat atnaujiname“, – teigiama „Google“ pranešime „Hum to Search“. „Šis dainų korpusas dar turi kur augti, kad įtrauktų daugiau daugelio pasaulio melodijų.