Kuidas Google'i funktsioon Hum to Search töötab
Võtmed kaasavõtmiseks
- Google tõi turule uue tööriista, mis võimaldab kasutajatel otsida laule ümisemise, laulmise või vilistamise teel.
- Uus tööriist kasutab masinõpet, et sobitada ümisenud lugu enam kui poole miljoni loo andmebaasiga, mida pidevalt uuendatakse.
- Google'i kasutajad küsivad, millist lugu esitatakse peaaegu 100 korda kuus.

Google tõi turule uue funktsiooni nimega "Hum to Search", et lahendada masendav probleem: teil on pähe jäänud laul ja te ei saa aru, kuidas seda nimetatakse.
Laulu leidmiseks ümisemise idee tundub uskumatult lihtne, miks siis toob Google selle funktsiooni välja alles 2020. aastal? Selgub, et lugude tuvastamine sel viisil on tegelikult üsna keeruline, osaliselt seetõttu, et meie ümisetud versioonid kipuvad originaalloost üsna erinevad. Oma AI ajaveebi hiljutises postituses Google selgitab, kuidas ta masinõpet kasutas selle probleemi lahendamiseks ja lõpuks aidata inimestel laulu ümisemise, vilistamise või meloodia laulmise teel leida isegi siis, kui selle esitus on ebatäpne.
"Meie keskendume Hum to Searchi jaoks sellele, et aidata inimestel tuvastada ja leida muusikat, mis on nende peas kinni jäänud," ütles Google'i pressiesindaja. Lifewire meilis.
Lihtsalt alusta ümisemist
Google'i kasutajad küsivad, millist lugu esitatakse peaaegu 100 miljonit korda kuus, Aparna Chennapragada, Google'i asepresident ja tarbijaostude peadirektor, ütles tutvustav video mitu uut otsingufunktsiooni. Nüüd on võimalus teada saada.
"Hum to Search" funktsioon on sisse ehitatud Google'i mobiilirakendusse, Google'i otsingu vidinasse ja Google'i assistendisse. Rakenduse kaudu sellele juurde pääsemiseks puudutage mikrofoniikooni ja öelge "What’s this song?" Samuti töötab nupu "Otsi laulu" valimine.
Õigeks toimimiseks nõuab see funktsioon vähemalt 10–15 sekundit ümisemist. Androidi kasutajad saavad ümisedes leida laule enam kui 20 keeles, samas kui iPhone'is töötavad ainult ingliskeelsed lood. Tööriist ei suuda alati laulu kohe tuvastada, kuid kui see õnnestub, on tulemused päris head.
"Meie algoritmid tunnevad ära enam kui pooled paljude muutujate (toon, helikõrgus, helitugevus jne) lugudest, aga muidugi oleneb täpsus ümisemise kvaliteedist, laulu tüübist ja muust," ütles Google'i pressiesindaja. rääkis Lifewire meilis. "Kuid kui see on äratuntud, on umbes neli vastust viiest õiged."
See pole aga esimene kord, kui ümisemist muusika tuvastamise rakenduses kasutatakse. SoundHound pakub sarnast funktsiooni, nagu märkis CNN ärining see on saadaval ka Androidi ja iOS-i jaoks. Google'i pressiesindaja sõnul ei tekita uus funktsioon privaatsusprobleeme ega "muuta seda, kuidas Google helipõhist suhtlust käsitleb", ütlesid nad. Lifewire meilis.
Masinõpe
Hoolimata kontseptsiooni lihtsusest on stuudiosalvestuse leidmiseks viisi ümisemine tehniliselt üsna keeruline. Sellel on mitu põhjust, selgitab Google Researchi Christian Frank a nov. 12 blogipostitus. Esiteks võib laulu ümisetud versioon tegelikust salvestusest oluliselt erineda, muutes nende kahe sobitamise keeruliseks. Niisiis, kuigi Shazam ja a hulk muid rakendusi restoranis või muus avalikus kohas kuuldud laulu tuvastamiseks juba olemas. Ümiseva meloodia kasutamine selle otsingu aluseks võib olla keerulisem.
"Lõunasõnade, taustavokaalide ja instrumentidega võib muusikali või stuudiosalvestise heli olla ümisevast viisist üsna erinev," kirjutab Frank. "Kui keegi loo tõlgendust ümiseb ekslikult või kujunduslikult, võib helikõrgus, klahv, tempo või rütm sageli veidi või isegi oluliselt erineda."

Kuna laulude ümisetud versioonid võivad originaalidest nii palju erineda, märgib Frank, et paljud varasemad meetodid on seda teinud nõutav inimese ümisemise sobitamine laulu versiooniga, millel on ainult meloodia, või palaga, mis sisaldab ümisemine. See on muutnud tegelikud kasutusjuhtumid keeruliseks, kuna nende lugude andmebaasid võivad olla piiratud ja neid tuleb käsitsi värskendada.
Google selgitab, et funktsiooni Hum to Search jaoks kasutab see masinõppemudeleid, et muuta heli a "numbripõhine jada", mis esindab laulu meloodiat – selles öeldut võib pidada a "sõrmejälg".
Kasutajasõbralikum
Masinõppe kasutamine Google'i funktsioonis Hum to Search muudab tööriista reaalses maailmas kasutamise palju lihtsamaks. Kuna Hum to Search sobitab otsija ümiseva loo tegeliku looga, saab tööriist töötada koos uue lugusid nii, nagu need välja antakse, mitte andmebaasi, mida tuleb pidevalt värskendada kõigi ümisevate versioonidega rada. Lisaks ei pea te selle kasutamiseks täiuslikku helikõrgust.
"Praegune süsteem saavutab kõrge täpsustaseme laulude andmebaasis, mis sisaldab üle poole miljoni loo, mida me pidevalt värskendame," ütles Google oma Hum to Searchi teates. "Sellel laulukorpusel on veel ruumi areneda, et hõlmata rohkem maailma paljudest meloodiatest."