Kako deluje Googlova funkcija Hum to Search

click fraud protection

Ključni odvzemi

  • Google je predstavil novo orodje, ki uporabnikom omogoča iskanje pesmi s brnanjem, petjem ali žvižganjem.
  • Novo orodje uporablja strojno učenje za uskladitev posnete skladbe z bazo podatkov z več kot pol milijona skladb, ki se nenehno posodablja.
  • Uporabniki Googla sprašujejo, katera skladba se predvaja skoraj 100-krat vsak mesec.
Posnetek ženske, ki uporablja svoj mobilni telefon med sproščanjem doma
laflor / Getty Images

Google je predstavil novo funkcijo, imenovano "Hum za iskanje", da bi rešili frustrirajočo težavo: pesem se ti zatakne v glavi in ​​ne moreš ugotoviti, kako se imenuje.

Zamisel o brnanju, da bi našli pesem, se zdi neverjetno preprosta, zakaj torej Google to funkcijo lansira šele leta 2020? No, izkazalo se je, da je prepoznavanje pesmi na ta način pravzaprav precej zapleteno, deloma zato, ker se naše zapevane različice precej razlikujejo od izvirne skladbe. V nedavni objavi na svojem blogu AI, Google pojasnjuje, kako je uporabljal strojno učenje odpraviti to težavo in na koncu pomagati ljudem najti pesem tako, da brnejo, žvižgajo ali pojejo melodijo, tudi če je njihova izvedba manj natančna.

"Naš poudarek za Hum to Search je pomagati ljudem prepoznati in poiskati glasbo, ki jim je zataknjena v glavi," je povedal Googlov tiskovni predstavnik Lifewire v elektronskem sporočilu.

Samo začnite brenčati

Uporabniki Googla sprašujejo, katera skladba se predvaja skoraj 100 milijonov krat vsak mesec, Aparna Chennapragada, Googlov podpredsednik in generalni direktor nakupovanja za potrošnike, je dejal predstavitveni video več novih funkcij iskanja. Zdaj obstaja način, da ugotovite.

"Hum za iskanje" funkcija je vgrajena v Googlovo mobilno aplikacijo, pripomoček za iskanje Google in Pomočnika Google. Za dostop do nje prek aplikacije tapnite ikono mikrofona in izgovorite "Kaj je ta pesem?" Deluje tudi izbira gumba »Išči skladbo«.

Za pravilno delovanje funkcija zahteva, da brenčite vsaj 10-15 sekund. Uporabniki Androida lahko brnejo, da najdejo pesmi v več kot 20 jezikih, medtem ko na iPhonih delujejo samo angleške pesmi. Orodje ne more vedno takoj prepoznati pesmi, a ko to stori, so rezultati precej dobri.

"Več kot polovico skladb širokega nabora spremenljivk (ton, višina, glasnost itd.) prepoznajo naši algoritmi, seveda pa je natančnost odvisna od kakovosti brenčanja, vrste pesmi in še več," je Googlov tiskovni predstavnik povedal Lifewire v elektronskem sporočilu. "Toda ko je prepoznan, so približno štirje od petih odgovorov pravilni."

Vendar to ni prvič, da je bilo brenčanje uporabljeno v aplikaciji za prepoznavanje glasbe. SoundHound ponuja podobno funkcijo, kot je omenil CNN Business, na voljo pa je tudi za Android in iOS. Po besedah ​​Googlovega tiskovnega predstavnika nova funkcija ne povzroča nobenih pomislekov glede zasebnosti, niti ne "spremeni načina, kako Google obravnava zvočne interakcije," so povedali. Lifewire v elektronskem sporočilu.

Strojno učenje

Kljub preprostosti koncepta je brenčanje melodije za iskanje studijskega posnetka tehnično precej težko. Za to je več razlogov, pojasnjuje Christian Frank iz Google Research v a nov. 12 objava v blogu. Prvič, zapečena različica pesmi se lahko močno razlikuje od dejanskega posnetka, zaradi česar je težko ujemati obe. Torej, medtem ko Shazam in a številne druge aplikacije že obstaja za prepoznavanje pesmi, ki jo slišite v restavraciji ali drugem javnem kraju, uporaba zapenjane melodije kot osnove za to iskanje je lahko bolj zapletena.

"Z besedili, vokali v ozadju in inštrumenti se lahko zvok glasbenega ali studijskega posnetka precej razlikuje od zapevane melodije," piše Frank. "Po pomoti ali načrtu, ko nekdo zapeva svojo interpretacijo pesmi, se pogosto lahko višina, tipka, tempo ali ritem nekoliko ali celo bistveno razlikujejo."

Googlova vizualizacija zapečenega posnetka poleg ustreznega studijskega posnetka.
Google

Ker so zapenjane različice pesmi lahko tako drugačne od izvirnikov, Frank ugotavlja, da jih ima veliko preteklih metod zahteva ujemanje osebnega brenčanja z različico pesmi, ki ima samo melodijo, ali skladbo, ki vključuje brenčanje. Zaradi tega so bili primeri uporabe v resničnem svetu zahtevni, saj so baze podatkov s temi skladbami lahko omejene in jih je treba ročno posodobiti.

Google pojasnjuje, da za funkcijo Hum to Search uporablja modele strojnega učenja za pretvorbo zvoka v a "številčno zasnovano zaporedje", ki predstavlja melodijo pesmi - to, kar pravi, lahko razumemo kot "prstni odtis."

Bolj uporabniku prijazen

Uporaba strojnega učenja v Googlovi funkciji Hum to Search na koncu olajša uporabo orodja v resničnem svetu. Ker Hum to Search ujema iskalčevo zapevo melodijo z dejansko skladbo, lahko orodje deluje z novim skladbe, ko so izdane, namesto baze podatkov, ki jo je treba nenehno posodabljati z zapečenimi različicami vsake skladbo. Poleg tega za njegovo uporabo ne potrebujete popolnega naklona.

»Trenutni sistem dosega visoko raven natančnosti v bazi skladb, ki vsebuje več kot pol milijona skladb, ki jih nenehno posodabljamo,« je Google dejal v svoji objavi Hum to Search. "Ta korpus pesmi ima še prostora za rast, da bo vključil več svetovnih melodij."