Sådan fungerer Googles Hum to Search-funktion

Nøgle takeaways

  • Google har lanceret et nyt værktøj, der giver brugerne mulighed for at søge efter sange ved at nynne, synge eller fløjte.
  • Det nye værktøj bruger maskinlæring til at matche et nynnet spor med en database med mere end en halv million sange, der løbende opdateres.
  • Google-brugere spørger, hvilken sang der afspilles næsten 100 gange hver måned.
Billed af en kvinde, der bruger sin mobiltelefon, mens hun slapper af derhjemme
laflor / Getty Images

Google har lanceret en ny funktion kaldet "Hum to Search"for at løse et frustrerende problem: at have en sang fast i dit hoved og ikke være i stand til at finde ud af, hvad den hedder.

Ideen med at nynne for at finde en sang virker utrolig enkel, så hvorfor lancerer Google først denne funktion i 2020? Nå, det viser sig, at det faktisk er ret kompliceret at identificere sange på denne måde, til dels fordi vores nynnede versioner plejer at være ret forskellige fra det originale nummer. I et nyligt indlæg på sin AI-blog, Google forklarer, hvordan den brugte maskinlæring for at løse dette problem og i sidste ende hjælpe folk med at finde en sang ved at nynne, fløjte eller synge melodien, selv når deres gengivelse er mindre end nøjagtig.

"Vores fokus for Hum to Search er at hjælpe folk med at identificere og finde musik, der sidder fast i deres hoved," fortalte en Google-talsmand. Lifewire i en e-mail.

Bare begynd at nynne

Google-brugere spørger, hvilken sang der afspilles næsten 100 millioner gange hver måned, Aparna Chennapragada, Googles vicepræsident og general manager for forbrugershopping, sagde en introduktionsvideo flere nye søgefunktioner. Nu er der en måde at finde ud af.

Det "Hum to Search"-funktionen er indbygget i Googles mobilapp, Google Search-widget og Google Assistant. For at få adgang til den via appen skal du trykke på mikrofonikonet og sige "Hvad er denne sang?" At vælge knappen "Søg en sang" fungerer også.

For at fungere korrekt kræver funktionen, at du nynner i mindst 10-15 sekunder. Android-brugere kan nynne for at finde sange på mere end 20 sprog, mens kun engelske sange virker på iPhones. Værktøjet er ikke altid i stand til at identificere en sang med det samme, men når det først gør det, er resultaterne ret gode.

"Mere end halvdelen af ​​sangene i en lang række variabler (tone, tonehøjde, lydstyrke osv.) genkendes af vores algoritmer, men nøjagtigheden afhænger selvfølgelig af kvaliteten af ​​brummen, typen af ​​sang og mere," Googles talsmand fortalte Lifewire i en e-mail. "Men når det først er genkendt, er cirka fire ud af fem svar rigtige."

Det er dog ikke første gang, at nynnen er blevet brugt i en musikidentifikationsapp. SoundHound tilbyder en lignende funktion, som bemærket af CNN Business, og er også tilgængelig på Android og iOS. Ifølge Googles talsmand rejser den nye funktion ingen bekymringer om privatlivets fred, og den "ændrer heller ikke den måde, Google håndterer lydbaserede interaktioner på," fortalte de. Lifewire i en e-mail.

Maskinelæring

På trods af konceptets enkelhed er det teknisk set ret svært at nynne en melodi for at finde studieoptagelsen. Det er der flere grunde til, forklarer Google Researchs Christian Frank i en nov. 12 blogindlæg. Først og fremmest kan en nynnet version af sangen adskille sig meget fra selve indspilningen, hvilket gør det svært at matche de to. Så mens Shazam og en række andre apps eksisterer allerede for at identificere den sang, du hører på en restaurant eller et andet offentligt sted, og det kan være vanskeligere at bruge en nynnet melodi som grundlag for den søgning.

"Med tekster, baggrundsvokal og instrumenter kan lyden af ​​en musical- eller studieoptagelse være helt anderledes end en nynnet melodi," skriver Frank. "Ved fejltagelse eller design, når nogen nynner deres fortolkning af en sang, kan tonehøjden, tonearten, tempoet eller rytmen ofte variere lidt eller endda betydeligt."

Googles visualisering af et nynnet klip ved siden af ​​en matchende studieoptagelse.
Google

Fordi de nynnede versioner af sange kan være så forskellige fra originalerne, bemærker Frank, at mange tidligere metoder har krævet at matche en persons nynnen med en version af sangen, der kun har en melodi, eller et nummer, der inkluderer nynnen. Dette har gjort brugssager i den virkelige verden udfordrende, da databaserne med disse sange kan begrænses og skal opdateres manuelt.

Google forklarer, at for Hum to Search-funktionen bruger den maskinlæringsmodeller til at omdanne lyd til en "nummerbaseret sekvens", der repræsenterer melodien i sangen - hvad der står, kan opfattes som en "fingeraftryk."

Mere brugervenlig

Brugen af ​​maskinlæring i Googles Hum to Search-funktion gør i sidste ende værktøjet meget nemmere at bruge i den virkelige verden. Fordi Hum to Search matcher søgerens nynnede melodi med den faktiske sang, er værktøjet i stand til at arbejde med den nye sange, efterhånden som de udgives i stedet for en database, der konstant skal opdateres med nynnede versioner af hver spore. Derudover behøver du ikke perfekt tonehøjde for at bruge det.

"Det nuværende system når et højt niveau af nøjagtighed på en sangdatabase, der indeholder over en halv million sange, som vi løbende opdaterer," sagde Google i sin Hum to Search-meddelelse. "Dette sangkorpus har stadig plads til at vokse til at omfatte flere af verdens mange melodier."