Hur Googles Hum to Search-funktion fungerar

Viktiga takeaways

  • Google har lanserat ett nytt verktyg som låter användare söka efter låtar genom att nynna, sjunga eller vissla.
  • Det nya verktyget använder maskininlärning för att matcha ett nynnande spår med en databas med mer än en halv miljon låtar som uppdateras kontinuerligt.
  • Google-användare frågar vilken låt som spelas nästan 100 gånger varje månad.
Bild av en kvinna som använder sin mobiltelefon medan hon kopplar av hemma
laflor / Getty Images

Google har lanserat en ny funktion som heter "Hum to Search" för att lösa ett frustrerande problem: att ha en låt fast i huvudet och inte kunna komma på vad den heter.

Idén med att nynna för att hitta en låt verkar otroligt enkel, så varför lanserar Google den här funktionen först 2020? Tja, det visar sig att det faktiskt är ganska komplicerat att identifiera låtar på det här sättet, delvis för att våra nynnande versioner tenderar att skilja sig ganska mycket från originalspåret. I ett nyligen inlägg på sin AI-blogg, Google förklarar hur det använde maskininlärning för att lösa det här problemet och i slutändan hjälpa människor att hitta en låt genom att nynna, vissla eller sjunga melodin även när deras återgivning är mindre än exakt.

"Vårt fokus för Hum to Search är att hjälpa människor att identifiera och hitta musik som har fastnat i deras huvud", sa en talesperson för Google. Lifewire i ett mejl.

Bara börja nynna

Google-användare frågar vilken låt som spelas nästan 100 miljoner gånger varje månad, Aparna Chennapragada, Googles vicepresident och general manager för konsumenthandel, sa en introduktionsvideo flera nya sökfunktioner. Nu finns det ett sätt att ta reda på det.

den "Hum to Search"-funktionen är inbyggd i Googles mobilapp, Google Search-widget och Google Assistant. För att komma åt den via appen, tryck på mikrofonikonen och säg "Vad är den här låten?" Att välja knappen "Sök en låt" fungerar också.

För att fungera korrekt kräver funktionen att du nynnar i minst 10-15 sekunder. Android-användare kan nynna för att hitta låtar på mer än 20 språk, medan endast engelska låtar fungerar på iPhones. Verktyget kan inte alltid identifiera en låt direkt, men när det väl gör det är resultaten ganska bra.

"Mer än hälften av låtarna med en bred uppsättning variabler (ton, tonhöjd, volym, etc.) känns igen av våra algoritmer, men självklart beror noggrannheten på kvaliteten på brummandet, typen av låt och mer, säger Googles talesperson berättade Lifewire i ett mejl. "Men när det väl är känt är ungefär fyra av fem svar korrekta."

Detta är dock inte första gången nynnande har använts i en musikidentifieringsapp. SoundHound erbjuder en liknande funktion, som noterats av CNN Business, och finns även på Android och iOS. Enligt Googles talesperson väcker den nya funktionen inga integritetsproblem, och inte heller "ändrar den hur Google hanterar ljudbaserade interaktioner", sa de Lifewire i ett mejl.

Maskininlärning

Trots enkelheten i konceptet är det tekniskt ganska svårt att nynna på en låt för att hitta studioinspelningen. Det finns flera anledningar till detta, förklarar Google Researchs Christian Frank i en nov. 12 blogginlägg. För det första kan en nynnande version av låten skilja sig mycket från själva inspelningen, vilket gör det svårt att matcha de två. Så, medan Shazam och en mängd andra appar finns redan för att identifiera den låten du hör på en restaurang eller annan offentlig plats, att använda en nynnande melodi som grund för den sökningen kan vara svårare.

"Med texter, bakgrundssång och instrument kan ljudet från en musikal- eller studioinspelning vara helt annorlunda än en nynnande låt", skriver Frank. "Av misstag eller design, när någon nynnar på sin tolkning av en låt, kan tonhöjden, tonarten, tempot eller rytmen ofta variera något eller till och med avsevärt."

Googles visualisering av ett nynnande klipp bredvid en matchande studioinspelning.
Google

Eftersom de nynnande versionerna av låtar kan skilja sig så mycket från originalen, konstaterar Frank att många tidigare metoder har gjort det krävs att en persons nynnande matchas med en version av låten som bara har en melodi, eller ett spår som innehåller nynna. Detta har gjort verkliga användningsfall utmanande, eftersom databaserna med dessa låtar kan begränsas och måste uppdateras manuellt.

Google förklarar att för Hum to Search-funktionen använder den maskininlärningsmodeller för att förvandla ljud till en "nummerbaserad sekvens" som representerar melodin i låten - vad den säger kan ses som en "fingeravtryck."

Mer användarvänlig

Användningen av maskininlärning i Googles Hum to Search-funktion gör i slutändan verktyget mycket lättare att använda i den verkliga världen. Eftersom Hum to Search matchar sökarens nynnande låt med den faktiska låten, kan verktyget arbeta med den nya låtarna när de släpps istället för en databas som ständigt behöver uppdateras med nynnade versioner av varje Spår. Dessutom behöver du inte perfekt tonhöjd för att använda den.

"Det nuvarande systemet når en hög nivå av noggrannhet på en låtdatabas som innehåller över en halv miljon låtar som vi kontinuerligt uppdaterar", sa Google i sitt Hum to Search-meddelande. "Denna sångkorpus har fortfarande utrymme att växa för att inkludera fler av världens många melodier."