Hoe de functie Hum to Search van Google werkt

Belangrijkste leerpunten

  • Google heeft een nieuwe tool gelanceerd waarmee gebruikers naar nummers kunnen zoeken door te neuriën, zingen of fluiten.
  • De nieuwe tool maakt gebruik van machine learning om een ​​neuriënd nummer te matchen met een database van meer dan een half miljoen nummers die voortdurend wordt bijgewerkt.
  • Google-gebruikers vragen welk nummer bijna 100 keer per maand wordt afgespeeld.
Shot van een vrouw die haar mobiel gebruikt terwijl ze thuis ontspant
laflor / Getty Images

Google heeft een nieuwe functie gelanceerd genaamd "Hum om te zoeken" om een ​​frustrerend probleem op te lossen: een liedje in je hoofd hebben en niet kunnen achterhalen hoe het heet.

Het idee om te neuriën om een ​​nummer te vinden lijkt ongelooflijk eenvoudig, dus waarom lanceert Google deze functie pas in 2020? Nou, het blijkt dat het identificeren van nummers op deze manier eigenlijk behoorlijk ingewikkeld is, deels omdat onze geneuriede versies nogal verschillen van het originele nummer. In een recent bericht op zijn AI-blog, Google legt uit hoe het machine learning gebruikte

om dit probleem op te lossen en uiteindelijk mensen te helpen een nummer te vinden door de melodie te neuriën, te fluiten of te zingen, zelfs als hun vertolking niet nauwkeurig is.

"Onze focus voor Hum to Search ligt op het helpen van mensen bij het identificeren en vinden van muziek die in hun hoofd blijft hangen", zegt een Google-woordvoerder. reddingsdraad in een e-mail.

Begin gewoon te neuriën

Google-gebruikers vragen welk nummer bijna 100 miljoen keer per maand wordt afgespeeld, Aparna Chennapragada, Google's vice-president en algemeen directeur consumentenwinkelen, zei een video-introductie verschillende nieuwe zoekfuncties. Nu is er een manier om erachter te komen.

De "Hum om te zoeken" is ingebouwd in de mobiele app van Google, de Google Zoeken-widget en de Google Assistent. Om het via de app te openen, tik je op het microfoonpictogram en zeg je 'Wat is dit nummer?' Het selecteren van de knop "Een nummer zoeken" werkt ook.

Om correct te werken, moet u voor de functie minimaal 10-15 seconden neuriën. Android-gebruikers kunnen neuriën om nummers in meer dan 20 talen te vinden, terwijl op iPhones alleen Engelse nummers werken. De tool kan een nummer niet altijd meteen identificeren, maar als dat het geval is, zijn de resultaten redelijk goed.

"Meer dan de helft van de nummers van een brede reeks variabelen (toon, toonhoogte, volume, enz.) worden herkend door onze algoritmen, maar de nauwkeurigheid hangt natuurlijk af van de kwaliteit van het neuriën, het type nummer en meer", zegt de Google-woordvoerder. vertelde reddingsdraad in een e-mail. "Maar als het eenmaal wordt herkend, zijn ongeveer vier van de vijf antwoorden correct."

Dit is echter niet de eerste keer dat neuriën wordt gebruikt in een app voor het identificeren van muziek. SoundHound biedt een vergelijkbare functie, zoals opgemerkt door CNN Zakelijk, en is ook beschikbaar op Android en iOS. Volgens de Google-woordvoerder roept de nieuwe functie geen privacyproblemen op, noch verandert het "de manier waarop Google omgaat met op audio gebaseerde interacties", zeiden ze. reddingsdraad in een e-mail.

Machinaal leren

Ondanks de eenvoud van het concept, is het technisch vrij moeilijk om een ​​deuntje te neuriën om de studio-opname te vinden. Daar zijn verschillende redenen voor, legt Christian Frank van Google Research in a nov. 12 blogpost. Allereerst kan een geneuriede versie van het nummer sterk verschillen van de daadwerkelijke opname, waardoor het moeilijk is om de twee te matchen. Dus, terwijl Shazam en a tal van andere apps al bestaan ​​om dat nummer te identificeren dat je in een restaurant of een andere openbare plaats hoort, kan het lastiger zijn om een ​​neuriënde melodie te gebruiken als basis voor die zoektocht.

"Met teksten, achtergrondzang en instrumenten kan de audio van een musical of studio-opname heel anders zijn dan een neuriënd deuntje", schrijft Frank. "Per ongeluk of ontwerp, wanneer iemand hun interpretatie van een nummer neuriet, kunnen de toonhoogte, toonsoort, tempo of ritme vaak enigszins of zelfs aanzienlijk variëren."

Google's visualisatie van een neuriënde clip naast een bijpassende studio-opname.
Google

Omdat de neuriënde versies van nummers zo kunnen verschillen van de originelen, merkt Frank op dat veel methoden uit het verleden dat hebben gedaan vereist het afstemmen van het neuriën van een persoon met een versie van het nummer die alleen een melodie heeft, of een nummer dat bevat neuriën. Dit heeft het gebruik in de echte wereld uitdagend gemaakt, omdat de databases met die nummers beperkt kunnen zijn en handmatig moeten worden bijgewerkt.

Google legt uit dat het voor de functie Hum to Search machine learning-modellen gebruikt om audio om te zetten in een "op nummers gebaseerde reeks" die de melodie van het nummer vertegenwoordigt - wat het zegt, kan worden gezien als een "vingerafdruk."

Gebruiksvriendelijker

Het gebruik van machine learning in de functie Hum to Search van Google maakt de tool uiteindelijk een stuk gemakkelijker te gebruiken in de echte wereld. Omdat Hum to Search het neuriënde deuntje van de zoeker overeenkomt met het eigenlijke nummer, kan de tool werken met de nieuwe nummers zoals ze worden uitgebracht in plaats van een database die constant moet worden bijgewerkt met gehumeurde versies van elk spoor. Bovendien heb je geen perfecte pitch nodig om het te gebruiken.

"Het huidige systeem bereikt een hoge mate van nauwkeurigheid in een database met nummers die meer dan een half miljoen nummers bevat die we voortdurend bijwerken", zei Google in de aankondiging van Hum to Search. "Dit songcorpus heeft nog ruimte om te groeien om meer van 's werelds vele melodieën op te nemen."