Google의 Hum to Search 기능 작동 방식
주요 내용
- Google은 사용자가 허밍, 노래 또는 휘파람으로 노래를 검색할 수 있는 새로운 도구를 출시했습니다.
- 새로운 도구는 기계 학습을 사용하여 허밍 트랙을 지속적으로 업데이트되는 50만 곡 이상의 데이터베이스와 일치시킵니다.
- Google 사용자는 어떤 노래가 매달 거의 100번 재생되는지 묻습니다.

구글은 "라는 새로운 기능을 출시했습니다.험 검색" 답답한 문제를 해결하기 위해: 노래가 머리에 맴돌고 제목을 알아낼 수 없습니다.
노래를 찾기 위해 허밍을 하는 아이디어는 매우 간단해 보이지만 Google은 왜 2020년에만 이 기능을 출시할까요? 음, 이 방법으로 노래를 식별하는 것은 사실 꽤 복잡한 것으로 밝혀졌습니다. 부분적으로는 우리의 허밍 버전이 원래 트랙과 상당히 다른 경향이 있기 때문입니다. AI 블로그의 최근 게시물에서 Google은 기계 학습을 사용하는 방법을 설명합니다. 이 문제를 해결하고 궁극적으로 사람들이 흥얼거리거나 휘파람을 불거나 멜로디가 정확하지 않더라도 노래를 불러서 노래를 찾도록 도와줍니다.
Google 대변인은 "Hum to Search의 초점은 사람들이 머릿속에 맴도는 음악을 식별하고 찾도록 돕는 것입니다."라고 말했습니다. 라이프와이어 이메일에서.
그냥 허밍 시작
Google 사용자는 어떤 노래가 매달 거의 1억 번 재생되는지 묻습니다. Google의 부사장이자 소비자 쇼핑 총괄 책임자인 Aparna Chennapragada는 소개하는 영상이 말했다 몇 가지 새로운 검색 기능. 이제 알아보는 방법이 있습니다.
NS "험 검색" 기능은 Google 모바일 앱, Google 검색 위젯 및 Google 어시스턴트에 내장되어 있습니다. 앱을 통해 액세스하려면 마이크 아이콘을 누르고 "이 노래가 뭐야?"라고 말하세요. "노래 검색" 버튼을 선택하는 것도 작동합니다.
이 기능이 제대로 작동하려면 최소 10-15초 동안 윙윙거리는 소리를 내야 합니다. Android 사용자는 20개 이상의 언어로 된 노래를 찾기 위해 허밍을 할 수 있지만 iPhone에서는 영어 노래만 작동합니다. 도구가 항상 노래를 즉시 식별할 수 있는 것은 아니지만 일단 식별하면 결과는 꽤 좋습니다.
"다양한 변수(음색, 음높이, 음량 등)의 노래 중 절반 이상이 우리 알고리즘에 의해 인식되며, 그러나 물론 정확도는 허밍의 품질, 노래 유형 등에 따라 달라집니다."라고 Google 대변인이 말했습니다. 말했다 라이프와이어 이메일에서. "하지만 일단 인식되면 5개 중 4개 정도가 정답입니다."
허밍이 음악 식별 앱에 사용된 것은 이번이 처음이 아닙니다. 사운드 하운드 다음과 같이 유사한 기능을 제공합니다. CNN 비즈니스, Android 및 iOS에서도 사용할 수 있습니다. 구글 대변인에 따르면 이 새로운 기능은 개인 정보 보호 문제를 일으키지 않으며 "Google이 오디오 기반 상호 작용을 처리하는 방식을 변경하지도 않습니다." 라이프와이어 이메일에서.
기계 학습
개념의 단순성에도 불구하고 스튜디오 녹음을 찾기 위해 곡을 허밍하는 것은 기술적으로 상당히 어렵습니다. 여기에는 몇 가지 이유가 있다고 Google Research의 Christian Frank는 설명합니다. 11월 12 블로그 게시물입니다. 우선 허밍 버전의 곡은 실제 녹음과 많이 달라 두 곡을 맞추기가 어렵다. 그래서 Shazam과 다른 앱 호스트 레스토랑이나 기타 공공 장소에서 듣는 노래를 식별하기 위해 이미 존재하며, 윙윙거리는 멜로디를 기반으로 검색하는 것은 더 까다로울 수 있습니다.
Frank는 "가사, 배경 보컬 및 악기로 인해 뮤지컬 또는 스튜디오 녹음의 오디오는 흥얼거리는 곡과 상당히 다를 수 있습니다."라고 씁니다. "실수나 설계로 인해 누군가가 노래 해석을 허밍할 때 종종 피치, 키, 템포 또는 리듬이 약간 또는 크게 다를 수 있습니다."

허밍된 버전의 노래는 원본과 매우 다를 수 있기 때문에 Frank는 많은 과거 방법이 사람의 허밍을 멜로디만 있는 노래 버전 또는 포함하는 트랙과 일치시켜야 합니다. 허밍. 이러한 노래가 포함된 데이터베이스가 제한될 수 있고 수동으로 업데이트해야 하기 때문에 실제 사용 사례가 어려워졌습니다.
Google은 Hum to Search 기능의 경우 기계 학습 모델을 사용하여 오디오를 노래의 멜로디를 나타내는 "숫자 기반 시퀀스" - 노래가 말하는 것은 다음과 같이 생각할 수 있습니다. "지문."
사용자 친화적
Google의 Hum to Search 기능에서 기계 학습을 사용하면 궁극적으로 실제 세계에서 도구를 훨씬 더 쉽게 사용할 수 있습니다. Hum to Search는 검색자의 허밍과 실제 노래를 일치시키기 때문에 도구는 새로운 각 버전의 윙윙거리는 버전으로 지속적으로 업데이트해야 하는 데이터베이스 대신 출시되는 노래 길. 또한 사용하기 위해 완벽한 피치가 필요하지 않습니다.
구글은 Hum to Search 발표에서 "현재 시스템은 우리가 지속적으로 업데이트하는 50만 곡 이상의 노래가 포함된 노래 데이터베이스에서 높은 수준의 정확도에 도달합니다."라고 말했습니다. "이 노래 모음은 여전히 세계의 많은 멜로디를 더 많이 포함할 수 있도록 성장할 여지가 있습니다."