Skip to content

Jak Google Hum to Search funguje

5 de Červenec de 2021
GettyImages 1152311608 338947b37f904e72aef96d1d408e0b4d

Klíčové jídlo

  • Google spustil nový nástroj, který umožňuje uživatelům vyhledávat písničky hučením, zpěvem nebo pískáním.
  • Nový nástroj využívá strojové učení ke spárování bzučené stopy s databází více než půl milionu skladeb, která je neustále aktualizována.
  • Uživatelé Googlu se ptají, která skladba se hraje téměř stokrát každý měsíc.
Google spustil novou funkci nazvanou „Hum to Search“, která má vyřešit frustrující problém: mít píseň zastrčenou v hlavě a neumět zjistit, jak se jí říká. Myšlenka hučení při hledání skladby se zdá neuvěřitelně jednoduchá, tak proč Google tuto funkci spouští až v roce 2020? Ukázalo se, že identifikace skladeb tímto způsobem je ve skutečnosti docela komplikovaná, zčásti proto, že naše broušené verze mají tendenci se docela lišit od původní skladby. V nedávném příspěvku na svém blogu o AI vysvětluje Google, jak k vyřešení tohoto problému použilo strojové učení a nakonec pomohlo lidem najít píseň hučením, pískáním nebo zpíváním melodie, i když jejich ztvárnění není přesné. „Naše zaměření na Hum to Search je pomoci lidem identifikovat a najít hudbu, která jim uvízla v hlavě,“ řekl mluvčí Google. Záchranný drát v e-mailu.

Stačí začít broukat

Uživatelé Googlu se ptají, která skladba se hraje téměř 100 milionů krát každý měsíc. Aparna Chennapragada, viceprezidentka a generální ředitelka spotřebitelského nakupování společnosti Google, uvedla video představující několik nových funkcí vyhledávání. Nyní existuje způsob, jak to zjistit. Funkce „Hum to Search“ je zabudována do mobilní aplikace Google, widgetu Google Search a Google Assistant. Chcete-li k němu přistupovat prostřednictvím aplikace, klepněte na ikonu mikrofonu a řekněte „Co je to za skladbu?“ Funguje také výběr tlačítka „Vyhledat skladbu“. Aby funkce fungovala správně, vyžaduje, abyste hučeli alespoň 10–15 sekund. Uživatelé Androidu mohou broukat, aby našli skladby ve více než 20 jazycích, zatímco na iPhonech fungují pouze anglické písně. Tento nástroj není vždy schopen okamžitě určit skladbu, ale jakmile to udělá, výsledky jsou docela dobré.

„Naše algoritmy rozpoznávají více než polovinu skladeb široké škály proměnných (tón, výška, hlasitost atd.), Ale přesnost samozřejmě závisí na kvalitě hučení, typu písně atd. , “řekl mluvčí Google Záchranný drát v e-mailu. „Ale jakmile to bude uznáno, zhruba čtyři z pěti odpovědí jsou správné.“ Není to poprvé, co bylo v aplikaci pro identifikaci hudby použito hučení. SoundHound nabízí podobnou funkci, jak uvádí CNN Business, a je k dispozici také pro Android a iOS. Podle mluvčího společnosti Google nová funkce nevyvolává žádné obavy o soukromí ani „nezmění způsob, jakým Google zpracovává zvukové interakce,“ uvedli. Záchranný drát v e-mailu.

Strojové učení

Navzdory jednoduchosti konceptu je hučení melodie k nalezení studiové nahrávky technicky dost obtížné. Existuje několik důvodů, vysvětluje Christian Frank z průzkumu Google Research v příspěvku na blogu z 12. listopadu. Za prvé, hučená verze písně se může značně lišit od skutečné nahrávky, takže je obtížné ji shodovat. Zatímco tedy Shazam a řada dalších aplikací již existují, aby identifikovali skladbu, kterou slyšíte v restauraci nebo na jiném veřejném místě, použití hučené melodie jako základu pro toto hledání může být složitější. „S texty, doprovodnými vokály a nástroji se zvuk hudební nebo studiové nahrávky může zcela lišit od hučené melodie,“ píše Frank. „Omylem nebo záměrně, když někdo pokřiví interpretaci písně, výška, tónina, tempo nebo rytmus se často mohou mírně nebo dokonce výrazně lišit.“

Vizualizace Google bzučeného klipu vedle odpovídající studiové nahrávky.

Vzhledem k tomu, že broušené verze písní se mohou od původních lišit, Frank poznamenává, že mnoho minulých metod vyžadovalo sladění bzučení člověka s verzí písně, která má pouze melodii, nebo skladbou, která obsahuje bzučení. Díky tomu byly případy použití v reálném světě náročné, protože databáze s těmito skladbami mohou být omezené a je třeba je ručně aktualizovat. Google vysvětluje, že pro funkci Hum to Search používá modely strojového učení k přeměně zvuku na „sekvenci založenou na číslech“, která představuje melodii písně – to, co říká, lze považovat za „otisk prstu“.

Uživatelsky přívětivější

Použití strojového učení ve funkci Google Hum to Search v konečném důsledku usnadňuje používání nástroje v reálném světě. Protože Hum to Search odpovídá bzučení melodie vyhledávače se skutečnou skladbou, je tento nástroj schopen pracovat s novými skladbami tak, jak jsou vydávány, namísto databáze, kterou je třeba neustále aktualizovat pomocí bzučivých verzí každé stopy. Navíc k jeho použití nepotřebujete perfektní výšku tónu. „Současný systém dosahuje vysoké úrovně přesnosti v databázi skladeb, která obsahuje více než půl milionu skladeb, které neustále aktualizujeme,“ uvedl Google ve svém oznámení Hum to Search. „Tento korpus písní má stále prostor pro růst, aby zahrnoval více melodií z celého světa.“