Hlavní navigace

Velký zlom - Napster konečně implementuje zvukové otisky

23. 4. 2001
Doba čtení: 6 minut

Sdílet

Technologie zvukových otisků pro identifikaci hudebních skladeb už od loňska nabízí široké možnosti jejích implementací - od přidání informací do průvodních metadat až po připojení mikroplateb. Už rok vzývám sítě peer-to-peer (zvláště pak Napster), aby zvukové otisky zavedly. Napster mě vyslyšel jako první :-)
Ve svých komentářích o hudbě na Internetu jsem už takřka odevzdaně kňoural a štkal nad bezbřehým ignorováním hudebních otisků sítěmi peer-to-peer. Když Napster chtěl vyhovět kameníkům odfiltrováním jejich copyrightových skladeb textovými filtry ze svého prohledávače, už na mě nad vší tou tupostí šly mrákoty – a Napster a spol. jsem poslal do horoucích pekel. Zdá se, že nastává obrat kýženým směrem. Napster v pátek oficiálně ohlásil zavedení zvukových otisků s využitím jejich databáze MusicBrainz.

Co jsou zvukové otisky

Technologie zvukových otisků je tak trochu počítačoveckou alchymií. Ale hodně užitečnou. Kromě hromady práce provozovatelům databází otisků přinese obrovský prospěch všem jejich uživatelům. Pro toho, kdo neví, o co jde, stručný nástin podstaty věci.

Experimentátoři zjistili, že lze vytvořit identifikační kód každé hudební skladby podle jejích charakteristik. Dnes je těchto charakteristik už přes 30. O alchymickém nádechu metody svědčí i její vznosné pojmenování – psychoakustika. Výslednou, automaticky vypočtenou identifikaci lze rovněž využít k identifikaci hudebního žánru skladby i několika dalších rozlišení. Pro každou skladbu je její identifikace jedinečná v poměrně slušném rozsahu tempa, dynamiky a zvukové barevnosti skladby. Na typu komprese digitálního souboru vůbec nezáleží.

Zvukový otisk skladby může obsahovat jen několik desítek bajtů. Zpočátku se experimentovalo s vytvořením otisku z 10 vteřin skladby buď od jejího začátku nebo „o nějak stanovený kousek dál“. Dnes se obvykle vychází z celých 30 vteřin od začátku skladby.

Praktický význam otisků

Otisk se začlení do databáze otisků. V ní už ho mohou provázet jakékoli další průvodní informace – autoři, interpreti, název skladby, rok vzniku, ev. z jakého je alba, URI na ev. text, notový záznam a na další info o čemkoli kolem kterékoli sklady. Tyto údaje mohou být přístupné uživatelům přehrávačů hudebních skladeb. Údaje samozřejmě musí být v nějaké dohodnuté formě metadat, aby se s nimi všichni domluvili. Databáze může sloužit i jako běžný prohledávač uložených dat.

Jak vypadá spolupráce klienta (plug-in pro přehrávač) s databází? Na straně uživatele se vytvoří zvukový otisk skladby, kterou nemá nijak identifikovanou. Výsledný otisk se srovná s otisky v databázi. Pokud se najde shoda, k uživateli se dostanou metadata a připojí se k souboru (nejlépe přímo, ale mohou být nějak vázány i na lokální databázi). Spolu s přehráváním skladby se pak jednou provždy objeví průvodní informace v přehrávači, další na vyžádání z lokální nebo externí databáze.

Jak se bude s databázemi zvukových otisků nakládat

Pokud se shoda otisku nenajde, nastává spousta možností, co dál. To určuje provozovatel databáze otisků. Nejdůležitější je rozhodnutí, kdo bude smět do databáze vkládat otisky skladeb, které tam ještě nejsou. Možnosti provádění různých hloupých srandiček a podfuků jsou nekonečné – jim se musí zabránit. Provozovatel může být buď velmi striktní a otisky zařazovat jen on sám. Nebo přidělí přístupový klíč pouze vybraným osobám. Nebo určí způsob, jakým se na zařazování otisků může podílet široká uživatelská komunita. Poslední postup musí ale tak jako tak zvýhodňovat jedny uživatele před druhými (např. hodnocením kreditu důvěry – v komunitě Slashdotu se mu říká „karma“ – kdo má „dobrou karmu“, je občas připuštěn k moderování, tj. k hodnocení příspěvků ostatních uživatelů Slashdotu).

Protože hudebních skladeb jsou milióny a stále hustě přibývají, nejvhodnější je zapojení širší komunity v ev. kombinaci s ostatními dvěma způsoby přijímání otisků do databáze. Nezbytná je zpětná vazba od komunity pro opravy údajů v databázi otisků a pro ev. vymazávání nesmyslů nebo podvodů. Ale i vložení nového otisku s průvodními metadaty může podléhat hlasování podle stanovených pravidel. Údaje pro průvodní metadata mohou být neúplné – ty opět může doplňovat komunita. Suma sumárum – bez poměrně velké spoluúčasti komunity nemůže databáze nikdy být dostatečně informativní. Ale i její provozovatel musí pro zdárný chod věci hodně moc dělat.

Co se stane po implementaci zvukových otisků Napsterem?

Před otázkou začlenění komunikace s databází zvukových otisků právě teď stojí Napster. Stává se tak první sítí peer-to-peer, která tuto technologii začne využívat. Napster k tomu nechtěně dotlačili kameníci. Nechtěně proto, že uplatnění zvukových otisků může mít velmi praktický protikamenický efekt. Protože ostatní sítě peer-to-peer nebudou svým uživatelům s to poskytovat tak komplexní informace o skladbách jako Napster, brzy k využívání technologie přistoupí. Napster ovšem využije otisky pro blokování, resp. prodej copyrightových skladeb. Dál už zřejmě nepůjde, protože chce sloužit kameníkům a přijít si tak na své (jeho šéfem je nadnárodní megakameník Bertelsmann).

Co se ale stane, bude mít dalekosáhlý efekt. Napsterem zvolená databáze otisků MusicBrainz pod nepřímou správou takřka geekovské firmy Relatable je GPL (software LGPL) a její obsah je zcela volně přístupný. Má zavedený i systém moderování obsahu uživateli. Napster se zaslouží o jednu veledůležitou věc – o začlenění více než miliónu otisků copyrightových skladeb. Tím se vyřeší jeden z největších problémů těchto databází, a sice jejich značná neúplnost, resp. nízký počet začleněných skladeb.

Jakmile bude MusicBrainz obsahovat všechno, kvůli čemu kameničtí chamtivci šílí, jiné sítě peer-to-peer, které se rozhodnou k podpoře nekamenické hudby, budou moci volně využívat obsah MusicBrainz pro zákaz vstupu kamenických skladeb do svých sítí. A pro začleňování nekamenických skladeb do této databáze. Jiná firma – eTantrum, která se zabývá technologií zvukových otisků (opět GPL – viz Freetantrum), počítá ve svých záměrech s možností využít databáze otisků i pro zavedení mikroplateb. Tím se všechno konečně dostane k možnosti kompenzace nekamenických hudebníků a k osvobození vývoje hudby z pařátů kamenických parazitů.

MusicBrainz se snaží nabízet možnosti kompenzací spíše via FairTunes (dobrovolný příspěvek – něco jako vhození drobných do klobouku). Zatím se ale prokazuje, že to lidi moc nevyužívají. Nikoli proto, že by nechtěli do klobouku nic hodit, ale kvůli složitostem provedení věci. Jakákoli síť peer-to-peer ale může využít databázi otisků k dalšímu kouzlení, včetně mikroplatebního. U nich bude spíš záležet na vytvoření zajímavých a hravých koncepcí svých sítí, aby jimi zaujali a kompenzovali i jejich uživatele. Této věci jsem se rovněž mockrát věnoval a nebudu popis možných velezajímavých koncepcí v již tak dost dlouhém článku opakovat.

Oponentům předem vzkazuji, že je mi zcela jasné, že hudební bootlegy budou na Internetu existovat i nadále. Ale poměr těch, kteří budou nekameníkům (a tím i sobě) přispívat, poroste do nějaké míry, na které se ustálí. To bude bohatě stačit. A obejde se to bez jakéhokoli šifrování, šmírování aj. paranoicko-totalitních praktik kameníků.

Úspěšnost implementace zvukových otisků při rozeznávání skladeb je už kolem 98%. MusicBrainz se snaží zavést systém, který přidělí jedno ID jedné a téže skladbě, i když se stane, že má rozdílný otisk. MusicBrainz je mj. zajímavý i tím, že má implementovanou perfektní technologii pro přidělování ID cédéčkům s podporou hashovací funkce SHA-1, viz velmi detailní popis pro zdatnější počítačovce How does the CD Index create Disc Ids?.

ebf 24 - tip duben

Zvukové otisky už využívá několik málo komerčních firem – např. *CD nabízí přehled právě hraných skladeb na rozhlasových stanicích s nabídkou okamžitého zakoupení cédéčka s onou skladbou. Když se vám něco zalíbí v rádiu, ale unikl vám název i jméno interpreta, zaskočíte na *CD a tam u příslušné stanice najdete potřebné údaje (je tam několik naposledy hraných skladeb). Všechno probíhá zcela automaticky, jen s pomocí zvukových otisků (servery *CD „poslouchají“ vysílané skladby a podle jejich otisků vyhazují na své webovské servery metadata z databáze otisků).

Další informace k tématu najdete v prohledávačích Internetu zadáním klíčových slov, jako např. „audio fingerprint“ music psychoaccoustic apod. Moc informací o věci na Internetu zatím není, ale díky rozhodnutí Napsteru jich bude valem přibývat. Myslím, že se máme na co těšit. A já už konečně nebudu muset štkát nad zoufaleckým ignorováním skvělých možností, jaké zvukové otisky nabízejí pro budoucnost hudby na Internetu.

Posílí implementace zvukových otisků rozvoj nekamenické hudby na Internetu?

Byl pro vás článek přínosný?

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).