Siirry sisältöön
Kirjoittaja: Turo Pekari
Kuva: Turo Pekari

Musiikkidata soi kauniisti

Teoston tutkija Turo Pekari pohtii minkälaisia palveluja musiikkidatasta voisi luoda. Kansa janoaa palveluja ja sovelluksia älypuhelimiinsa. Teostolla on valtava määrää musiikkiin liittyvää tietoa. Miksi datan käyttö muuhun kuin tekijänoikeuskorvausten tehokkaaseen ja tarkkaan tilittämiseen musiikin tekijöille on vielä hyvin rajallista?

Olen hulluna musiikkiin liittyvään tietoon. Sen lisäksi, että pyrin olemaan kävelevä autistinen tietopankki, olen myös kiinnostunut musiikkiin liittyvästä datasta. Työnantajalleni data on myös bisneksen ydintä. Teosto välittää tietoa musiikin käytöstä ja musiikkiin liittyvistä oikeuksista. Teostolle kertyy vuosittain valtava määrä musiikin käyttöön liittyvää dataa broadcastereilta, radiosta, tapahtumajärjestäjiltä, esittäjiltä, palveluntarjoajilta jne. Vuositasolla puhutaan noin seitsemästä miljoonasta teosesityksestä Suomessa. Lisäksi esimerkiksi Spotifyn generoima soittodata, jota yhteispohjoismainen NCB käsittelee, on vielä monin verroin massiivisempaa. Toinen Teoston toiminnalle olennainen data on teostietokannat, joista löytyvät tiedot sävellyksistä, sanoituksista ja sovituksista sekä niiden tekijöistä ja kustantajista.

Perinteisesti kerättyä dataa on käytetty organisaation tehtävän mukaisesti tekijöiden tilityksien kohdentamiseen mahdollisimman tehokkaasti. Tehokkuuden takia dataa on yhdistelty eri vaiheissa ja vanhoja tietoaineistoja ei ole pystytty säilyttämään vuosien varrella alkuperäisessä muodossa jo sen takia, että tiedon varastointi on ollut kustannuskysymys. Keskustelu datan hyödyntämisestä muihin tarkoituksiin on herännyt vasta viime vuosina.

Teoksiin ja äänitteisiin liitetyt tiedot esittäjistä, äänitteestä, tekijöistä, kustantajista, tuottajista ym. ovat tärkeä ja olennainen osa tekijänoikeuksien hallinnointiin liittyvää bisnestä musiikin digitalisoituessa. Jos nämä tiedot ovat puutteellisia tai vääriä, ei raha liiku oikeaan paikkaan. Esimerkiksi Aphex Twinin kappaleen ”ΔMi−1 = −αΣn=1NDi[n][ΣjC[i]Fji[n − 1] + Fexti[n−1]” nimi on Spotifyssa muuttunut ”Formulaksi”. Tässä tapauksessa uskon, että Richard D. James saanee rahansa musiikin käytöstä, mutta jo yksinkertaiset ja inhimilliset näppäilyvirheet puhumattakaan metadatassa olevista puutteista aiheuttavat paljon ongelmia digitaalisen musiikkitiedon käsittelyssä. Näihin ongelmiin yrittävät osaltaan vastata muun muassa Global Repertoire Dabase -hanke ja pohjoismainen Polaris Nordic -yhteistyö, jossa Teosto on mukana.

Teosto saa paljon ja vaihtelevan laatuista dataa lukuisilta toimittajilta. Kaljalla uitetut ulkomaisten bändien paperiset soittolistat festareilta, joissa biisit lukee niiden lempinimillä ehkä karuimpana esimerkkinä. Tälle ongelmalle etsittiin ratkaisua viime vuonna toteutetussa teknologiapilotissa, jossa testasimme espanjalaisen BMAT:n kanssa automaattista livemusiikintunnistusta ensimmäisenä tekijänoikeusjärjestönä maailmassa rohkaisevin tuloksin. Muutaman vuoden kuluessa livemusiikin laajamittainen automaattinen tunnistaminen festariympäristössä on teknisesti täysin realistinen ajatus. Teosten käyttöön liittyvässä raportoinnissa automaattiset sisällöntunnistusjärjestelmät tulevat todennäköisesti helpottamaan paljon ja niitä hyödynnetään monilla alueilla jo nyt.

Sen lisäksi, että datan pitää olla oikeaa organisaatioiden omassa toiminnassa, dataa jaetaan entistä useammin myös ulkopuolisten käyttöön. Avoin data on tällä hetkellä kovan hypetyksen kohteena ja julkishallinnossa datoja on avattu jo useiden vuosien ajan. Avoin data voi olla raakadataa, tilastoja, kuvia, karttoja tai oikeastaan mitä tahansa koneluettavassa muodossa olevaa tietoa, joka on luvallisesti kaikkien käytössä. Julkisen hallinnon datan avaamisen ideologia ja periaatteet ovat varsin ymmärrettäviä, mutta yritysten ja muun yksityisen datan avaamiseen liittyviä hyödyt ovat vielä osittain hyvien esimerkkien puutteessa hämärän peitossa. Yritysdatan avaamista voi kuitenkin perustella vaikka tiedonhankintapyynnöistä koituvilla kustannussäästöillä, datan laadun parantamisella joukkoistamisen avulla tai tuottamalla maksullisia palveluja yrityksen dataa käyttäville tahoille. Miksei avoin data voisi myös synnyttää suoraan yritysten omaa liiketoimintaa tukevia sovelluksia?

Onko musiikkidataa sitten muualla käytettävissä? Music Hack Day -tapahtuma on hyvä esimerkki tästä. Se on 2009 Lontoossa ensimmäistä kertaa järjestetty musiikkialan oma koodaustapahtuma, joka kokoaa dataa tarjoavia yrityksiä ja sovelluskehittäjiä saman katon alle luomaan uusia palveluja. Tapahtuma on järjestetty useissa maissa ja ensi syksyllä ilmeisesti myös Suomessa Aalto Entrepreneurship Societyn toimesta samoihin aikoihin kuin Slush Helsinki start up- konferenssi. Jos taas olisin itse koodari, menisin varmaan ensi töikseni sekoilemaan metadatafirma The Echo Nestin palveluun.

Jos ajatellaan Teostoa ja dataa, niin valitettavan usein Teostoa sitovat salassapitovelvollisuudet tietoa toimittavien yritysten kanssa, jotka estävät tietojen käytön tai julkisen jakamisen. On kuitenkin kiehtova ajatusleikki. että myös suomalaisen musiikin käyttödata voisi olla uusien palvelujen raaka-aineena. Voisiko tämä olla asia josta musiikkia käyttävät yritysten kanssa voisi sopia?

Elävän musiikin esitystapahtumiin liittyvää dataa on Teostossa pyritty muokkaamaan hyödynnettävään muotoon määrätietoisesti jo muutaman vuoden ajan. Muun muassa Ilosaarirockia järjestävän Joensuun Popmuusikot ry:n käynnistämälle EU-rahoitteiselle Pohjois-Karjalan musiikkialan Pumppu 013 -kehityshankkeelle on toimitettu raakadataa alueen elävän musiikin tapahtumista. Varovaisia askelia eteenpäin siis otetaan jo. Tämän kirjoituksen lopusta löydät infograafin vuoden 2012 elävän musiikin tapahtumista Suomessa Teoston keräämän datan pohjalta.

Helsingin, Espoon, Vantaan, Kauniaisten ja Sitran rahoittamassa loistavassa Helsinki Region Infoshare -palvelussa avataan Helsingin seutua koskevaa tietoa kaikkien saataville. Palvelu tarjotaan dataa kansalaisten, yritysten, yliopistojen, korkeakoulujen, tutkimuslaitosten sekä kuntien hallinnon käyttöön vapaasti ja maksutta. HRI:sta löytyy avoimena datana nyt myös Helsingin kaupunginorkesterin konsertit teoksineen vuodesta 1882 eteenpäin aikasarjana. Aineisto päivitetään kerran vuodessa. Tämä on hyvä esimerkki siitä, minkälaista musiikkidatan avaaminen voi yksinkertaisimmillaan olla. Minkälaisia palveluja sinä haluaisit musiikkidatasta?

 

 

 

Teksti: Turo Pekari, @s1truuna
Kirjoittaja on Teoston tutkija.

Jaa somessa