Euskal musika-taldeak eta albumak Wikidatan
Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)
Galdera hauen erantzunak lor daitezke Wikidatako datuekin?
- Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?
- Zein urtetan plazaratu dira euskarazko musika-album gehien?
- Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?
- Mikel Laboa, Benito Lertxundi eta Gatiburen albumak ikus ditzakegu urtez urteko ardatz batean tartekatuta?
- Nongoak dira euskal musikariak? Zein herritan jaio dira?
2018an antzeko galderak erantzuteko lan ikusgarri bat aurkeztu zen blog honetan bertan, (“Euskal literaturaren armiarma sarea Wikidatan aztergai”), kasu hartan galderak musikari buruz ez, literaturako liburuei buruz izan ziren. Orain, berdin egin daiteke musika-albumekin?
Erantzuna erraza da: “Bai, jakina, datuak edukiz gero egin daiteke”. Wikidata oso tresna baliagarria da; kontsulta, azterketa eta grafika oso interesgarriak sor daitezke, baina horrelakorik ezin da lortu daturik ez badago.
Bada, horixe izan da 2023an Donostiako Informatika Fakultateko ikasle batzuek hartu zuten erronka: erantzun horiek lortu ahal izateko Wikidatako datuak osatzea. Aurretik Wikidatan baziren euskal musikari buruzko datu batzuk, hainbat wikilarik azken 10 urteetan modu soltean sartuak. Horiez gain, Musikasten (https://www.musikasten.eus) eta Badok (https://www.badok.eus) atariek horrelako datu batzuk badituztenez, azkenean atari bietan, batean eta bestean, daudenekin lortu da hainbat kantari, musika-talde eta albumen datuekin multzo minimo bat sortzea, eta horrela goiko galderei erantzun itxuroso bat eman ahal zaie. Ez da erantzun osoa, datu guztiak ez baitaude, baina ideia bat sortzeko balio du eta datu gehiago sartuz gero erantzun zehatzagoak lortu ahal izango dira etorkizunean. Bitartean, gainera, lortutako erantzun horiek beste hizkuntza batzuekin ere kontsulta daitezke, eta horrela hizkuntzen arteko konparazio batzuk ere egin daitezke.
Lan hau teknikoki nola egin dugun azaltzeko xehetasunak bukaeran jarri ditugu, atal hori ez da irakurle guztientzat, antzeko lanak egin nahi dituenarentzat baizik. Hor azaldu dugu konputagailuan zer programatu behar izan dugun eta Wikidatan musika-datu horien errepresentazio estandarra nolakoa den. Bestalde, badok.eus ataria askoz konpletoagoa denez, Wikidatako datuetan sistematikoki gehitu ditugu estekak Badokera bideratzeko. Horrela, klik bakar batean joan ahal izango da erabiltzailea informazio sakonagoaren bila.
Egindako lana eginda, orain Wikidatan datu multzo minimo bat dugula, galderak egin ditzakegu Wikidata kontsultatzeko webgunearen bitartez (query.wikidata.org). Adibidez:
Antzeko galderak dira beste hauek ere:
- Exkixu, Alex Sardui eta Gatiburen albumak urteen-ardatzean Badokeko erreferentziarekin
- Berri Txarrak taldearen abesti eta albumak (kontsultan diskografiako propietaterik erabili gabe)
- Gatiburen albumak urtez urteko ardatz batean Badokeko erreferentziarekin (diskografiako propietateak erabiliz)
Beste galdera mota bat:
Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?
- Euskarazko musika interpretatzaileak album kopuruaren arabera ordenatuta.(burbuila-diagrama)
- Ingelesezko musika interpretatzaileak album kopuruaren arabera ordenatuta. (burbuila-diagrama, exekuzioak denbora behar du, asko dira eta)
Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?Genero artistikoei buruzko galderak:
Euskarazko interpretatzaileen album kopurua urteko, genero artistikoaren arabera. (barra-diagrama)
- Espainierazko interpretatzaileen album kopurua urteko, genero artistikoaren arabera. (barra-diagrama)
Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak generoaren arabera?
- Euskarazko bakarlarien album kopurua urteko, bakarlariaren sexu edo generoaren arabera. (barra-diagrama)
Beste galdera mota bat:
Nongoak dira euskal musikariak? Zein herritan jaio dira?
Azken galdera bat, kantuei buruz:
- Euskarazko abestiak ezaugarri hauekin: genero artistikoa, musikagilea, noren hitzak eta tonalitatea (gako-armadura).
Erantzuneko taulan 176 kantu baino ez dira agertzen, Wikidatan ez baitago informazio asko kantuei buruz
Egindako ekarpena
Euskarazko abestiak ezaugarri hauekin: genero artistikoa, musikagilea, noren hitzak eta tonalitatea (gako-armadura).
Erantzuneko taulan 176 kantu baino ez dira agertzen, Wikidatan ez baitago informazio asko kantuei buruz.
Euskal musika-taldeen eta haien albumen zerrenda luzea da. Une honetan badok.eus webgunean 1.350 talde inguru daude. Horietatik 300 talde besterik ez ditugu landu, Wikidatan musikastenID identifikadorea dutenak. Horrela gure lana pisu handieneko interpretatzaileekin bakarrik egin dugu, 300 talde horien Wikidata itemak eta haien albumak (garrantzitsuak diren batzuk, gutxienez) modu koherentean sortzen saiatu gara.
Proiektua amaitu dugun unean, guztira 300interpretatzaileren eta 1144 albumen erregistroak daude Wikidatan. Denek ez dute informazio bera gordetzen, batzuek informazio gehiago dute, baina garrantzitsuena nabarmentzearren, honakoa esan dezakegu:
- Egitura estandar bati jarraituz sortuak izan dira. Horri esker, euskal musikarako sortu ditugun SPARQL kontsultak erraz molda daitezke beste hizkuntzekin ere erabiltzeko, frantsesezko albumak bilatzeko, esaterako.
- Album guztiek dute informazio minimo bat, garrantzitsuena dena (interpretatzailea, diskoaren izenburua, genero artistikoa, urtea, hizkuntza eta badok.eus-erako esteka).
- Denek dute badok.eus webgunerako esteka eta horietako batzuek Musikasten webgunerakoa ere. Wikidatan zeudenei eta esteka ez zutenei gehitu zaie. Horri esker, edozein erabiltzaile klik bakar batean joan ahal izango da zuzenean Badok atarira informazio sakonagoaren bila.
Erabilitako tresna informatikoak
Artikulu honetan aurkezten dugun lana aurrera eramateko erabili behar izan ditugun tresna guztiak aipatzen ditugu atal honetan. Izan ere, jakin badakigu proiektu honek jarraipena izan dezakeela, eta hobekuntzarekin aurrera egiteko prest ager daitezkeen ikasleei ondo etorriko zaiela erabilitako tresnen informazioa izatea.
- Pywikibot: https://www.mediawiki.org/wiki/Manual:Pywikibot
- Pywikibot/Wikidata: https://www.mediawiki.org/wiki/Manual:Pywikibot/Wikidata
- Python eta pywikipedia online erabiltzeko aukera: https://hub-paws.wmcloud.org
- OpenRefine: https://openrefine.org/
- SPARQL kontsulta-zerbitzua: https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/Wikidata_Query_Help/eu
- Wikidata Query Service: https://query.wikidata.org/
Tresna informatiko horiek berriak ziren Koldo, Lorea eta Ane ikasleentzat proiektuan lanean hasi ziren unean. Sekula ez zuten Python programazio-lengoaiarekin lan egiteko aukerarik izan, ez zekiten Wikidata nola antolatuta zegoen, ezta Wikipediaren eta Wikidataren arteko lotura nola egiten zen. Proiektu honi esker ikasi dute hori guztia.
Egindako programak eta horien dokumentazioa Ane, Koldo eta Lorearen Github orrian daude:
https://github.com/koldosaurio/WD_Euskal_Musika
Lan honi jarraipena emateko aukera batzuk
- Esan bezala, Euskal musikan erreferentzia nagusi den badok.eus atarian 1.350 talde inguru daude guztira, eta horietatik 300 talde besterik ez ditugu landu. Musika-talde eta album gehiago gehitu litezke. Badok atarikoak interesatuta baleude, beren informazio aberatsera kontsultak bideratzeko lagungarri ikusiko balute, eurekin lankidetzan egin liteke.
- Euskal musikarientzat sortu ditugun Wikidata erregistroak Wikipediako artikuluekin lotu litezke masiboki, esate baterako, Hertzainak taldekoa dagoen bezala.
- Musika-taldeak eta album berriak sortuko dira etorkizunean. Horien datuak gehitu egin beharko dira Wikidatan. Wikilari boluntarioek egin dezakete lan hori banaka-banaka eskuz sartuz, edo lan hori errazteko eta datuak eguneratuta edukitzeko laguntza informatikoak sor litezke.
Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)