Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)

Galdera hauen erantzunak lor daitezke Wikidatako datuekin?

  • Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?
  • Zein urtetan plazaratu dira euskarazko musika-album gehien?
  • Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?
  • Mikel Laboa, Benito Lertxundi eta Gatiburen albumak ikus ditzakegu urtez urteko ardatz batean tartekatuta?
  • Nongoak dira euskal musikariak? Zein herritan jaio dira?

2018an antzeko galderak erantzuteko lan ikusgarri bat aurkeztu zen blog honetan bertan, (“Euskal literaturaren armiarma sarea Wikidatan aztergai”), kasu hartan galderak musikari buruz ez, literaturako liburuei buruz izan ziren. Orain, berdin egin daiteke musika-albumekin?

Erantzuna erraza da: “Bai, jakina, datuak edukiz gero egin daiteke”. Wikidata oso tresna baliagarria da; kontsulta, azterketa eta grafika oso interesgarriak sor daitezke, baina horrelakorik ezin da lortu daturik ez badago.

Bada, horixe izan da 2023an Donostiako Informatika Fakultateko ikasle batzuek hartu zuten erronka: erantzun horiek lortu ahal izateko Wikidatako datuak osatzea. Aurretik Wikidatan baziren euskal musikari buruzko datu batzuk, hainbat wikilarik azken 10 urteetan modu soltean sartuak. Horiez gain, Musikasten (https://www.musikasten.eus) eta Badok (https://www.badok.eus) atariek horrelako datu batzuk badituztenez, azkenean atari bietan, batean eta bestean, daudenekin lortu da hainbat kantari, musika-talde eta albumen datuekin multzo minimo bat sortzea, eta horrela goiko galderei erantzun itxuroso bat eman ahal zaie. Ez da erantzun osoa, datu guztiak ez baitaude, baina ideia bat sortzeko balio du eta datu gehiago sartuz gero erantzun zehatzagoak lortu ahal izango dira etorkizunean. Bitartean, gainera, lortutako erantzun horiek beste hizkuntza batzuekin ere kontsulta daitezke, eta horrela hizkuntzen arteko konparazio batzuk ere egin daitezke.

Lan hau teknikoki nola egin dugun azaltzeko xehetasunak bukaeran jarri ditugu, atal hori ez da irakurle guztientzat, antzeko lanak egin nahi dituenarentzat baizik. Hor azaldu dugu konputagailuan zer programatu behar izan dugun eta Wikidatan musika-datu horien errepresentazio estandarra nolakoa den. Bestalde, badok.eus ataria askoz konpletoagoa denez, Wikidatako datuetan sistematikoki gehitu ditugu estekak Badokera bideratzeko. Horrela, klik bakar batean joan ahal izango da erabiltzailea informazio sakonagoaren bila.

Egindako lana eginda, orain Wikidatan datu multzo minimo bat dugula, galderak egin ditzakegu Wikidata kontsultatzeko webgunearen bitartez (query.wikidata.org). Adibidez:

Antzeko galderak dira beste hauek ere:

Beste galdera mota bat:
Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?

Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?Genero artistikoei buruzko galderak:

Euskarazko interpretatzaileen album kopurua urteko, genero artistikoaren arabera. (barra-diagrama)

Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak generoaren arabera?

Beste galdera mota bat:
Nongoak dira euskal musikariak? Zein herritan jaio dira?

Azken galdera bat, kantuei buruz:

Egindako ekarpena

Euskarazko abestiak ezaugarri hauekin: genero artistikoa, musikagilea, noren hitzak eta tonalitatea (gako-armadura).
Erantzuneko taulan 176 kantu baino ez dira agertzen, Wikidatan ez baitago informazio asko kantuei buruz.

Euskal musika-taldeen eta haien albumen zerrenda luzea da. Une honetan badok.eus webgunean 1.350 talde inguru daude. Horietatik 300 talde besterik ez ditugu landu, Wikidatan musikastenID identifikadorea dutenak. Horrela gure lana pisu handieneko interpretatzaileekin bakarrik egin dugu, 300 talde horien Wikidata itemak eta haien albumak (garrantzitsuak diren batzuk, gutxienez) modu koherentean sortzen saiatu gara.

Proiektua amaitu dugun unean, guztira 300interpretatzaileren eta 1144 albumen erregistroak daude Wikidatan. Denek ez dute informazio bera gordetzen, batzuek informazio gehiago dute, baina garrantzitsuena nabarmentzearren, honakoa esan dezakegu:

  1. Egitura estandar bati jarraituz sortuak izan dira. Horri esker, euskal musikarako sortu ditugun SPARQL kontsultak erraz molda daitezke beste hizkuntzekin ere erabiltzeko, frantsesezko albumak bilatzeko, esaterako.
  2. Album guztiek dute informazio minimo bat, garrantzitsuena dena (interpretatzailea, diskoaren izenburua, genero artistikoa, urtea, hizkuntza eta badok.eus-erako esteka).
  3. Denek dute badok.eus webgunerako esteka eta horietako batzuek Musikasten webgunerakoa ere. Wikidatan zeudenei eta esteka ez zutenei gehitu zaie. Horri esker, edozein erabiltzaile klik bakar batean joan ahal izango da zuzenean Badok atarira informazio sakonagoaren bila.

Erabilitako tresna informatikoak

Artikulu honetan aurkezten dugun lana aurrera eramateko erabili behar izan ditugun tresna guztiak aipatzen ditugu atal honetan. Izan ere, jakin badakigu proiektu honek jarraipena izan dezakeela, eta hobekuntzarekin aurrera egiteko prest ager daitezkeen ikasleei ondo etorriko zaiela erabilitako tresnen informazioa izatea.

Tresna informatiko horiek berriak ziren Koldo, Lorea eta Ane ikasleentzat proiektuan lanean hasi ziren unean. Sekula ez zuten Python programazio-lengoaiarekin lan egiteko aukerarik izan, ez zekiten Wikidata nola antolatuta zegoen, ezta Wikipediaren eta Wikidataren arteko lotura nola egiten zen. Proiektu honi esker ikasi dute hori guztia.

Egindako programak eta horien dokumentazioa Ane, Koldo eta Lorearen Github orrian daude:

https://github.com/koldosaurio/WD_Euskal_Musika

Lan honi jarraipena emateko aukera batzuk

  1. Esan bezala, Euskal musikan erreferentzia nagusi den badok.eus atarian 1.350 talde inguru daude guztira, eta horietatik 300 talde besterik ez ditugu landu. Musika-talde eta album gehiago gehitu litezke. Badok atarikoak interesatuta baleude, beren informazio aberatsera kontsultak bideratzeko lagungarri ikusiko balute, eurekin lankidetzan egin liteke.
  2. Euskal musikarientzat sortu ditugun Wikidata erregistroak Wikipediako artikuluekin lotu litezke masiboki, esate baterako, Hertzainak taldekoa dagoen bezala.
  3. Musika-taldeak eta album berriak sortuko dira etorkizunean. Horien datuak gehitu egin beharko dira Wikidatan. Wikilari boluntarioek egin dezakete lan hori banaka-banaka eskuz sartuz, edo lan hori errazteko eta datuak eguneratuta edukitzeko laguntza informatikoak sor litezke.

Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)

Wikidataren 10 . urteurrenean hitzaldia bat eta tailer bat antolatu dugu. Zer da eta nola balia dezaket? Informatika ikasten Wikipedia eta Wikidata laborategi gisa hartuta

Gehiago irakurri

Urteak dira Informatika Fakultatean lehen mailan programazioa irakasten dudala. Ariketak eta ariketak egin behar ditu ikasleak konputagailu-programak nola idatzi behar diren ikasteko; ehun baino gehiago dira irailetik abendura bitarte egiten dituena.
Erabil dezakegu Wikidata programazio-ariketak egiteko? Esaterako… datu asko dago udalerriei buruz. Saia gaitzen horiek erabiltzen!
Artikulu honetan aurtengo gure ikasleek landu dituzten ariketa eder batzuk erakutsiko ditut.

Ikaslee batek egindako programa baten zati bat
Euskal Herriko udalerrien datu batzuk eskuragarri daude Wikidatan,
EHko udalerrien biztanleria mapa batean

Beti ari gara ariketa abstraktuekin

Gehienetan programazioko ariketetako datuak zenbaki eta testu sinpleak izaten dira, testuingururik gabe eta maila abstraktukoak. Adibidez, ikusi enuntziatu orokor bi hauek:

Ariketa. Batezbestekoa
Zero zenbakiaz amaitzen den eta gutxienez beste zenbaki bat duen zenbaki osozko sekuentzia bat irakurrita, kalkula ezazu sekuentziako zenbaki positiboen batezbesteko aritmetikoa.

Ariketa. Zenbakia bilatu zenbaki ­osozko bektore batean
B oso­ bektore ez ordenatu batean zenbaki bat bilatzeko algoritmoa espezifikatu eta egin. Zenbakia bektorean badago, lehenengo agerpenaren posizioa itzuli beharko da; eta bestela, zero itzuli beharko da. Azpiprograma modura inplementatu.

Enuntziatu orokor horiek ondo daude, balio dute pedagogikoki abstrakzioa lantzeko, baina azken bi urtetan ikusi dut ariketa horietako batzuk datu errealekin egin daitezkeela, eta horrela ikasleak estimu handiagoa hartzen diola ariketari. Kasu horretan, egin duen programa errealitatearekin lotuago dagoela ikusten du ikasleak, ikusten du programatzen jakiteak ate berriak irekitzen dizkiola eguneroko bizitzan aritzeko. Ikusten du ikasgelan egin duen programa horrek, gero koadrilako lagunekin komentatzeko ere balio duela, baita txantxa batzuk egiteko ere, agian.

Ariketarik datu errealekin?

Ildo horretatik aurten urrian, ikastaro erdian ariketa pare hau proposatu diegu ikasleei:

Ariketa.
Gipuzkoako udalerrien batezbesteko biztanleria
Hainbat zenbakiren batezbestekoa kalkulatzen ikasi dugu gaur. Hemen dauzkazue Gipuzkoako udalerrien biztanleria eta azalera: https://w.wiki/ddj
Ea nork esaten didan zein den Gipuzkoako udalerrien batezbesteko azalera eta batezbesteko biztanleria.
Nafarroan? Bizkaian?

Alex Diez, Miren Samaniego, Leire Hernandez, Xabier Irastorza eta Juan Alagonek primeran asmatu zuten 🙂
Gipuzkoako udalerrien biztanle kopuruaren batez bestekoa 8.253 da.

Ariketa.
Zenbat herrikide dituzu Wikipedian?

Zenbat lanbide bakoitzean?
Zure herriko zenbat neska/mutil daude Wikipedian? Zenbat dira jarduera bakoitzean (futbolariak, politikariak, idazleak…) ?
Nondik lortu datuak?  Hemendik: https://w.wiki/BNp

  1. Wikidatako galdera honetan (https://w.wiki/BNp) Agurainen ordez jarri nahi duzun herria
  2. Emaitza esportatu ezazu ‘query.csv’ fitxategira.
  3. Eskuinaldeko ‘Jaitsi’ menuan hartu ezazu ‘CSV fitxategia’ aukera.
  4. Sortu den ‘query.csv’ fitxategia ekarri direktorio honetara.

Tamalez, azken ariketa hori ez zuen inork egin, lanpetuegi-edo egon ziren urriko aste hartan.

Hiru ikasleren programa txukunak Wikidatako datu errealekin

Baina geroago, bukaeran, abenduan, ikasle batzuek trebetasun minimo bat lortuta zutelarik, azken ariketa luze hau proposatu nien, ea inork ekiten zion erronkari:

Ariketa.
EHko udalerri honen antzekoena zein da beste probintzietan? 
Bizilagunen dentsitatea kontuan hartuta (biztanlea/zabalera) Datuak Wikidatatik jaso ditzakegu: EHko udalerrien azalera, biztanleria eta lurraldea (Ipar eta Hegoaldea)
Hortik datuak hartuta… Sartu dena bektore batean (edo probintzia bakoitzerako bektore bat). Kalkulatu dentsitateak eta orduan: Herri bat emanda bilatu beste probintzietako herrien artean zeintzuk diren dentsitate berdintsuak dituztenak

Besterik ez nien esan, beste laguntzarik ez. Ez zen erronka makala, eta irakasgaian landutako kontzeptu gehienak lantzeko balioko zuela uste genuen.
Eta hara! Hiru ikaslek programa zoragarri egin dituzte! Ederto landu dute ariketa eta ebazpen ederrak lortu ere gero. Horietako bik sortutako kodea eta dokumentazioa zuk ere ikus dezakezu, Githuben jarri baitituzte :

Irastorzaren emaitza batzuk. Biztanle dentsitateko herriak lerro bakoitzean.

Adibidez, zein dira biztanle-dentsitatean Gipuzkoako Lezo-rekin antza handiena duten herriak? Irastorzaren programak argi azaltzen du, hauek dira:

Laudio (Araban), Bermeo (Bizkaia), Basusarri (Lapurdi),
Eguesibar (Nafarroa Garaian), Donibane Garazi (Nafarroa_Beherean)
eta Maule-Lextarre (Zuberoan).

Euskal Herriko udalerrien datu batzuk eskuragarri daude Wikidatan,

Mundu osoko datuak, 300 hizkuntzatan

Baina Wikidatako datuak ez dira Euskal Herrikoak bakarrik, mundu osoko datuak dira. Eta gainera emaitzak hainbat hizkuntzatan eskuratu daitezke.
Hori dela-eta… azken ariketa pare bat proposatu diet ikasle horiei, ea baten batek egiten duen, EHkoa eginda edukiz gero beste hau askoz errazagoa da gero. Ezetz asmatu zure programa moldatzen gauza bera egiteko Espainiako udalerri (eta probintziekin) jolasten.

Ariketa.
Antzeko hiriak Amerikako Estatu Batuetan
.
Eta era berean… Estatu Batuetako hiriekin (probintzien ordez estatuak hartuta)?
(https://w.wiki/ufc Ameriketako Estatu Batuetako 10.000 hiri, bakoitza bere probintzia, biztanleria eta azalera)

Ariketa.
Espainiako antzeko udalerriak beste probintziatan
Egin berriro udalerriko ariketa baina esate baterako, Espainiako udalerri eta probintziekin
(https://w.wiki/ufM, Espainiako 6730 udalerri, bakoitza bere probintzia, biztanleria eta azalerarekin)
Edo Frantzian (https://w.wiki/ufJ, Frantziako 10.000 udalerri, bakoitza bere probintzia, biztanleria eta azalerarekin)
Oso aldaketa gutxirekin lortu ahal izango duzu.

Programatzen irakasteko jolastoki berriak

Oso pozik nago ikasle horiek egin dutenarekin, baina oraindik orain ez nago guztiz pozik. Nik proposatzen dizkiedan gaiak nahiko “formalak” edo “aspergarriak” direlako (biztanle kopuruak, azalerak eta halakoak). Oraindik ez dut lortu, baina erne, laster ikasleek eurek aukeratuko dituzte gustuko gaia (filmak? Bideo-jokoak? Kirolariak? Musika taldeak? edo dena delakoa) Eta gai horiei buruzko datuak Wikidatatik hartuta… programak gai horiekin ere erabiliko dituzte. 🙂

Eta koadrilako lagunei erakutsiko diete zer programatu duten.
Laster baietz! 😉

Gora datu irekiak! Gora Wikidata!
Programatzen ikasteko ariketa erakargarriak sortzeko aukera dira eta!

Artikulu honetan, Wikidata ezagutza-basea baliatuz kontsultak eta bistaratzeak nola egin ikusiko dugu. Bi adibide erabiliko ditugu horretarako: lehenbizikoan, Wikipediak gure herri edo auzoari buruz gordetzen duen ondarea bistaratuko dugu mapa batean; bigarrenean berriz, bertsolaritzari emango diogu begiratua, hura kuantitatiboki aztertzeko tresnak erakutsiz.

Gehiago irakurri