Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)

Galdera hauen erantzunak lor daitezke Wikidatako datuekin?

  • Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?
  • Zein urtetan plazaratu dira euskarazko musika-album gehien?
  • Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?
  • Mikel Laboa, Benito Lertxundi eta Gatiburen albumak ikus ditzakegu urtez urteko ardatz batean tartekatuta?
  • Nongoak dira euskal musikariak? Zein herritan jaio dira?

2018an antzeko galderak erantzuteko lan ikusgarri bat aurkeztu zen blog honetan bertan, (“Euskal literaturaren armiarma sarea Wikidatan aztergai”), kasu hartan galderak musikari buruz ez, literaturako liburuei buruz izan ziren. Orain, berdin egin daiteke musika-albumekin?

Erantzuna erraza da: “Bai, jakina, datuak edukiz gero egin daiteke”. Wikidata oso tresna baliagarria da; kontsulta, azterketa eta grafika oso interesgarriak sor daitezke, baina horrelakorik ezin da lortu daturik ez badago.

Bada, horixe izan da 2023an Donostiako Informatika Fakultateko ikasle batzuek hartu zuten erronka: erantzun horiek lortu ahal izateko Wikidatako datuak osatzea. Aurretik Wikidatan baziren euskal musikari buruzko datu batzuk, hainbat wikilarik azken 10 urteetan modu soltean sartuak. Horiez gain, Musikasten (https://www.musikasten.eus) eta Badok (https://www.badok.eus) atariek horrelako datu batzuk badituztenez, azkenean atari bietan, batean eta bestean, daudenekin lortu da hainbat kantari, musika-talde eta albumen datuekin multzo minimo bat sortzea, eta horrela goiko galderei erantzun itxuroso bat eman ahal zaie. Ez da erantzun osoa, datu guztiak ez baitaude, baina ideia bat sortzeko balio du eta datu gehiago sartuz gero erantzun zehatzagoak lortu ahal izango dira etorkizunean. Bitartean, gainera, lortutako erantzun horiek beste hizkuntza batzuekin ere kontsulta daitezke, eta horrela hizkuntzen arteko konparazio batzuk ere egin daitezke.

Lan hau teknikoki nola egin dugun azaltzeko xehetasunak bukaeran jarri ditugu, atal hori ez da irakurle guztientzat, antzeko lanak egin nahi dituenarentzat baizik. Hor azaldu dugu konputagailuan zer programatu behar izan dugun eta Wikidatan musika-datu horien errepresentazio estandarra nolakoa den. Bestalde, badok.eus ataria askoz konpletoagoa denez, Wikidatako datuetan sistematikoki gehitu ditugu estekak Badokera bideratzeko. Horrela, klik bakar batean joan ahal izango da erabiltzailea informazio sakonagoaren bila.

Egindako lana eginda, orain Wikidatan datu multzo minimo bat dugula, galderak egin ditzakegu Wikidata kontsultatzeko webgunearen bitartez (query.wikidata.org). Adibidez:

Antzeko galderak dira beste hauek ere:

Beste galdera mota bat:
Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?

Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?Genero artistikoei buruzko galderak:

Euskarazko interpretatzaileen album kopurua urteko, genero artistikoaren arabera. (barra-diagrama)

Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak generoaren arabera?

Beste galdera mota bat:
Nongoak dira euskal musikariak? Zein herritan jaio dira?

Azken galdera bat, kantuei buruz:

Egindako ekarpena

Euskarazko abestiak ezaugarri hauekin: genero artistikoa, musikagilea, noren hitzak eta tonalitatea (gako-armadura).
Erantzuneko taulan 176 kantu baino ez dira agertzen, Wikidatan ez baitago informazio asko kantuei buruz.

Euskal musika-taldeen eta haien albumen zerrenda luzea da. Une honetan badok.eus webgunean 1.350 talde inguru daude. Horietatik 300 talde besterik ez ditugu landu, Wikidatan musikastenID identifikadorea dutenak. Horrela gure lana pisu handieneko interpretatzaileekin bakarrik egin dugu, 300 talde horien Wikidata itemak eta haien albumak (garrantzitsuak diren batzuk, gutxienez) modu koherentean sortzen saiatu gara.

Proiektua amaitu dugun unean, guztira 300interpretatzaileren eta 1144 albumen erregistroak daude Wikidatan. Denek ez dute informazio bera gordetzen, batzuek informazio gehiago dute, baina garrantzitsuena nabarmentzearren, honakoa esan dezakegu:

  1. Egitura estandar bati jarraituz sortuak izan dira. Horri esker, euskal musikarako sortu ditugun SPARQL kontsultak erraz molda daitezke beste hizkuntzekin ere erabiltzeko, frantsesezko albumak bilatzeko, esaterako.
  2. Album guztiek dute informazio minimo bat, garrantzitsuena dena (interpretatzailea, diskoaren izenburua, genero artistikoa, urtea, hizkuntza eta badok.eus-erako esteka).
  3. Denek dute badok.eus webgunerako esteka eta horietako batzuek Musikasten webgunerakoa ere. Wikidatan zeudenei eta esteka ez zutenei gehitu zaie. Horri esker, edozein erabiltzaile klik bakar batean joan ahal izango da zuzenean Badok atarira informazio sakonagoaren bila.

Erabilitako tresna informatikoak

Artikulu honetan aurkezten dugun lana aurrera eramateko erabili behar izan ditugun tresna guztiak aipatzen ditugu atal honetan. Izan ere, jakin badakigu proiektu honek jarraipena izan dezakeela, eta hobekuntzarekin aurrera egiteko prest ager daitezkeen ikasleei ondo etorriko zaiela erabilitako tresnen informazioa izatea.

Tresna informatiko horiek berriak ziren Koldo, Lorea eta Ane ikasleentzat proiektuan lanean hasi ziren unean. Sekula ez zuten Python programazio-lengoaiarekin lan egiteko aukerarik izan, ez zekiten Wikidata nola antolatuta zegoen, ezta Wikipediaren eta Wikidataren arteko lotura nola egiten zen. Proiektu honi esker ikasi dute hori guztia.

Egindako programak eta horien dokumentazioa Ane, Koldo eta Lorearen Github orrian daude:

https://github.com/koldosaurio/WD_Euskal_Musika

Lan honi jarraipena emateko aukera batzuk

  1. Esan bezala, Euskal musikan erreferentzia nagusi den badok.eus atarian 1.350 talde inguru daude guztira, eta horietatik 300 talde besterik ez ditugu landu. Musika-talde eta album gehiago gehitu litezke. Badok atarikoak interesatuta baleude, beren informazio aberatsera kontsultak bideratzeko lagungarri ikusiko balute, eurekin lankidetzan egin liteke.
  2. Euskal musikarientzat sortu ditugun Wikidata erregistroak Wikipediako artikuluekin lotu litezke masiboki, esate baterako, Hertzainak taldekoa dagoen bezala.
  3. Musika-taldeak eta album berriak sortuko dira etorkizunean. Horien datuak gehitu egin beharko dira Wikidatan. Wikilari boluntarioek egin dezakete lan hori banaka-banaka eskuz sartuz, edo lan hori errazteko eta datuak eguneratuta edukitzeko laguntza informatikoak sor litezke.

Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)

Orain bost urte Armiarma datu-basea Wikidatarekin bateratu genuela iragarri genuen, Wikidataren urtebetetzea ospatzeko. Bost urte igarota, berriro ere elkarlana abiatu dugu Susa kideekin euskal literaturaren egoera zein den ikusteko. Armiarma datu-basean dauden 1.051 idazleak parekatu ditugu, eta euskarazko literaturan azken bost urteetan idatzi diren liburuak ere igo ditugu. Honek aukera ematen digu aurretik egin genituen grafikoak gaurkotzeko.

Zenbat liburu argitaratu dira urteko genero artistikoaren arabera?

Oharra: 1958tik aurrera. Datubasearen antolaketa dela eta, poesia kaiera guztiak titulu berdinaren pean agertzen dira.

Zein genero dute euskaraz idatzi duten idazleek?

Zein herrialdetan jaio dira euskarazko idazleak?

Ohar teknikoa: Lapurdi, Nafarroa Beherea eta Zuberoa kategoriak erakusteko, Frantziar estatuan jaio diren idazleak albo batera utzi behar izan dira.

Zeintzuk dira argitaletxe nagusiak?

Oharra: Liburu oso gutxi dituzten argitaletxe batzuk ez dira sailkatu, batez ere argitaletxe horien jarraipena egiteko arazoak direla eta. Era berean, liburu zahar gehienek ez dute argitaletxerik datuen artean.

Zenbat liburu idazten dituzten emakume eta gizonek?

Euskal Wikipediako artikulu guztien artean zenbat dira zortziko txikia neurria duten bertsoenak? Galdera horri erraz erantzuteko modu baten bila ibilita, hasieran Zortziko txikiak kategoria definitu dugu Wikipedian, eta gero bertso eta abesti herrikoien artean joan gara markatzen zortziko txiki direnak. Lehenengo saio bat izan da eta ez da intentsiboa izan, abesti modernoetan ere egongo dira horrelakoak, baina eskuzko markaketa hori bukatutakoan 23 artikulu agertzen dira kategoria honetan. Beheko irudian 25 artikulu daude, baina hor azaltzen diren Bertso eta Zortziko txiki artikuluak ez dira benetako zortziko txikiak.

Zortziko txikiak kategoria

Zortziko txikiak‘ kategoria erabiltzen

Wikipediako kategoria hori definituta, zortziko txikiak lantzeko aukera berriak sortzen dira. Adibidez, Massviews kontsulta bat eginez erraz jakin dezakegu zenbat aldiz bisitatu diren artikulu horiek, eta zein diren bisitatuenak:

Zortziko txiki kontsultatuenak lortzeko Massviews galdera

Hau da kontsulta horren emaitza:

Zortziko txiki kontsultatuenak Wikipedian

Ikusten denez 2022 gabonetako jaietako bisitatuenak hauek izan dira: Behin batean Loiolan, Olentzero joan zaigu, Gernikako arbola, eta Internazionala izan dira.

Berdin oinarrizko beste bertso-neurri batzuekin

Zortziko txikiekin egin den bezala, bertsolaritzako neurri erabilienak diren hauekin ere sortu dira kategoriak:

Neurri txikiaNeurri handia
8 lerro
4 puntu
Zortziko txikiak (4 puntuko txikia)Zortziko handiak (4 puntuko handia)
10 lerro
5 puntu
Hamarreko txikiak (5 puntuko txikia)Hamarreko handiak (5 puntuko handia)
4 lerro
2 puntu
(kopla)
Kopla txikiak (2 puntuko txikia)Kopla handiak (4 puntuko handia)
Neurri erabilienak

Wikidatan ere bai

Wikidatan ere markatu ditugu kategoria horietan sartu diren artikuluak “genero artistikoa” propietatearen bidez. Gainera aipatutako oinarrizko bertso-neurri horiek definitu dira bertso-neurri kontzeptu gisa (Q89522629, poetic form). Bertsoen antolaketa hau, soneto neurriak (hamalaudun) eta ingelesezko hainbat sonetok (esaterako, Shakespeareren Sonnet 57 eta Sonnet 105) Wikidatan duten definizioa aztertu da eta antzeko egitura eman zaie euskarazko bertsolaritzako oinarrizko neurriei.

Definizio horiek eginda, Wikidata kontsulta bakar batekin ikus ditzakegu orain arte Wikidatan dauden bertso guztiak: https://w.wiki/6BuH
kontsulta horretan bertsoaren neurria eta egilea eskatzen dira. Abestien kasuan egilea Noren hitzak propietatearekin definitu ohi denez, balio hori ere erakusten da. Hauek dira kontsultaren emaitzan hasieran azaltzen diren 59 bertsoak:

Wikidatan dauden bertsoak bakoitzaren neurria eta egilearekin

Egitekoak

Listo, bertsoen neurria Wikipedian azaltzeko lehen urratsa (lehen proposamena) eginda dago. Egindako lan hori osatu behar da oraindik, apurka-apurka Wikipedian eta Wikidatan bertso askoren artikuluak gehitu daitezke oraindik. Noski, lan horretan ikaragarrizko laguntza izango da Bertsolaritzaren Datu-basea, zelako ondo egin duten eta zein sakona den sartu duten bertso ezagutza (doinuak, bertsoak, biografiak, saioak, grabazioak…). Itzela. Eskerrik asko!

Laster ikusiko dugu 2022ko Bertsolari Txapelketa Nagusiko finalak eskaintzeko duena. Lehen aldiz historian hiru emakumezko izango dira zortzi bertsolarien artean: titulua defendatzera datorren Maialen Lujanbioz gain, Nerea Ibarzabal eta Alaia Martin izango dira oholtzan. Wikipedian 1935ean egin zen lehen Bertso Gerratik orain arte jokatu diren txapelketa nagusi guztien artikuluak ditugu, baina informazioa ez zegoen ondo antolatuta Wikidatan. Azken egunotan datu horiek antolatzen aritu naiz.

Gehiago irakurri

Wikidataren 10 . urteurrenean hitzaldia bat eta tailer bat antolatu dugu. Zer da eta nola balia dezaket? Informatika ikasten Wikipedia eta Wikidata laborategi gisa hartuta

Gehiago irakurri