Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)

Galdera hauen erantzunak lor daitezke Wikidatako datuekin?

  • Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?
  • Zein urtetan plazaratu dira euskarazko musika-album gehien?
  • Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?
  • Mikel Laboa, Benito Lertxundi eta Gatiburen albumak ikus ditzakegu urtez urteko ardatz batean tartekatuta?
  • Nongoak dira euskal musikariak? Zein herritan jaio dira?

2018an antzeko galderak erantzuteko lan ikusgarri bat aurkeztu zen blog honetan bertan, (“Euskal literaturaren armiarma sarea Wikidatan aztergai”), kasu hartan galderak musikari buruz ez, literaturako liburuei buruz izan ziren. Orain, berdin egin daiteke musika-albumekin?

Erantzuna erraza da: “Bai, jakina, datuak edukiz gero egin daiteke”. Wikidata oso tresna baliagarria da; kontsulta, azterketa eta grafika oso interesgarriak sor daitezke, baina horrelakorik ezin da lortu daturik ez badago.

Bada, horixe izan da 2023an Donostiako Informatika Fakultateko ikasle batzuek hartu zuten erronka: erantzun horiek lortu ahal izateko Wikidatako datuak osatzea. Aurretik Wikidatan baziren euskal musikari buruzko datu batzuk, hainbat wikilarik azken 10 urteetan modu soltean sartuak. Horiez gain, Musikasten (https://www.musikasten.eus) eta Badok (https://www.badok.eus) atariek horrelako datu batzuk badituztenez, azkenean atari bietan, batean eta bestean, daudenekin lortu da hainbat kantari, musika-talde eta albumen datuekin multzo minimo bat sortzea, eta horrela goiko galderei erantzun itxuroso bat eman ahal zaie. Ez da erantzun osoa, datu guztiak ez baitaude, baina ideia bat sortzeko balio du eta datu gehiago sartuz gero erantzun zehatzagoak lortu ahal izango dira etorkizunean. Bitartean, gainera, lortutako erantzun horiek beste hizkuntza batzuekin ere kontsulta daitezke, eta horrela hizkuntzen arteko konparazio batzuk ere egin daitezke.

Lan hau teknikoki nola egin dugun azaltzeko xehetasunak bukaeran jarri ditugu, atal hori ez da irakurle guztientzat, antzeko lanak egin nahi dituenarentzat baizik. Hor azaldu dugu konputagailuan zer programatu behar izan dugun eta Wikidatan musika-datu horien errepresentazio estandarra nolakoa den. Bestalde, badok.eus ataria askoz konpletoagoa denez, Wikidatako datuetan sistematikoki gehitu ditugu estekak Badokera bideratzeko. Horrela, klik bakar batean joan ahal izango da erabiltzailea informazio sakonagoaren bila.

Egindako lana eginda, orain Wikidatan datu multzo minimo bat dugula, galderak egin ditzakegu Wikidata kontsultatzeko webgunearen bitartez (query.wikidata.org). Adibidez:

Antzeko galderak dira beste hauek ere:

Beste galdera mota bat:
Euskal musika-talde eta kantarien artean, zeintzuk dira album gehien plazaratu dituztenak?

Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak genero artistikoaren arabera? Eta sexu edo generoaren arabera?Genero artistikoei buruzko galderak:

Euskarazko interpretatzaileen album kopurua urteko, genero artistikoaren arabera. (barra-diagrama)

Beste galdera mota bat:
Nola eboluzionatu du urtez urte euskarazko albumen kopuruak generoaren arabera?

Beste galdera mota bat:
Nongoak dira euskal musikariak? Zein herritan jaio dira?

Azken galdera bat, kantuei buruz:

Egindako ekarpena

Euskarazko abestiak ezaugarri hauekin: genero artistikoa, musikagilea, noren hitzak eta tonalitatea (gako-armadura).
Erantzuneko taulan 176 kantu baino ez dira agertzen, Wikidatan ez baitago informazio asko kantuei buruz.

Euskal musika-taldeen eta haien albumen zerrenda luzea da. Une honetan badok.eus webgunean 1.350 talde inguru daude. Horietatik 300 talde besterik ez ditugu landu, Wikidatan musikastenID identifikadorea dutenak. Horrela gure lana pisu handieneko interpretatzaileekin bakarrik egin dugu, 300 talde horien Wikidata itemak eta haien albumak (garrantzitsuak diren batzuk, gutxienez) modu koherentean sortzen saiatu gara.

Proiektua amaitu dugun unean, guztira 300interpretatzaileren eta 1144 albumen erregistroak daude Wikidatan. Denek ez dute informazio bera gordetzen, batzuek informazio gehiago dute, baina garrantzitsuena nabarmentzearren, honakoa esan dezakegu:

  1. Egitura estandar bati jarraituz sortuak izan dira. Horri esker, euskal musikarako sortu ditugun SPARQL kontsultak erraz molda daitezke beste hizkuntzekin ere erabiltzeko, frantsesezko albumak bilatzeko, esaterako.
  2. Album guztiek dute informazio minimo bat, garrantzitsuena dena (interpretatzailea, diskoaren izenburua, genero artistikoa, urtea, hizkuntza eta badok.eus-erako esteka).
  3. Denek dute badok.eus webgunerako esteka eta horietako batzuek Musikasten webgunerakoa ere. Wikidatan zeudenei eta esteka ez zutenei gehitu zaie. Horri esker, edozein erabiltzaile klik bakar batean joan ahal izango da zuzenean Badok atarira informazio sakonagoaren bila.

Erabilitako tresna informatikoak

Artikulu honetan aurkezten dugun lana aurrera eramateko erabili behar izan ditugun tresna guztiak aipatzen ditugu atal honetan. Izan ere, jakin badakigu proiektu honek jarraipena izan dezakeela, eta hobekuntzarekin aurrera egiteko prest ager daitezkeen ikasleei ondo etorriko zaiela erabilitako tresnen informazioa izatea.

Tresna informatiko horiek berriak ziren Koldo, Lorea eta Ane ikasleentzat proiektuan lanean hasi ziren unean. Sekula ez zuten Python programazio-lengoaiarekin lan egiteko aukerarik izan, ez zekiten Wikidata nola antolatuta zegoen, ezta Wikipediaren eta Wikidataren arteko lotura nola egiten zen. Proiektu honi esker ikasi dute hori guztia.

Egindako programak eta horien dokumentazioa Ane, Koldo eta Lorearen Github orrian daude:

https://github.com/koldosaurio/WD_Euskal_Musika

Lan honi jarraipena emateko aukera batzuk

  1. Esan bezala, Euskal musikan erreferentzia nagusi den badok.eus atarian 1.350 talde inguru daude guztira, eta horietatik 300 talde besterik ez ditugu landu. Musika-talde eta album gehiago gehitu litezke. Badok atarikoak interesatuta baleude, beren informazio aberatsera kontsultak bideratzeko lagungarri ikusiko balute, eurekin lankidetzan egin liteke.
  2. Euskal musikarientzat sortu ditugun Wikidata erregistroak Wikipediako artikuluekin lotu litezke masiboki, esate baterako, Hertzainak taldekoa dagoen bezala.
  3. Musika-taldeak eta album berriak sortuko dira etorkizunean. Horien datuak gehitu egin beharko dira Wikidatan. Wikilari boluntarioek egin dezakete lan hori banaka-banaka eskuz sartuz, edo lan hori errazteko eta datuak eguneratuta edukitzeko laguntza informatikoak sor litezke.

Koldo Etxaniz*, Galder Gonzalez**, Lorea Loinaz*, Ane Paniagua*, Kepa Sarasola* ** eta Ana Zelaia*
.* Informatika Fakultatea, UPV/EHU
.** Euskal Wikilarien Kultur Elkartea (EWKE)

Gehiago irakurri

Elhuyarrek sortutako elia.eus itzultzaile neuronala dagoeneko Wikipedian erabil daiteke, zuzenean, Elhuyarrek, Euskal Wikilarien Kultura Elkarteak eta Wikimedia Fundazioak egindako elkarlanari esker. Eliaren bidez, euskara, ingelesa, gaztelania, frantsesa, katalana eta galegoaren artean itzul daiteke, artikuluak sortzea azkartuz, hizkuntzen arteko ezagutza areagotuz eta munduko ezagutza guztia euskaraz egon dadin erraztuz. Wikilariok hilabete batzuk daramatzagu tresna berri hau erabiltzen, eta emaitzak oso onak dira. Artikulu honetan, tresna nola erabili azalduko dizugu.

ContentTranslation: artikulua aukeratu

ContentTranslation edukiak itzultzeko Wikimediaren tresna da. Bertan artikulu bat aukeratu dezakegu eta itzuli. Horretarako, beharrezkoa izango da Wikipedian kontu bat sortzea (ez baduzu, egizu orain!). Bi aukera dituzu sartzeko: zuzenean Berezi:ContentTranslation jarrita Wikipediako bilatzailean edo, bestela, zure erabiltzaile menuan dagoen “Itzulpenak” botoiaren gainean klik eginda.

Hor “+ Itzulpen berria” botoian sakatuko dugu eta aukeratuko dugu zein artikulu itzuli nahi dugun. Gure adibidean, “Mia Mottley” artikulua aukeratuko dugu, oraintxe Errepublika izendatu den Barbados uharteko lehen ministroa.

Gaztelaniatik itzuli nahi dugula esango diogu (nahiz eta beste hizkuntza batetik ere egin daitekeen), eta izenaren gainean klik egin ostean, “Hasi itzultzen” sakatuko dugu:

Artikulua itzultzen hasi

Sistemak bi zutabetako egitura bat erakutsiko digu. Ezkerrean jatorrizko testua dago, eskuman, gure itzulpena egongo da. Goian, kasu honetan, izen berbera izango dute biek (Mia Mottley izena ez da aldatzen). Baina izenburua aldatu behar bada, bertan egin beharko duzu.

Paragrafo bakoitzaren ondoan klik eginez eskumako zutabean, aukera izango dugu itzulpena egiteko. Eskumako menuan “Elia.eus” aukeratuko dugu eta “Gorde lehenetsitzat”, beti aukera hau ager dadin.

Paragrafo baten itzulpena. Ikusten denez, testua ez da guztiz zuzena. Hori hobetu beharko dugu, eskuz.

Testua itzultzeaz gain, akaso moldaketak ere egin behako dira. Kasu honetan, adibidez, jada egindako zerbait etorkizunean gertatuko zela iragartzen zen. Euskarazko testuan, jada hori aldatuko dugu.

Behin testuarekin ados egonda, goian dagoen “Argitaratu” botoian sakatuko dugu. Baliteke hor esatea testua ez dugula nahikoa aldatu, eta ez uztea argitaratzen. Izan ere, sistemak ez du berrikusi gabeko itzulpenik argitaratzen uzten. Beti aldatu beharko dugu hitzen bat, esamolderen bat edo esaldiren bat, berrikusi dugula ziurtatzeko. Behin hori eginda, argitaratzeko prest egongo da.

Ez baduzu amaitzen, lasai. Itzulpenarekin egindako aurrerapena gordeko da eta ContentTranslation webgunera itzultzen zaren hurrengoan, hor izango duzu ere jarraitzeko edo argitaratu ahal izateko.

Argitaratu ostean, zer?

Argitaratu ostean detaile txikiak konpontzeke daude, adibidez formatu arazoak, txantiloiren bat edo falta diren kategoriak. Hau eskuz egin daiteke ondoren. Adibidez, “Aldatu > Txertatu > Txantiloia” klikatuz gero, “Biografia infotaula automatikoa” sartu ahal diogu kasu honetan.

Argitaratutako artikuluak itxura hau izango du: https://eu.wikipedia.org/wiki/Mia_Mottley

Eskerrik asko Elhuyar, opari eder honengatik. Orain zure txanda da!

Gehiago irakurri

Wikimedia proiektuetan 3D objektuak igotzeko aukera dagoela probestuz, Martin Etxauri artistak Elhuyar Sorkuntza Bekaren baitan sortu zituen Euskal Herriko zuhaitzen azalen 3D ereduak igo ditu. Fossil Plastics proiektuaren baitan bertako hamahiru zuhaitzen azalen fotogrametria egin eta 3D inpresora batekin plastikoan erreproduzitu ahal izateko ereduak sortu zituen.

Gehiago irakurri

Urteak dira Informatika Fakultatean lehen mailan programazioa irakasten dudala. Ariketak eta ariketak egin behar ditu ikasleak konputagailu-programak nola idatzi behar diren ikasteko; ehun baino gehiago dira irailetik abendura bitarte egiten dituena.
Erabil dezakegu Wikidata programazio-ariketak egiteko? Esaterako… datu asko dago udalerriei buruz. Saia gaitzen horiek erabiltzen!
Artikulu honetan aurtengo gure ikasleek landu dituzten ariketa eder batzuk erakutsiko ditut.

Ikaslee batek egindako programa baten zati bat
Euskal Herriko udalerrien datu batzuk eskuragarri daude Wikidatan,
EHko udalerrien biztanleria mapa batean

Beti ari gara ariketa abstraktuekin

Gehienetan programazioko ariketetako datuak zenbaki eta testu sinpleak izaten dira, testuingururik gabe eta maila abstraktukoak. Adibidez, ikusi enuntziatu orokor bi hauek:

Ariketa. Batezbestekoa
Zero zenbakiaz amaitzen den eta gutxienez beste zenbaki bat duen zenbaki osozko sekuentzia bat irakurrita, kalkula ezazu sekuentziako zenbaki positiboen batezbesteko aritmetikoa.

Ariketa. Zenbakia bilatu zenbaki ­osozko bektore batean
B oso­ bektore ez ordenatu batean zenbaki bat bilatzeko algoritmoa espezifikatu eta egin. Zenbakia bektorean badago, lehenengo agerpenaren posizioa itzuli beharko da; eta bestela, zero itzuli beharko da. Azpiprograma modura inplementatu.

Enuntziatu orokor horiek ondo daude, balio dute pedagogikoki abstrakzioa lantzeko, baina azken bi urtetan ikusi dut ariketa horietako batzuk datu errealekin egin daitezkeela, eta horrela ikasleak estimu handiagoa hartzen diola ariketari. Kasu horretan, egin duen programa errealitatearekin lotuago dagoela ikusten du ikasleak, ikusten du programatzen jakiteak ate berriak irekitzen dizkiola eguneroko bizitzan aritzeko. Ikusten du ikasgelan egin duen programa horrek, gero koadrilako lagunekin komentatzeko ere balio duela, baita txantxa batzuk egiteko ere, agian.

Ariketarik datu errealekin?

Ildo horretatik aurten urrian, ikastaro erdian ariketa pare hau proposatu diegu ikasleei:

Ariketa.
Gipuzkoako udalerrien batezbesteko biztanleria
Hainbat zenbakiren batezbestekoa kalkulatzen ikasi dugu gaur. Hemen dauzkazue Gipuzkoako udalerrien biztanleria eta azalera: https://w.wiki/ddj
Ea nork esaten didan zein den Gipuzkoako udalerrien batezbesteko azalera eta batezbesteko biztanleria.
Nafarroan? Bizkaian?

Alex Diez, Miren Samaniego, Leire Hernandez, Xabier Irastorza eta Juan Alagonek primeran asmatu zuten 🙂
Gipuzkoako udalerrien biztanle kopuruaren batez bestekoa 8.253 da.

Ariketa.
Zenbat herrikide dituzu Wikipedian?

Zenbat lanbide bakoitzean?
Zure herriko zenbat neska/mutil daude Wikipedian? Zenbat dira jarduera bakoitzean (futbolariak, politikariak, idazleak…) ?
Nondik lortu datuak?  Hemendik: https://w.wiki/BNp

  1. Wikidatako galdera honetan (https://w.wiki/BNp) Agurainen ordez jarri nahi duzun herria
  2. Emaitza esportatu ezazu ‘query.csv’ fitxategira.
  3. Eskuinaldeko ‘Jaitsi’ menuan hartu ezazu ‘CSV fitxategia’ aukera.
  4. Sortu den ‘query.csv’ fitxategia ekarri direktorio honetara.

Tamalez, azken ariketa hori ez zuen inork egin, lanpetuegi-edo egon ziren urriko aste hartan.

Hiru ikasleren programa txukunak Wikidatako datu errealekin

Baina geroago, bukaeran, abenduan, ikasle batzuek trebetasun minimo bat lortuta zutelarik, azken ariketa luze hau proposatu nien, ea inork ekiten zion erronkari:

Ariketa.
EHko udalerri honen antzekoena zein da beste probintzietan? 
Bizilagunen dentsitatea kontuan hartuta (biztanlea/zabalera) Datuak Wikidatatik jaso ditzakegu: EHko udalerrien azalera, biztanleria eta lurraldea (Ipar eta Hegoaldea)
Hortik datuak hartuta… Sartu dena bektore batean (edo probintzia bakoitzerako bektore bat). Kalkulatu dentsitateak eta orduan: Herri bat emanda bilatu beste probintzietako herrien artean zeintzuk diren dentsitate berdintsuak dituztenak

Besterik ez nien esan, beste laguntzarik ez. Ez zen erronka makala, eta irakasgaian landutako kontzeptu gehienak lantzeko balioko zuela uste genuen.
Eta hara! Hiru ikaslek programa zoragarri egin dituzte! Ederto landu dute ariketa eta ebazpen ederrak lortu ere gero. Horietako bik sortutako kodea eta dokumentazioa zuk ere ikus dezakezu, Githuben jarri baitituzte :

Irastorzaren emaitza batzuk. Biztanle dentsitateko herriak lerro bakoitzean.

Adibidez, zein dira biztanle-dentsitatean Gipuzkoako Lezo-rekin antza handiena duten herriak? Irastorzaren programak argi azaltzen du, hauek dira:

Laudio (Araban), Bermeo (Bizkaia), Basusarri (Lapurdi),
Eguesibar (Nafarroa Garaian), Donibane Garazi (Nafarroa_Beherean)
eta Maule-Lextarre (Zuberoan).

Euskal Herriko udalerrien datu batzuk eskuragarri daude Wikidatan,

Mundu osoko datuak, 300 hizkuntzatan

Baina Wikidatako datuak ez dira Euskal Herrikoak bakarrik, mundu osoko datuak dira. Eta gainera emaitzak hainbat hizkuntzatan eskuratu daitezke.
Hori dela-eta… azken ariketa pare bat proposatu diet ikasle horiei, ea baten batek egiten duen, EHkoa eginda edukiz gero beste hau askoz errazagoa da gero. Ezetz asmatu zure programa moldatzen gauza bera egiteko Espainiako udalerri (eta probintziekin) jolasten.

Ariketa.
Antzeko hiriak Amerikako Estatu Batuetan
.
Eta era berean… Estatu Batuetako hiriekin (probintzien ordez estatuak hartuta)?
(https://w.wiki/ufc Ameriketako Estatu Batuetako 10.000 hiri, bakoitza bere probintzia, biztanleria eta azalera)

Ariketa.
Espainiako antzeko udalerriak beste probintziatan
Egin berriro udalerriko ariketa baina esate baterako, Espainiako udalerri eta probintziekin
(https://w.wiki/ufM, Espainiako 6730 udalerri, bakoitza bere probintzia, biztanleria eta azalerarekin)
Edo Frantzian (https://w.wiki/ufJ, Frantziako 10.000 udalerri, bakoitza bere probintzia, biztanleria eta azalerarekin)
Oso aldaketa gutxirekin lortu ahal izango duzu.

Programatzen irakasteko jolastoki berriak

Oso pozik nago ikasle horiek egin dutenarekin, baina oraindik orain ez nago guztiz pozik. Nik proposatzen dizkiedan gaiak nahiko “formalak” edo “aspergarriak” direlako (biztanle kopuruak, azalerak eta halakoak). Oraindik ez dut lortu, baina erne, laster ikasleek eurek aukeratuko dituzte gustuko gaia (filmak? Bideo-jokoak? Kirolariak? Musika taldeak? edo dena delakoa) Eta gai horiei buruzko datuak Wikidatatik hartuta… programak gai horiekin ere erabiliko dituzte. 🙂

Eta koadrilako lagunei erakutsiko diete zer programatu duten.
Laster baietz! 😉

Gora datu irekiak! Gora Wikidata!
Programatzen ikasteko ariketa erakargarriak sortzeko aukera dira eta!

Gehiago irakurri

Euskal Wikilarien Kultura Elkarteak EHUrekin batera lantzen duen hezkuntza programaren baitan proiektu berri bat abiatu genuen iaz Informatika Fakultatean. Kepa Sarasolaren ikasleek euskarazko hizkuntza baliabideak erabiliz programaren bat egin behar zuten, eta Wikimedia erabiliz proposamen batzuk egin genizkien. Horietako bat, katalanez egindako MineralBot programaren euskarazko bertsioa lantzea, 2019ra arte deskribatutako mineral guztien artikuluak egiteko. EUMineralBot proiektua jaio zen, MinDat webgunetik datuak atera eta euskaratzen zituena, baina mineralen artikuluak ez ziren igo, sistemak ondo funtzionatu bazuen ere, akats nahiko baitzituen.

Gehiago irakurri

iItzulpen automatikoak jauzi ikaragarria egin du kalitatean azken bi urtetan, euskararako itzultzaile neuronalek ere bai. Itzulpenaren emaitza kalitate handikoa izaten da eta gainera modu masiboan erabil daiteke. Horrek aukera ezin hobea ekarri digu, orain Euskal Wikipediara askoz artikulu gehiago, testu-eduki askoz handiagoak ekar ditzakegu eta erraztasun handiagoarekin.

Bai, hasieran halaxe dirudi, baina kontuz ibili behar da. Kalitate handikoa baldin bada ere, itzulpen automatikoaren emaitza gainbegiratu egin behar du pertsona batek, gero zuzendu egin behar da, “posteditatu” egin behar dela esaten dugu. Horrek garrantzi itzela du. Testu itzuliaren postedizioa egiten ez badugu arrisku handia dago laster batean Wikipediako testu-zati askotan  kalitatea jaisteko.Hezkuntza Programan bereziki garrantzitsua da hori. Parte hartzen duten ikasleen lana artikulu bat automatikoki itzultzea baino ez bada, itxuraz emaitza oso txukuna da baina errealitatean ez da horrela izango. Testu itzulia zuzentzea, guztiz koherentea eta ulergarria uztea, ezinbestekoa da. Ikasleak berak egiten ez badu, irakasleek (edo wikilariek) egin beharko dute gero, eta hori lan handiegia izan daiteke hauentzat. Ikasleak, itzulpena erabili nahi badu, aurrikusi behar du gero testu itzuliaren zuzenketa egin beharko duela, eta horren arabera neurtu zenbat testu gehituko duen.

Ikus dezagun adibide bat. ingelesezko Wikipediako Password artikulutik  euskal Wikipediako Pasahitz artikulura  60.000 karaktereko ekarpena egin da. Ingelesezko artikulua bikaina zen, eta orain primerako artikulua da euskaraz ere. Lan itzela, ekarpen esanguratsua izan da euskarara hori ekartzea.  Baina paragrafo eder bat nahiko ulergaitz geratu zen.  Erromatar armadan kontsignak (pasahitzak) nola erabiltzen ziren azaltzen duen pasarte historiko hau zen:

Gauerako kontsignaren pasabidea ziurtatzeko modua honako hau da: infanteriako eta zalditeriako klase bakoitzeko hamargarren kirtenetik, kalearen beheko muturrean kanpatuta dagoen kirtenetik, gizon bat aukeratzen da guardiatik kanporatua izateko, eta arratsaldero joaten da tribunako dendara, eta harengandik kontsigna jasotzen du – Egurrezko ohol bat da, bertan idatzirik hitz bat duena –. – Agur esan eta bere geletara itzultzean kontsignak eta ohola lekukoen aurrean pasatzen dizkio hurrengo mangoko komandanteari, eta honek, berriz, Denek gauza bera egiten dute lehen manikietara iristen den arte, tribunoen dendetatik gertu kanpatutakoak. Azken horiek taula eman behar diete tribunalei, ilundu baino lehen. Beraz, jaulkitako guztiak itzuliak badira, tribunoak badaki kontsigna maniki guztiei emana izan dela, eta guztiengandik pasatu dela berarengana itzultzeko bidean. Horietakoren bat falta bada, berehala ikertzen du, marken arabera badakielako zein alderditatik ez den taula itzuli, eta geldialdiaren arduradunak merezi duen zigorra jasotzen du.

Testua euskaraz ondo eratuta dago, gainetik irakurrita ondo dagoela dirudi. Baina apur bat sakonduta, ondo ulertu nahi bada paragrafoaren esanahia, arazoak agertzen dira. Adibidez, manikiak azaltzen dira testuan. Zer dira maniki horiek? Ingelesezko jatorrizko testura joanda:

The way in which they secure the passing round of the watchword for the night is as follows: from the tenth maniple of each class of infantry and cavalry, the maniple which is encamped at the lower end of the street, a man is chosen who is relieved from guard duty, and he attends every day at sunset at the tent of the tribune, and receiving from him the watchword—that is a wooden tablet with the word inscribed on it – takes his leave, and on returning to his quarters passes on the watchword and tablet before witnesses to the commander of the next maniple, who in turn passes it to the one next him. All do the same until it reaches the first maniples, those encamped near the tents of the tribunes. These latter are obliged to deliver the tablet to the tribunes before dark. So that if all those issued are returned, the tribune knows that the watchword has been given to all the maniples, and has passed through all on its way back to him. If any one of them is missing, he makes inquiry at once, as he knows by the marks from what quarter the tablet has not returned, and whoever is responsible for the stoppage meets with the punishment he merits.

Ingelesezko testuan ez dago maniki bezalakorik, hor maniple azaltzen da, Wikipediako estekarekin gainera, esteka horrek euskarazko manipulo artikulura eramaten gaitu, erromatarrek soldadu multzoak antolatzeko erabiltzen zuten unitate bat zena. Ingelesezko paragrafoan bost aldiz azaltzen zen maniple, baina euskarazko itzulpenean hiru modu desberdinetara itzuli da: kirten, mango eta maniki. Ederra zorabioa! Antzekoa gertatu tribune hitzarekin, soldaduen nagusia dena euskaraz tribunoa da, baina testuan itzuli izan da tribuna (tribunoaren denda  –> tribunako denda)  eta tribunal moduan ere (taula eman behar diete tribunoei –> taula eman behar diete tribunalei). Horixe, ederra zorabioa, hori irakurrita hartu duguna! Ulertzerik ez badago… zuzendu egin beharko da. Ziur oraindik hobekuntzarik onartuko duela, baina apur bat ulergarriago honela geratu da paragrafoa:

Gauerako kontsignaren pasabidea ziurtatzeko modua honako hau da: infanteriako eta zalditeriako klase bakoitzeko hamargarren unitatetik (manipulotik), kalearen beheko muturrean kanpatuta dagoen manipulotik, gizon bat aukeratzen da guardia-zerbitzutik salbuetsia izateko, eta arratsaldero joaten da tribunoaren dendara, eta harengandik kontsigna bat jasotzen du — hitz bat idatzirik duen egurrezko ohol bat dena—. Agur esan eta bere geletara itzultzean kontsigna eta ohola lekukoen aurrean pasatzen dizkio hurrengo manipuloko komandanteari, eta honek berriro hurrengokoari, Denek gauza bera egiten dute lehen manipuloetara iristen den arte, tribunoaren dendatik gertu kanpatutakoak. Azken horiek taula eman behar diote tribunoari, ilundu baino lehen. Beraz, jaulkitako guztiak itzuliak badira, tribunoak badaki kontsigna manipulo guztiei emana izan dela, eta guztiengandik pasatu dela berarengana itzultzeko bidean. Horietakoren bat falta bada, berehala ikertzen du, marken arabera badakielako zein alderditatik ez den taula itzuli, eta gelditzearen arduradunak merezi duen zigorra jasotzen du.

Kontua da 50 minutu behar izan direla zuzenketa hori egiteko. Irakasleak (edo wikilariak) egindako zuzentze-lana txikia izan dela dirudi, egin duen karaktere-gehikuntza ikusita bederen (ia ordubete 348 karaktere bakarrik gehitzeko). Merezi izan du, bai, orain dezente hobeto ulertzen da, baina argitaratu den itzulpen hura gordin-gordina izanik denbora eta lan asko behar izan da zuzentzeko.

Ondorioz, asumitu behar dugu itzulpen automatikoa erabiliz gero erantzukizun handia hartzen dugula, gero testu hori ondo orrazteko, ulergarri eta atsegin bihurtzeko. Itzulpen automatikoa tresna itzela da; askoz artikulu gehiago, testu-eduki askoz handiagoak ekartzen ari gara Wikipediara eta erraztasun handiagoarekin; baina, kontuz, itzulpen automatikoa erabili eta gero… ‘giza zuzenketa’ behar da.

Gehiago irakurri

Wikidata eta Wikimedia Commonsi esker artea bilatzea inoiz baino errazagoa da. Blog sarrera honetan antzeko funtzioak dituzten hiru tresna erakutsiko dizkizuegu: openArtBrowser, Crotos eta art.wikidata.link. Baina, lehenago, sarreratxo bat euren atzean dagoen funtzionamenduaren inguruan.

Wikimedian artea sailkatzen

Wikimedian artea sailkatzen aritu gara azken urteotan wikilariok. Libreak diren artelanak igo (egilea orain dela 70 urte baino gehiago hil bada, kasu gehienetan) Wikimedia Commonsera, artelan horiek katalogatu eta bertan agertzen dena deskribatu Wikidatan eta informazio horrekin Wikipediako artikuluak sortu ditugu.

Baina behin katalogoa egin dugula posible da Wikidatan dagoen datu-baseko informazioa baliatzea beste tresna batzuk sortzeko. Wikidatan, laburrean azaltzeko, artelan baten oinarrizko informazioa biltzen dugu: norena den, zein mugimendukoa, zer material, garaia, non dagoen, zer agertzen den… adibidez, hau da Giocondaren Wikidata orrialdea. Tarte bat hartzen baduzu, ikusiko duzu datu bidezko deskribapen horri esker posible dela beste bilaketa batzuk egitea: egile baten obra guztiak, mugimendu batekoak, material bat dutenak, garai batekoak, museoaren arabera, edo koadroan agertzen diren kontzeptuena. Eta artelan hori Wikimedia Commonsera igo bada, aukera izango dugu bai artelana ikusteko (kasu batzuetan erresoluzio oso altuan) zein Wikipedia artikuluak irakurtzeko existitzen badira.

Ikus ditzagun adibide batzuk.

openArtBrowser

openArtBrowser Hochschule Darmstadt unibertsitateko ikasle batek abiatutako proiektua da. Modu oso ikusgarri batean erakusten dizkigu Wikidatako eta Commonseko datuak: egileka, mugimenduka, gaika, garaiaren arabera… bilatzeko aukera izango dugu, eta emaitzak ere denbora lerro batean ikusteko aukera izango dugu.

Edozein artelan aukeratzen badugu, aukera izango dugu ere antzeko artelanak ikusteko azpian: egile berberarenak, museo berberean daudenak, gai antzekoa dutenak… eta gainera artelan horretan agertzen diren gaiak ere ikusi ahal izango ditugu, berriak aukeratuz.

Adibide gisa, saia zaitezke Bilboko Arte Eder museoan dauden artelanetako batzuk ikusten: https://openartbrowser.org/en/location/Q127064

Momentuz ez dago euskaraz, bai ingelesez, gaztelaniaz eta frantsesez.

Crotos

Crotos aurrekoak egiten duenaren antza du, baina badu berezitasun bat: filtratzeko aukera izango dugu gure bilaketatan, eta Wikipediarako loturak zein tamaina handian ikusteko aukerak askoz ikusgarriagoak dira. Euskaraz ere ez dago, baina hizkuntza askotan duzu eskuragarri.

Bilatzailean nahi duguna idatziko dugu (egile bat, kontzeptu bat, mugimendu bat…) eta ondoren emango dizkigu Wikidatan dauden emaitzak. Emaitza horietan aukera izango dugu material motaren arabera irabazteko (koadroa, eskultura, marrazkia…) eta denbora lerroan ere irabazteko (goian eskuman dagoen -40.000 – 2016 hori), baita HD, irudia badagoen edo ez, edo Wikipedian artikulurik ote dagoen ikusteko.

Hemen ikus dezakegu Louvreko museoan dauden 1700 eta 1830 arteko margolanak, HD irudia dutenak eta Wikipediako artikulu bat.

Artelan bakoitzaren azpian ikus dezakegu ea kalitate handiko irudirik ote dagoen, Wikipediako artikulua zein den eta Wikidata zein Commonserako loturak.

Lotura horien bidez aukera polita izango dugu artelanari buruz gehiago jakiteko, eta bilaketa interesgarriak egiteko.

art.wikidata.link

art.wikidata.link ez da aurrekoak bezalakoa: honetan parte hartu dezakegu eta deskribapenik ez duten artelanak deskribatu. Bertan badago aukera bilaketak egiteko (Browse jartzen duen botoian; momentuz ingelesez baino ez da existitzen), baina interesgarriena da Wikipedian kontu bat izanez gero eskaintzen dizkigun ausazko artelanak katalogatu ahal ditugula.

Honen inguruan gehiago jakiteko, ikus https://eu.wikipedia.org/wiki/Atari:Hezkuntza/Lehen_Hezkuntza/Ingelesa_ikasi_artelan_bat_deskribatuz

Gehiago irakurri

Egunean Behin mugikorreko joko-aplikazioan euskarazko Wikipediako datu eta irudi askoren galderak agertzen direla badakite erabiltzaileek. Erantzun asmatuen zerrenda ematerakoan ere, galdera askoren argipena ikusteko Wikipediako esteka klikatzen ahal da. Jokoaren gakoetako bat izanik milaka galdera behar direla, Wikipediako datuak erabili ahal izatea funtsezkoa zaio aplikazioaren sortzaileei, CodeSyntax enpresari. Euskarazko Wikipedia ez balego, askoz zailagoa izango zen Egunean Behin programatu ahal izatea eta, dudarik gabe, askoz tristeagoa izango zen jokatzea ere. Pertsonalki, hau sinatzen duena wikipedista intermitentea da, EWKE elkarte honetako bazkide, eta CodeSyntaxeko lankidea, eta hortaz, pozik dago komunitateari azalpen batzuk emateko aukerarekin.

CodeSyntax-etik zenbait metodorekin ustiatu dugu Wikipediako informazioa, baina, Euskal Wikilarien Elkarteko Galder Gonzalez lagunaren pista batzuk tarteko, batez ere Wikidataren ustiaketan ari gara zentratzen azken aldian.

Wikidata baliatzeko, https://query.wikidata.org zerbitzua erabiltzen dugu. Bertan adibide batzuk agertzen dira, eta askoz gehiago ingelesez osatutako biltegi honetan. https://www.wikidata.org/wiki/Wikidata:Request_a_query

Bilaketa bat egindakoan, gainera, helbide labur bat eraiki dezakezu, eta horrek gogoratzeko balio dizu, bilaketa gordeta izateaz gain haren gainean beste batzuk bilatzeko. Hona adibide bat, https://w.wiki/4SB zeinak ematen dizkigun Euskal Herrian kokatutako udaletxeen irudiak (aldi berean berezko artikulua dutenak). Egin klik URL horretan, eta eman Play botoi urdinari. Ondoren, emaitzak agertzen dira, eta funtzio barra bat.

Barra honetan ezkerreko begian klikaturik, emaitzen bista desberdinak lortzen dira. Download emanik, jaitsi daitezke emaitzak, eta horra, erraz-erraz, Egunean Behin-erako galdera sorta bat: “Nongoa da udaletxe hau? <irudia> | Herria”. Galde-erantzun zuzenak behintzat, bertan leudeke; hori bai, programazio pixkat gehiago gehitu behar da erantzun okerrak sortzeko.

Udaletxeen eskaera horri begiratu diezaiogun apur bat:

Batetik, lerro luze batean Euskal Herriko eremu geografikoa definitzen da, formula baten bidez (zazpi herrialdetako estatu independente bat ez garen artean, hala beharko du), eta azpimarratu dut halaber Udaletxe bat (eraikin mota) definitzen duen Wikidata elementua. Q543654 beste elementu batzuekin ordezkatu, eta beste hainbat argazki-artikulu lortuko dituzu. Adibidez, Q16970 elementua idatziz gero, dozenaka eliza. Q199451 idatziz gero, seguruenik batere ez, pagoda bat definitzen duen wikidata elementua baita.

Beste bilaketa bat, https://w.wiki/4TT.

Kasu honetan, pertsonen gaineko bilaketa bat da, epe jakin baten artean jaioak (1960ko hamarkadan), genero propietatean (P21) emakumezko direnak (Q6651072 aldagaia) eta hiztun propietatean (P1412) euskara (Q8752) dakitenak. Era berean, emaitzak ordena jakin batean ordenatzeko irizpide bat eskatzen da. Bilaketa zehatz honen antzekoak erabili ditugu pertsonaien adinak galdetzeko Egunean Behin jokoan. Euskaldunekin egin dugu batik bat, eta bilaketa bereiziak egin ditugu gizonezko eta emakumezkoetan, kopuru berdinak izateko, 100 gizon, 100 emakumezko, berdintasunean saiatzeko.

Hortaz, horrela arakatzen dugu Wikidata, Query zerbitzuaren bidez… Esplorazioa, esan dezagun. Izatez, query horietako eskaerak Wikidatatik zuzenean ateratzeko Pywikibot Python programa erabiltzen dute nire lankide informatikariek. Hemen adibide bat dokumentatuta (honetan utziko dut hau, beste azalpen teknikoago baterako gaia da).

Wikidata arakatzea ez da Egunean Behin-eko galderak sortzeko metodo bakarra, baina bai interesgarrienetako bat. Egun hauetan lehiaketa abiatu dugu (martxoaren 15a arte) programazio bidez galde-erantzun sortak egiteko, eta azalpenak eman ditugu ideia eta adibideekin, parte-hartzaileak animatzeko: horietan bereziki aipatu dugu Wikidata eta Euskarazko Wikipedia. Inor animatzekotan:

Bestalde, kontuan izan beti: Wikidata ez dago betea berez, airetik datozen datuekin. Batzuetan kargatu dira datubase osoak beste iturri batzuetakoak, baina Wikipedia bezala, Wikidata osatzen da erabiltzaileok ezagutza dokumentatua kargatzen dugularik. Wikipedia bisitatzen duzuelarik, adi aldameneko ikono hauei:

Pagodaren artikulua hemen duzu euskaraz, baina ikonoan klikatuz iritsiko zara Wikidatako Q199451 elementura, zeinak definitzen duen zer den pagoda bat.

Hemen duzue beste orri bat, Karmele Jaio idazlearena. Berak ere badu Wikidata lotura, eta betea du hiztun propietatean (P1412) euskara dakiela… baina, adibidez, ez ote daki beste hizkuntzarik? bat edo beste susmatzen dugu baietz… Dakienak Jaiori buruz gehiago, bete beza https://www.wikidata.org/wiki/Q12261321 orri hori datuarekin! Eskerrik asko.

Gehiago irakurri