Pasa den ekainean Jose Ramon Etxebarriaren omenezko liburuan artikulu bat idatzi nuen. Abiapuntua galdera hau zen: Zelan sortzen da Wikipedian pertsona baten artikulua? Pista batzuk ematen nituen hori egiteko , eta gainera, aitzakia horrekin, adibideetan Joserraren artikuluko osagai batzuk erabili nituen. Joserra izan zen nire irakasle handienetako bat, Fisika irakatsi zidan eta euskaraz idazten irakatsi zidan. Eskerrik asko Joserra! Liburuan idatzi nuena wikilarien blogean ere baliagarria izan daitekeenez… apur bat moldatu… eta blog honetara ekarri dut.
ftxi

Motibazioa

Heroi ugari ezezagunak dira gure inguruan, pozgarria da horrelakoak deskubritzea eta gizarteari eredu moduan aurkeztea. Jarduera horretan hasi nintzen ni orain dela hiru urte, Donostiapedia bultzatzen hasi ginenean konturatu nintzen ni Wikipediako biografietan zegoen hutsuneaz. Adibidez, donostiarren artean 2016ko udan 392 gizonezko zeuden, baina emakumezkoak 100 baino ez ziren. Zelako hutsune! Eta antzeko panorama zegoen ofizioetan ere; pertsona gehien biltzen zituztenak lanbide hauek ziren: idazle (112), politikari (59), futbolari (56), aktore (44), kazetari (25), arraunlari (19) edo kirolari (16). Meritu handikoak dira ofizio horiek guztiak, zalantzarik ez dago, baina ziur ados zaudela nirekin: kirolari gehiegi, telebistako pertsonaia gehiegi zeuden hor. Edo hobeto esanda, barkatu, horiek ez daude soberaz baina hutsune nabarmenak daude hor; esaterako, unibertsitatearen mundutik inor gutxi zegoen; ematen zuen Wikipediako mundu honetan unibertsitateko gaiak ez zirela ez aipagarri, ez eta erakargarri ere. Zuek bezalaxe egoera horrekin ez nago ados; ea 40 urtean zerbait erakutsi badit UEUk, hori da gero, zientziaz eta jakintzaz aritzen garenean gozatu ere egiten dela.

Wikipediako hutsune hori oso nabarmena zen, bai; eta zer egin behar zen horren aurrean? Oihukatu? Ernegatu? Bai, apur bat bai; baina garrantzitsuago zen hutsuneak betetzen hastea. Eta horixe da oraindik dugun erronka: gozagarri zaizkigun zientzia eta jakintza horietako eragile eta sortzaileak azalera ekartzea, plazara ateratzea. Ados? Wikipedian lan egiteko prest? Ongi etorri! Hona hemen ‘wiki-lanerako’ pista batzuk.

1. pista. Batu informazioa: liburutan, Interneten…

Pertsona baten artikulua sortzea edo osatzea erabakitzen duzunean lehenengo urratsa datuak batzea da. Zuk dakizuna abiapuntua izan daiteke baina erreferentziak behar dituzu idatziko duzuna egiazkoa dela erakusteko. Ziur Google-k lagunduko dizula horretan, komunikabideek ere bai (berria, argia, eitb…). Argazki kontutan sarean aurkituko duzun edozein argazkik ez du balio, kontuz.

Webgune horretan behealdean CC-BY-SA lizentziaren iruditxo hori agertzen bada… primeran; bestela bilatu webgune hauetako batean: CC Search, Flickr (Aitortu eta Konpartitu), Google Advanced Image Search, edo Wikimedia Commons advance search.

2. pista. Moldatu Wikipedian dagoen antzeko beste pertsona baten eskema.

Zeintzuk dira lortu dituzun datuak? Zeintzuk dira printzipalak? Zeintzuk bigarren mailakoak? Nola antolatu zenbait ataletan? Osa dezakezu artikuluaren eskema bat?

Hasiberria bazara edo galduta sentitzen bazara bilatu Wikipedian antzeko soslaia duen beste pertsona bat. Gustatzen zaizu? Baliagarria da bere eskema? Atalak? Kategoriak? Horrela bada kopiatu beste pertsona horren artikulua, eta hartu ezazu abiapuntu modura artikulu berri bat osatzeko, eta noski, ondo egokitu zure pertsona berri horren datuekin.

Adibidez, Joserra Etxebarriaren artikuluan hainbat paragrafo zeuden pasa den urrian, denak jarraian eta egiturarik gabe, ataletan bereizi gabe. Zaila zen Joserra polifazetikoaren informazioa antolatzea. Nola egin? Itxaron, Txillardegi ere nahiko polifazetikoa zen eta antzekotasuna bazuen Joserrarekin. Txillardegiren artikulua ikusi eta bere antolaketa erabilgarria iruditu zitzaigunez, Joserraren artikuluari antzeko egitura ematea erabaki genion.

Zein kategoriatan jarri Joserraren artikulua? Horretan ere Txillardegirenak kontuan izatea lagungarri izan zan.

3. pista. Lortzeko irudi errazenak Commons-ekoak edo zuk egindakoak dira.

Artikulu batean txertatzeko, argazki errazenak Wikimedia Commons zerbitzu barruan sartuta daudenak dira, noski.

Argazki berri bat sartu behar bada, orduan errazena norberak egin dituenak sartzea da. Horrelakoetan Commons-era joan ‘Fitxategia igo’ aukeratu eta esan argazkia zurea dela eta CC-BY-SA lizentzia bat ematen diozula. Berehala sartu ahal izango duzu artikuluan goian esan bezala.

Bestela, argazki kontutan kontuz, ezin duzu igo sarean aurkituko duzun edozein argazki. Webgune horretan behealdean CC-BY-SA lizentziaren iruditxoa agertzen bada primeran; argazkia zeure konputagailura jaitsi, igo gero Commonsera eta adierazi nondik jaso duzun eta CC-BY-SA lizentzia hori duela. Adibidez Joserraren argazki bat aikor.eus aldizkaritik hartuta dago.

Hala ere, buruhausteak izan ditzakezu. Kartel pribatu bati argazki bat egiten badiozu, atzera botako dizute argazkia. Jabetza izan dezakeen aztarna txikiena baldin badago, ondo defenditu beharko duzu argazki hori argitaratzeko baimena duzula. Adibidez, ez da ohikoa baina asko sufritu dut nik azken bi urteotan zehar Joserraren kartel mitikoa, Suarezi erantzuteko modua izan zena, Wikipedian argitaratzeko nahian; eta oraindik ez dut lortu. Hainbat gestio eginda lortu nuen aurrezki kutxak Flickr-en argitaratzea CC-BY-SA lizentzia egokiarekin.

Baina Commons-eko gainbegiratzaile batek kartelean behean erdialdean zeuden inprimategiko letra txiki batzuk ikusi zituenean hor balizko jabetza intelektuala egon daitekeelakoan argazkia ezabatu zuen berriro.

Ondorioz, ezin da jarri Wikipedian kartel hori. Pena da, Joserraren izaera eta ekarpena kartel horrek ezin hobeto islatzen du eta. Irakurle hori, baldin badakizu zein zen inprimategi hori (E??E ELEXPURU HNOS. S. A. -BILBAO D. L. ??-???? -1978), lagunduko bazenigu haiekin kontaktuan jartzen… beste saio bat egin genezake kartela Wikipediara ekartzeko.

4. pista. Erreferentziak erraz-erraz txertatuko dituzu URLa edo ISBNa ezagutuz gero

Komeni da artikuluan erreferentziak gehitzea, testuan esaten dena egiaztatzeko aukera eman ahal izateko, edo edukietan sakontzeko. Erreferentzia horietako bat eskuz sartzea minutu batzuetako lana izan daiteke. Baina sartu behar duzun erreferentzia bat webean badago segundo gutxi batzuetan egin dezakezu automatikoki ‘ikusizko‘ edizioan ‘Aipatu’ botoia eta ‘Automatikoa’ aukeratuta sartu webgunearen helbidea (URLa) eta listo. Beti ez du harrapatzen informazio guztia (jai duzu webguneak metadatu horiek definituta ez baditu, noski), baina sarritan bai, eta oso txukun geratzen da. Berdin gertatzen da erreferentzietako bat liburu bat bada, ISBNa emanda automatikoki lortuko dizkizu liburuaren datu guztiak.

A! Erreferentziak direla-eta, pertsona hori unibertsitatekoa bada ez ahaztu Ingumako erreferentzia gehitzen. Ingumaren informazioa ematea oso aberasgarria izaten da. Horrelako esalditxo bat gehitu:

Euskal komunitate zientifikoaren Inguma datu-baseak, guztira berak sorturiko 170 lan baino gehiago erakusten ditu.[22]

22 Jose Ramon Etxebarriaren produkzioa Inguma datu-basean (>170 produktu).

Azken pistatxo batzuk, miszelanea.

Birzuzendu

Jose Ramon Etxebarria da artikuluaren izenburua, baina hainbatek Joserra Etxebarria bilatuko dute. Zer egin horiei erantzun egokia emateko? Definitu beste artikulu bat Joserra Etxebarria izenburuarekin eta hor testutxo hau bakarrik jarri:

#BIRZUZENDU [[Jose Ramon Etxebarria]]

Idazlan guztien zerrenda luzea bada aparte jarri, beste artikulu batean

Joserraren kasuan idazlan kopurua oso luzea denez, eta artikulu nagusiaren irakurterrezago izan dadin, aparte beste artikulu batera atera dira. Artikulu nagusian garrantzitsuenak bakarrik azaltzen dira, azalpen batekin kasu gehienetan.

Ezin duzu testuak literalki kopiatu

Nahiz eta erreferentzia bat gehitu, ez badaukazu hori egiteko baimenik, nonbaitetik jaso duzun esaldi oso horiek ezin dituzu berdin-berdin kopiatu. Beste modu batera moldatu beharko duzu hori.

Artikulua modu inkrementalean osa dezakezu

Hasieran artikuluaren bertsio minimo bat argitaratu dezakezu: paragrafo zehatz bat edukiaren ideia nagusia ondo azaltzen duena (pertsonaren ezaugarri nagusiak) erreferentzia bat eta kategoria(k). Geroxeago joan zaitezke zatika oinarrizko artikulu hori osatzen: paragrafo berriak, argazkiak, Wikipediako beste artikulu batzuetarako estekak… Zatika egin dezakezu, bai, baina kontuz, argitaratzen duzun bitarteko bertsio bakoitza egoera koherente eta irakurgarrian utzi behar duzu.

Zirriborroa

Noizbait egoera ez-koherente batean edo osatugabean utzi behar baduzu artikulu bat, adierazi beharko zenuke artikulua zirriborroa dela (artikuluko hasieran gehitu hau: {{Zirriborro}}).

Norberaren proba orria

Artikulu bat argitaratu baino lehen esperimentatu dezakezu Wikipediako zeure proba orri propioan, oraindik publiko orokorrerako argitaratu gabe; noski, kontu bat zabaldu baduzu. Eta hori lehenbailehen egin behar duzu Wikipedian parte hartu nahi baduzu. Nik probak egiteko orri hau daukat: https://eu.wikipedia.org/wiki/Lankide:Ksarasola/proba

Zure proba orriaren helbidea oso antzekoa izango da, noski.

Zuk ere idatzi Wikipedian

Bukatzeko eskaera bat: lagundu, mesedez, Wikipediako hutsuneak betetzen. Artikulu berriak sortu edo Joserraren artikulua bera ere osa dezakezu. Ez da artikulu laburra, baina badira hainbat puntu oraindik osa daitezkeenak. Gehitu dezakezu, esate baterako, behin Gernikako Juntetxean atxilotu zutela, edo Joserraren iniziatibari esker ingeniaritzako bere ikasleek aurten 40 bat artikulu sortzen ari direla Wikipedian, ‘1.000 artikulu 12-16 urteko ikasleentzat’ proiektuaren barruan.

Pasa den asteburuan  Wikimedia Hackathon izan da Bartzelonan, asteburu batez Wikipedia hobetzeko tresnak helburu duen bilera. Euskal ordezkaritzan bost izan ginen eta hauek izan ziren gure ekarpen nagusiak:

Igor Leturia eta Galder Gonzalez, Hackatoian

Igor Leturiak saio berezi bat antolatu zuen ostiralean, Elhuyar Fundazioarekin batera lantzen ari garen proiektu bat azalduz: Wikispeech: Text-To-Speech technology for accessibility.

Elhuyar Fundazioa eta EWKEren artean Wikipediako artikuluak “entzuteko” aukera asmatu dute Suediako Wikilariekin, eta euskaraz ere instalatzeko lanean ari gara. Oraindik ere ezingo da entzun, hainbat software-proba pasa behar baititu martxan jarri aurretik. Besteak beste, laburdurak ondo irakurtzeko sistema bat eta irakurketa pausatzeko botoia gehitu ditu Leturiak egun hauetan.

Galder Gonzalez eta Amador Álvarez, txantiloi automatikoak lantzen

Galder Gonzalezek Amador Álvarez katalanarekin saio berezi bat antolatu zuen Wikipediako infotaula automatikoei buruz. “Supercharge your wiki: Wikidata-powered infoboxes“. Infotaula horiek zelan definitzen ari diren azaldu zuten. Lehen eskuz adierazi behar ziren propietate guztiak, orain Wikidatatik hartzen dira datu guzti horiek automatikoki. Bertan izan ziren Wikidatako hainbat arduradun, eta sorpresa ederra izan zen eurentzat katalanek eta euskaldunok garatu dugun puntako sistema hau.

Berriki sortutako Wikitekan ere lan egin genuen, aurretik Euskal Herrian gai honi buruz hizketan egon zen Carles Paredesekin. Sistema hobetu, eta falta ziren hainbat gauza instalatu genituen.

Maite Urra-k eta Oscar Sainz-ek Euskal Wikipediako artikuluen kalitatea aztertzeko laguntza teknologikoak aztertu dituzte ORES sistemarekin, urtean zehar ibili dira hori prestatzen Montse Maritxalar irakaslearekin. Hackatoian Galder Gonzalezek eta Kepa Sarasolak lagundu zieten, kalitate handiko 800 artikulu identifikatu zituzten eta 3.000 zirriborro. Editoreek artikulu batzuetan ezartzen dituzten txantiloiak ere baliagarriak izan daitezke kalitatea etiketatzeko ({{zuzendu}}, {{zirriborro}}, {{wikitu}}, {{erreferentzia falta}}{{zaharkitua}}…). Xuxen pasata, artikulu batek zenbat errore ortografiko dituen jakiteak ere laguntzen du kalitatea neurtzen. Guztira 20 irizpide kontuan hartuko dira.

Maite Urra, Oscar Sainz eta Kepa Sarasola, Wikidatako gelan ORESen lanean.

Egindako lanetik abiatuta, Wikimediako ORES sistemaren arduraduna den Aaron Halfakerrek 400 artikulutako lagin bat prestatu zuen beraien kalitatea etiketa genezan eta gero ikasketa automatiko bidez artikuluen kalitate maila aurreikusi ahal izateko: “Train/test article quality model for euwiki“.

Kepa Sarasolak Daniel Kinzler-en laguntzarekin Euskal Wikipedian eta Espainierazko Wikipedian dauden artikuluen tituluekin corpus elebidun bat sortu zuen (Wikipedia_tituluak_es_eu_2018). Hau da hasierako corpus gordina lortzeko exekutatu zuten sql galdera:

sql eswiki 'select page_title as es, ll_title as eu from langlinks join page on page_id = ll_from where ll_lang = "eu" and page_namespace = 0' > es-eu.txt

Honi esker itzulpen automatiko sistemak hobetzeko aukera bat zabalduko da ikaskuntza automatikoko sistematan.