Euskal Wikilarien Kultura Elkarteak Eusko Jaurlaritzaren laguntzarekin egiten duen proiektu nagusia Hezkuntza Programa da. Helburua 12-16 urteko ikasleek behar dituzten edukiak hobetzea da, horretarako Unibertsitateko irakasle eta ikasleen, wikilarien eta Bigarren Hezkuntzako hainbat ikastetxeren laguntza izan dugu. 2.000 artikuluen zerrenda bat sortu dugu eta, pixkanaka, ari gara horiek hobetzen.

2020 urte zaila izan da. Martxan genituen proiektu asko bertan behera geratu dira. Paradoxikoki, hezkuntza inoiz baino telematikoa izan den garaian, inoizko bisita kopururik handiena izan dugun garaian, proiektu asko ezin izan ditugu egin. Hala ere, helburu artikulu horiek hobetzen jarraitu dugu. Hemen datu batzuk.

Orokorrean, artikuluen hobekuntzak jarraitu du, eta zerrenda handitu badugu ere, kalitatea ez da inongo momentuan jaitsi. Proiektua hasi genuenean, 2.000 artikulu hauek 6.193 byte pisatzen zuten batez beste eta, guztira, 12.386.636 byte okupatzen zuten. Hiru urte eta erdi pasa eta gero artikuluek 14.807 byte pisatzen dute batez beste eta, guztira, 29.614.933 byte okupatzen dute. Hau da, proiektua hasi genuenetik helburu artikuluen pisua bikoiztu baino nabarmen gehiago egin da.

Byte kopurua

Bi moduz handitu da batezbesteko hau: alde batetik artikulurik laburrenak hedatu dira; bestetik, artikulu mamitsuen kopurua ere handitu da, arlo gehienetan. Honako taulan ikus daiteke nola artikulurik luzeenak eta sortu gabekoak gutxitzen joan diren denborarekin:

Hasiera2018/062018/122019/062019/122020/062020/12
Sortu gabe361%18,05286%14,30242%12,10191%9,55145%7,25125%6,2592%4,60
<5000972%48,60912%45,60814%40,70763%38,15721%36,05672%33,60666%33,30
>5000667%33,35802%40,10944%47,201046%52,301134%56,701203%60,151242%62,10
Guztira2000200020002000200020002000
Luzeak ez133311981056954866797758

Ikusten den bezala, 5.000 byte baino laburragoak diren artikuluak ia erdia ziren proiektua hasi zenean, eta hortik gorakoak herena baino gutxiago. Gaur egun artikuluen gehiengoa, ia bi heren, (%62) 5.000 byte baino luzeagoa da, eta herena inguru dira hori baino gutxiago pisatzen dutenak. Artikuluen %4,6 falta zaigu sortzeko, 100 artikulu baino gutxiago.

Ikus dezagun zehatzago nola aldatu den, denboran zehar, artikuluen tamaina. Horretarako, datu orokorrak hartuko ditugu eta honako distribuzioa lortuko dugu:

Hasiera2018/062018/122019/062019/122020/062020/12
036128624219114512592
50064423628211914
1000168122118112796663
150013314111910710310197
2000148140120112100103103
2500114115100951008484
30001021079691928281
4000122121115107108105108
5000121124110111118112116
10000324383425423441440448
15000138159191225239247243
200007495111135142157168
30000668199119138157163
4000026324448586674
5000014182232373944
>50000253452647997102
2000200020002000200020002000

Grafikan argi ikusten da nola artikulurik laburrenak gutxiagotzen joan diren, eta bereziki 5.000 eta 30.000 arteko artikulu kopurua nabarmen hazi den. Artikulu tamaina hori izango litzateke ikasleek, normalki, egiten duten lan baten parekoa. 50.000tik gorako artikuluak arraroak dira, eta artikulu luze eta mamitsuak izan ohi dira. Artikulu hauek ez-ohikoak izanagatik ere, dagoeneko falta zaizkigun artikuluak baino gehiago dira, eta hori ere lorpen handia da.

Ikustaldiak

Lehen esan bezala, Wikipediako artikuluen ikustaldiek gora egin dute konfinamenduan zehar. Berdina aztertu daiteke helburu artikuluen kasuan. 2020an, helburu artikuluek 2.860.258 ikustaldi izan zituzten, 7.858 egunero. 2019an 2.772.944 ikustaldi izan ziren, 7.597 ikustaldi eguneko. 2018an 2.474.127 izan ziren, 6.781 eguneko.

Grafikan ikus daiteke 2020an Hezkuntza Programako artikuluek izandako ikustaldiak, eta nola ikasturte hasierarekin batera asko handitu diren bisita kopuruak. Asteburutan jaisten da, baina astegunetan 10.000 bisitatik gora daude, erraz, egun gehienetan. Konfinamenduaren hasieran inoizko ikustaldi kopururik handiena izan genuen artikulu horietan, ohikoaren oso gainetik.

Kalitatea

Euskarazko Wikipedian aitzindariak gara ORES artikuluen kalitate neurketa sistema baliatzen. Artikulu guztien egiturazko kalitatea neurtzeko aukera dugu, eta honek byte kopurua baino emaitza interesgarriagoak ematen ditu, kalitatea neurtzeko modu eraginkorragoa delako. Artikulu labur batek, ondo antolatuta egonez gero, emaitza hobea lortuko du gaizki antolatutako edo erreferentziarik gabeko luzeago batek baino. Orain bi urte hasi ginen neurketa horiek egiten, eta interesgarria da alderatzea egindako pauso hauetan ea artikuluak hobetu edo okertu diren. Bigarren aukera hau ere posible da: ORES sistema perfekzionatzen joaten den heinean, artikuluen kalitate erlatiboak neurtzen jarraitzen du, eta aldaketak egon daitezke, lehen oso ondo baloratutako artikulu baten nota murriztuz.
Iaz horrelako berrazterketa masibo bat egin genuen urtearen bigarren zatian, artikuluen notak doituz. Erdiko esparrua hobeto definitzen du, argiago utziz zein artikulu den txarra eta zein den oso ona, eta tarteko matiz guztiak hobeto markatuz. Sistema doitzerakoan C mailako artikuluak (eduki nahikoa, eta gure proiekturako helburuetako bat) asko handitu ziren pauso horretan, alde batetik lehen ez-nahikotzat zituen batzuen nota hobetu duelako eta, bestetik lehen B mailakoak (onak) zirenena ere jaitsi duelako. Aurten, hobekuntza horrekin jarraitu nahi izan dugu, C artikulu horietako batzuk B edo hobera pasaz eta, artikulu berriak sortu ahala, kalitate orokorra ez jaitsiaraziz.

Neurketa, bestetik, unean uneko artikulu zerrendaren gainean egin dugu, eta horregatik gero eta artikulu gehiago egongo dira batuketa egiterakoan:

18/0618/1219/0619/1220/0620/12
Sortu gabe30726421416213692
Zirriborro1038779767163
Hasi687606662433439452
C367431353758785774
B178230374313323359
Ona102133181108163169
Nabarmen183248648391
176217831911191420002000

Datu hauek ikusita argi ikusten da dagoeneko kalitatezko 1.000 artikulu baino gehiago ditugula, kalitatea 5.000 byte eta C maila edo gehiago izatea dela adierazten badugu. Hobekuntza hau grafikoki ikus daiteke hurrengo orrialdean.

Grafikan errazago ikusten da, ehunekotan neurtzen baita, nola sortu gabeko zein kalitate txikiko artikuluak ia bi heren ziren neurketekin hasi ginenean (pentsa dezakegu gehiago zirela oraindik proiektua hasi zenean) eta nola orain herena baino gutxiago diren. Kopuru handiagoa da, egun, Nabarmen, ona eta B mailan daudenak, hasieran genituenen bikoitza. Hobekuntza nabarmen hau zen bilatzen genuen lehen helburua, eta lortzen ari gara.