-
TERMINOLOGIA SAREAK EHUNDUZ (TSE) GARATERM LAN-INGURUNEA
Testuen kargarako interfazea (2020-II-19)
0. GOMENDIO OROKORRAK 0.1. Erabili Mozilla Firefox
nabigatzailea: beste nabigatzaile batzuekin gerta daiteke
funtzionalitate batzuek arazoak ematea. 0.2. Saihestu PDF formatuko
dokumentuak igotzea: irudi modura prozesatzen dira eta informazio
ugari galtzen da prozesatze linguistikoan. 0.3. Aurreko
instrukzioaren ildotik, hauexek dira onartzen diren formatuak: Html
(.html, .htm, .xhtml), Testua (.txt), Word (.doc, .docx, ...),
Powerpoint (.ppt, .pptx, ...), Oppenoffice (.odt, .odp, ...), Latex
(.tex). Latex dokumentua igoz gero konprimituta igo behar da
konpilatzeko behar diren dokumentu guztiekin batera (.tar, .gz,
.zip), baina “.tex” dokumentuak ez du karpeta baten barruan egon
behar, goiko mailan egon behar baitu ondo prozesa dadin. 0.4. Igoko
diren dokumentuen artean, bereizi fitxategi desberdinetan genero
desberdinetako testuak: irakaskuntza-gida, apunteak, ppt
aurkezpenak, ariketak, praktika-protokoloak, azterketak… (Aukera
dago testu-genero horiek guztiak egokiro identifikatuta igotzeko,
baina ez da nahitaezkoa denetarikoak igotzea: parte-hartzaile
bakoitzak erabakiko du zein diren bere irakasgaian erabiltzen
dituen hizkuntza-baliabideen adierazgarri). 0.5. Materialak
fitxategi txikietan bereizita badituzu, hobe horrela mantentzea.
Izan ere, prozesatze linguistikoan arazoren bat egonez gero,
errazago detektatzen da fitxategi txikietan. 0.6. Lan-ingurunea
prestatuta dago irakaskuntzan erabiltzen diren materialak igotzeko,
baina baita jardun akademikoarekin lotutako bestelako testuak
igotzeko ere: aldizkarietako artikuluak, blog espezializatuetako
artikuluak, lan akademikoak (GrAL, MAL, doktoretza-tesiak). 0.5.
Garbitu ahal duzun gehien lan-ingurunera igoko dituzun dokumentuak:
a) Bibliografia-zerrendak kendu. b) Euskara ez diren hizkuntzetan
dauden testu-zati luzeak ezabatu. c) Orrialde edota diapositiba
guztietan errepikatzen diren goiburuak ezabatu: maiz errepikatzen
direnez, estatistikak desitxuratzen dituzte. 1. Lan-ingurunera
sartu Lan-ingurunera sartzeko, ERABILTZAILEA eta PASAHITZA behar
dituzu: POSTA ELEKTRONIKOZ helduko zaizkizu. Gorde lehen saioan
erabili ahal izateko. Testuak kargatzeko interfazera heltzeko,
helbide honetara joan: http://ixa2.si.ehu.es/garaterm Emandako
erabiltzailea eta pasahitza erabiliz, Garaterm lan-ingurunearen
karga-interfazean sartuko zara, “login” sakatuz.
http://ixa2.si.ehu.es/garaterm
-
Pasahitza ahaztu baduzu, berreskuratu dezakezu “Pasahitza ahaztu
duzu?” botoia sakatuz. Hala ere, Garaterm lan-ingurunean esleituta
duzun helbide elektroniko zehatza behar duzu. Ez badakizu zein den,
TSE programaren arduradunen bati eskatu ahal diozu. Eskaria egin
ondoren, berehala helduko zaizkizu posta elektronikoz erabiltzailea
eta pasahitza. 2. Erabiltzailea eta pasahitza aldatu Erabiltzailea
guk sortu dizugunez, gerta liteke zuretzat eroso ez izatea.
Erabiltzailea alda dezakezu eta, adibidez, UPV/EHUn erabili ohi
dugun LDAParena jarri. Erabiltzailea aldatu nahi izanez gero,
honela egin dezakezu: Garatermen barruan zaudela “Kontua” botoian
klik egin:
Behin hor sartuta, erabiltzaile-izena eta zure datu guztiak alda
ditzakezu.
Uneren batean, pasahitza galtzen edo ahazten baduzu, posible
duzu berreskuratzea, lan-ingurunearen lehen pantailan dagoen
“Pasahitza ahaztu duzu?” botoiaren bidez.
-
Behin lan-ingurunean sartuta, pasahitza alda dezakezu,
gogoratzen errazagoa zaizun beste bat sortzeko.
3. Egile(are)n datuak sartu Testuak igotzen hasi aurretik,
obraren EGILEA(k) sartu behar d(ir)a: sakatu “Egileak” botoia.
Egiaztatu zure datuak ez daudela aldez aurretik sartuta,
bilaketarako leihoa erabiliz. Zure datuak lehen aldiz sartu behar
badituzu, sakatu “egile berria” botoia.
Sartu zure datuak zabaltzen zaizun pantailan. Zure datuak bete
ondoren, sakatu “Gorde” botoia. Sartuko dituzun fitxategiek egile
bat baino gehiago badituzte, sartu egile guztiak prozesua
errepikatuz, dokumentuak kargatzen hasi aurretik.
KONTUZ! Telefonoa sartzen baduzu, ez utzi zuriunerik zenbakien
artean.
-
4. Dokumentuak igo Dokumentu bat igotzeko, sakatu “Obrak” botoia
eta, ondoren, sakatu“Obra berria” botoia.
Arakatu zure dokumentuen karpetan eta aukeratu igo nahi duzun
dokumentua. Joan aukeratzen eskaintzen zaizkizun zerrendetatik
“Eremua”, “Azpieremua”, “Egilea” e.a. TSE programan parte hartzen
duzuenon kasuan, baliorik ohikoenak izango dira: Rola: Egilea;
Espezializazioa: “Aditu irakaslea” eta Rol xehea: idazlea.
Igo nahi duzun dokumentuak egile bat baino gehiago baditu,
sakatu “Gehitu egilea” botoia gainerako egilea(k) sartzen joateko.
Bete zure dokumentuari dagozkion datuak. Azpimarratuta dauden
eremuak ezinbestekoak dira. TSE programaren dokumentuen kasuan,
balio hauek izango dira ohikoenak:
“Generoa: Material didaktikoa” “Itzulpena: Ez” Kontrol
linguistikoa: “Espontaneoa”. Bakarrik hautatuko dugu “zuzendua”
aukera testuak zuzenketa sistematiko batetik pasatu bada, adibidez,
Euskara Errektoreordetzaren sareko argitalpenetan egiten den
zuzenketa pairatu badu.
-
Baimenari dagokionez, aukeratu “Baimena: Bai” balioa. • “Baimen
mota: Publikatzeko” aukeratzea eskatuko dizugu TSE programan.
TSE
programako partaide guztiek ikusi ahalko dituzte zure adibideak
(konkordantziak) kontsulta-interfazean bilaketa bat eginez gero,
baina ez dituzte ikusiko obraren egileen izen zehatzak.
Datu guztiak sartu dituzunean, sakatu “Gorde” botoia.
Ezinbesteko datu guztiak bete badituzu, eta dokumentua ondo
gorde bada, mezu hau aterako zaizu.
-
Igotako dokumentuen zerrenda osoa ikusteko, sakatu “Obrak”
botoia, eta igotako dokumentu guztiak ikusiko dituzu. Goialdean,
igotako azken dokumentua agertuko zaizu.
Ezinbesteko daturen bat sartzea ahaztu baduzu, aldiz, beste mezu
hau aterako zaizu. Orduan, dokumentua berriro igo beharko duzu,
eta falta zaizkizun datuak bete edota errorea eman duten balioak
zuzendu beharko dituzu.
-
5. Aldez aurretik igo den dokumentu baten metadatuak beste
dokumentu bat igotzeko orduan aprobetxatzeko Sakatu “kudeatu”
botoia igo duzun obraren eskuinaldean. Joan abiapuntu modura
aprobetxatu nahi duzun dokumentura, eta “Kudeatu” botoia
aukeratu.
Igo dokumentu berria, eta aldatu beharreko datuak. Eta bukaeran
sakatu “Berria gorde” botoia.
“Kudeatu” botoia erabil dezakezu baita igo duzun dokumentu baten
metadatuak aldatzeko. Orduan, aldatu nahi dituzun datuak aldatu
ondoren, “Eguneratu” botoia sakatu beharko duzu aldaketa
gordetzeko.
-
6. Garaterm corpusean kontsultak egitea (behin testuak
prozesatuta) Behin testuak prozesatuta, kontsultagai egongo dira
Garaterm corpusaren kontsulta-interfazeetan. Garaterm
lan-ingurunetik, zuzenean sar daiteke kontsulta-interfazean.
Beste aukera bat da helbide honetan sartzea, lan-ingurunetik
pasatu gabe: http://garaterm-corpusa.ixa.eus/ Bilaketa-interfaze
arruntean, corpus guztietan bezala, “lema” edo “forma” bila
dezakegu. “Lema” bilatuz gero (adibidez, ustiapen), lema horrek
dituen forma guztiak (ustiapeneko, ustiapen, ustiapenaren…)
agertuko zaizkigu bereizita ezkerreko zutabean, baita agerraldi
kopurua (1.083), bilaketa-corpusaren tamaina (16.690.857) eta
maiztasuna ere. Egile kopurua ere (77) erakusten digu.
Eskuinaldean, aldiz, corpusean aurkitutako konkordantziak agertuko
zaizkigu.
http://garaterm-corpusa.ixa.eus/
-
“Lema” bilatu beharrean, “forma” bat bila dezakegu, adibidez,
ustiapenaren.
Kontuz ibili behar gara. Izan ere, ustiapen “forma” modura
bilatzen badugu, bakarrik agertuko zaizkigu forma hori zehazki
duten agerraldiak.
Ohartu goiko bilaketetan “Da” aukeratu dugula, eta horrek esan
nahi duela bilatzen dugun lema edo forma bere horretan bilatu nahi
dugula. Nolanahi ere, posible dugu hasiera jakin bat duten lema
guztiak bilatzea ere. Horretarako “Hasi” aukeratu behar dugu
bigarren zerrendan. Adibidez, ustia hasiera duten lemak bila
ditzakegu. Orduan, hasiera hori duten lemak bilatuko dizkigu
corpusean: ustiapen, ustiatu, ustiaketa, ustiategi, ustiakuntza,
ustiatze, ustiatzaile, ustiagarri, ustialeku…
-
Posible dugu baita bukaera jakin bat duten lemak bilatzea.
Adibidez, pen bukaera duten lemak bilatzeko, “Bukatu” aukeratuko
dugu, eta adierazpen, garapen, ebazpen, xedapen, ekoizpen eta abar
luzea bilatuko dizkigu.
-
Bilaketa-interfaze arruntean hainbat parametro iragaz ditzakegu,
bilaketa-leihoaren azpiko botoiak erabiliz: jakintza-eremua,
testuak kontrolatuak (zuzenduak) diren ala zuzendu gabeko testu
espontaneoak diren, eta emaitzak nola ordenatu nahi ditugun.
Adibidez, “ustiapen” lema bilatzen badugu, baina bakarrik “Ekonomia
Zientziak” alorrean eta “testu espontaneoetan”. Bestalde,
“konkordantziak urtearen arabera ordenatzeko” eskatu diogu. Ikus
emaitzak aldatu zaizkigula: agerraldi kopurua (639), azpicorpusaren
tamaina (1.388.345), maiztasuna, eta egile kopurua (28).
Kontsulta-interfaze aureratuan, bilaketak beste parametro
batzuen arabera murrizteko aukera dugu, bai eta hitz bat baino
gehiagoko sekuentziak bilatzeko ere:
-
Adibidez, batez besteko bilatu dugu beheko adibidean, corpus
osoan, eta emaitzak eremuaren arabera antolatzeko eskatu diogu.
Hirugarren kontsulta-interfazeak konparazio-bilaketak egiteko
aukera ematen digu.
Adibidez, Garaterm corpusean “estimazio” eta “zenbatespen” lemak
zer proportziotan erabili diren ikus dezakegu. Bakoitzaren ehunekoa
ez ezik, urteetan zeharreko eta jakintza-alorretan zeharreko
banaketa ere eraksuten digu pantaila horretan.
-
Azkenik, kolokazioa bilatzeko kontsulta-interfazea dugu.
Adibidez, hormona bigarren lema modura duten “izena+aditza” ereduko
konbinazioak bila ditzakegu, eta konbinazio bakoitzaren adibideak
ikusi.
-
“Izena+izenondoa” moduko konbinazioak bilatzen baditugu, aldiz,
askotarikoak lortuko ditugu: