Top Banner

of 344

AdatbAdatbázis tervezés alapjai és titka

Mar 02, 2016

Download

Documents

idlog

Avagy az út az adattól az
adatbázison át az információig
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • Az adatbzistervezs alapjai s titkai

    Avagy az t az adattl az adatbzison t az informciig

    Halassy Bla

  • 1

    Dr. Halassy Bla, 1994.

    Emknek s Melindnak

  • 2

    TARTALOMJEGYZK

    ELZMNYEK....................................................................................... 8

    ELSZ................................................................................................. 9

    BEVEZETS - I......................................................................................12

    1. ADAT S INFORMCI.....................................................................14 1.1 Az alapfogalmak szemlletmdja .......................................................................... 14 1.2 Az adat - els megkzeltsben.............................................................................. 14 1.3 Az ismeretszerzs momentumai ............................................................................15 1.4 Az adat s az informci lnyege illetve viszonya................................................ 16 1.5 Szintaktika, szemaktika, pragmatika.................................................................... 18 1.6 Mirt hibdzik a kommunikci? ......................................................................... 19 1.7 Mit lehet megtudni?...............................................................................................20 Ellenrz krdsek - 1...................................................................................................21

    2. AZ ISMERETKEZELS KT MDJA................................................. 22 2.1 Az ismeret hordoz kzegei................................................................................... 22 2.2 Az ismeret ngy dimenzija .................................................................................. 22 2.3 Trtneti kitr: A szemantikai adatbzis ........................................................24 2.4 Ktfle mondat....................................................................................................... 25 2.5 Adatszer ismeretkezels ...................................................................................... 27 2.6 Szvegszer ismeretkezels ..................................................................................28 2.7 A ktfle ismeretkezels viszonya.........................................................................29 Ellenrz krdsek - 2 .................................................................................................30

    3. AZ ADATBZIS LNYEGE................................................................ 32 3.1 llomny, adatbank, adatbzis ............................................................................. 32 3.2 Egyedtpus, -elforduls, -halmaz........................................................................ 33 3.3 Tulajdonsgtpus, -rtk, -rtkhalmaz ...............................................................34 3.4 Kt relativits .........................................................................................................36 3.5 A binris relcik modellje.................................................................................... 37 3.6 Az azonosts problmakre.................................................................................39 3.7 Kapcsolattpus, -elforduls, -(al)halmaz............................................................40 3.8 Az adatbzis ...........................................................................................................42 3.9 Hrom tovbbi krds...........................................................................................44 Ellenrz krdsek - 3 ................................................................................................. 45

    4. AZ ADATBZIS HROM SZINTJE.................................................... 46 4.1 Egy alapvet problma: az eszkzorientltsg.....................................................46 4.2 Az adatok kt aspektusa........................................................................................ 47 4.3 Az adatbzis ktfle tartalma................................................................................48 4.4 Az adatbzis fogalmi s logikai szerkezete...........................................................49 4.5 Kt lnyeg hatrn................................................................................................. 52 4.6 Az adatbzis fizikai szerkezete.............................................................................. 53 4.7 A fizikai fggetlensg............................................................................................. 54 4.8 A vertiklis lekpezs ............................................................................................ 55 Ellenrz krdsek - 4 ................................................................................................. 56

  • 3

    5. AZ ADATBZIS VETLETEI............................................................. 58 5.1 Egy alapvet problma: a nzetorientltsg.........................................................58 5.2 A nzetorientltsg kros kvetkezmnyei..........................................................59 5.3 Globlis s parcilis adatbzisszemllet...............................................................60 5.4 Az adatmodell jelentse s tartalma..................................................................63 5.5 Az ANSI-SPARC architektra ...............................................................................64 5.6 A szintek megfeleltetse, modellek s smk.......................................................65 5.7 Adatmodell-elmlet s adatbzis-gyakorlat .........................................................66 5.8 Adatmodell-reprezentcik .................................................................................. 67 Ellenrz krdsek - 5 .................................................................................................69

    6. A MODELL ALAPVET SZERKEZETE ...............................................71 6.1 Az adatmodell, mint rendszer ................................................................................71 6.2 Az egyedek ktfle struktrja...............................................................................71 6.3 A tulajdonsgok alapvet szerepei ....................................................................... 73 6.4 Abszolt s relatv szerep...................................................................................... 74 6.5 Hierarchikus inhomogn kapcsolatok ................................................................. 76 6.6 Hls egyedviszonyok - 1 ...................................................................................... 78 6.7 Hls egyedviszonyok - 2 ...................................................................................... 81 6.8 jabb tulajdonsg szerepek..................................................................................83 6.9 A klcsns egyedviszony .....................................................................................84 6.10 Gyorsmrleg az adatszerkezetrl ........................................................................86 Ellenrz krdsek - 6 .................................................................................................86

    7. SZERKEZETI FINOMSGOK ............................................................ 88 7.1 Az adatmodell soksznsge ..................................................................................88 7.2 A szz-szzalkos elv ..........................................................................................88 7.3 Az rtktartomny .................................................................................................90 7.4 A szerepnv ............................................................................................................ 91 7.5 Ismtlds s szerepnv ........................................................................................93 7.6 A visszamutat egyedviszony................................................................................94 7.7 A hierarchikus homogn viszonyok...................................................................... 95 7.8 Csaldfa s hzastrs viszonyok ...........................................................................96 7.9 Hromfle res rtk..........................................................................................99 7.10 Egyedaltpusok...................................................................................................100 7.11 Szerkezeti sszefoglals...................................................................................... 103 Ellenrz krdsek - 7 ............................................................................................... 104

    8. ADATBZISKEZELS .....................................................................107 8.1 Az ismeretek termszete...................................................................................... 107 8.2 Az adatkezels szintjei......................................................................................... 107 8.3 Trtneti kitekints: Az adatbzisgpek .............................................................110 8.4 Adatkezels s adatfeldolgozs............................................................................110 8.5 Szabad-e ...? ..........................................................................................................112 8.6 llomny- s adatbziskezels ............................................................................113 8.7 A termszetes adatfeldolgozsi lnc .................................................................... 115 8.8 Technikai adatok .................................................................................................. 117 8.9 Az adatbzis alapvet titka ..................................................................................118 Ellenrz krdsek - 8 ................................................................................................119

    9. A METAADATBZIS ....................................................................... 121 9.1 Az adatbzisok kt szemlleti skja ......................................................................121 9.2 A metaadatbzis lnyege ..................................................................................... 122

  • 4

    9.3 Trtneti kitekints: Az adatsztr .................................................................... 124 9.4 A metarendszerek termszete............................................................................. 126 9.5 A metaismeretek fajti..........................................................................................127 9.6 Passzv, flaktv s aktv adatsztr ................................................................... 128 9.7 Tervezs bra alapjn .......................................................................................... 129

    10. ADATBZIS-MENEDZSELS......................................................... 131 10.1 Mitl lehet rossz az adatbzis?...........................................................................131 10.2 Hny az adatbzis? ............................................................................................ 132 10.3 Alkalmazsi adatszabvnyok ............................................................................ 133 10.4 Fejlesztsi adatszabvnyok ................................................................................135 10.5 Fejlesztsi eljrszabvnyok ............................................................................. 136 10.6 Menedzselsi szabvnyok...................................................................................137 10.7 Vltozsmenedzsels ......................................................................................... 139 10.8 Szervezeti felttelek ........................................................................................... 140

    11. AZ T ............................................................................................143 11.1 Elrehozott zrsz .............................................................................................. 143 11.2 Fogalom szletik................................................................................................. 144 11.3 Tbb szem ... ....................................................................................................... 145 11.4 Adat szletik ....................................................................................................... 146 11.5 Az ismeretek szerkesztse s els betltse .......................................................147 11.6 Bizonylatok ......................................................................................................... 148 11.7 Adatbevitel .......................................................................................................... 149 11.8 j ismeret szletik........................................................................................... 150 11.9 Adatkimenet s behangols ................................................................................ 151 11.10 A hossz s kanyargs t ..................................................................................152

    BEVEZETS - II. ................................................................................. 155

    12. AZ ADATMODELLEK HIBI.......................................................... 157 12.1 Az adatbzis hibinak a forrsai.........................................................................157 12.2 Az adatmodell lnyege ....................................................................................... 158 12.3 brzolsi konvenciink ................................................................................... 159 12.4 Tipikus adatmodellezsi hibk.......................................................................... 160 12.4.1 Nylt logikai tfeds ......................................................................................161 12.4.2 Ltszlagos logikai tfeds ......................................................................... 162 12.4.3 Rejtett logikai tfeds ................................................................................. 163 12.4.4 Jelsor-ellentmondsok ............................................................................... 164 12.4.5 A logikai tfeds hinya .............................................................................. 165 12.4.6 Fizikai tfeds.............................................................................................. 166 12.4.7 Kiegyenslyozatlansg.................................................................................167 12.4.8 Tisztzatlan tartalmak ................................................................................ 168 12.4.9 A modell ketts arculata............................................................................. 168 12.4.10 A hibk emberi kvetkezmnyei .............................................................. 169

    12.5 Az adatmodellezsi hibk gykerei ................................................................... 170 12.5.1 Nzetvaksg.................................................................................................. 170 12.5.2 Szintvaksg ................................................................................................... 171 12.5.3 Szerepvaksg................................................................................................. 171 12.5.4 Bemenet/kimenet vaksg ............................................................................172

    12.6 Az adatmodellezs cljai .....................................................................................173 Ellenrz krdsek - 12...............................................................................................174

  • 5

    13. FGGSEK S NORMALIZLS ................................................... 176 13.1 Egyszer szablyok..............................................................................................176 13.2 Funkcionlis fggs ............................................................................................177 13.3 Tartomnyfggs ............................................................................................... 180 13.4 Nem-normalizlt egyedtpusok......................................................................... 183 13.4.1 Az ismtlds s kros hatsa..................................................................... 183 13.4.2 Az ismtlds elvi alapja............................................................................. 184 13.4.3 A normalizls els lpse .......................................................................... 184 13.4.4 Tovbbi tudnivalk az ismtldsrl......................................................... 188

    13.5 A normalizls lnyege ...................................................................................... 190 13.6 Normalizls s struktra ................................................................................. 190 13.7 Ismtlds s ktsgek....................................................................................... 192 Ellenrz krdsek - 13.............................................................................................. 193

    14. ALAPVET NORMLFORMK......................................................195 14.1 A normalizls alapjai ........................................................................................ 195 14.2 A msodik normlforma.................................................................................... 196 14.2.1 A rszleges fggs s kvetkezmnyei.........................................................197 14.2.2 A normalizls msodik lpse .................................................................. 199 14.2.3 Normlforma s szemantika ..................................................................... 200 14.2.4 A msodik normlforma s a modellstruktra .........................................202

    14.3 A harmadik normlforma..................................................................................203 14.3.1 A tranzitv fggs s kvetkezmnyei.........................................................204 14.3.2 A normalizls harmadik lpse ................................................................205

    14.4 A normalizls termszete ................................................................................206 14.5 Normalizlsi sorrend........................................................................................207 14.6 A dekompozci sajtossgai.............................................................................209 14.7 Az alternl kulcs ................................................................................................211 Ellenrz krdsek - 14 ............................................................................................. 213

    15. MAGASABB NORMLFORMK.....................................................214 15.1 Hny, melyik s milyen a kulcs?........................................................................ 214 15.2 A Boyce-Codd normlforma (BCNF).................................................................215 15.2.1 A tbb sszetett kulcsjelltbl fakad gondok ...........................................215 15.2.2 A kulcstr fggs ........................................................................................217 15.2.3 BCNF problmk......................................................................................... 218 15.2.4 A normalizls negyedik lpse..................................................................220

    15.3 A negyedik normlforma ...................................................................................222 15.3.1 A tbbrtk fggs s az ltala okozott problmk.................................223 15.3.2 A normalizls tdik lpse ......................................................................224 15.3.3 Megjegyzsek a tbbrtk fggshez ....................................................... 225

    15.4 Az tdik normlforma ..................................................................................... 227 15.4.1 A kapcsolsfggs s az ltala okozott problmk .................................... 227 15.4.2 A normalizls hatodik lpse....................................................................228 15.4.3 Megjegyzsek a vgs normlformhoz ....................................................229

    Ellenrz krdsek - 15..............................................................................................230

    16. A CSOPORTOK CSAPDI .............................................................. 232 16.1 Eltr gondolkozsmdok .................................................................................232 16.2 A fggstblzat .................................................................................................233 16.3 Kt egyszer s hrom ismert fggsi helyzet..................................................234 16.4 A bels kulcstr fggs....................................................................................236 16.5 A metszetfggs..................................................................................................238

  • 6

    16.6 A csoportfggs.................................................................................................. 241 16.7 Tanulsgok s a dntsi tblzat kiegsztse..................................................242 16.8 Pszeudo-tranzitivits.........................................................................................243 Ellenrz krdsek - 16 .............................................................................................246

    17. NORMALIZLSI ELJRSOK .....................................................247 17.1 A normalizls, mint feldolgozs....................................................................... 247 17.2 Kapcsolathiny ...................................................................................................248 17.3 A dekompozci sszefoglalsa ..........................................................................251 17.4 Az univerzlis relci .......................................................................................251 17.5 Normlforma szintzis....................................................................................... 252 17.6 Krdezni tudni kell.............................................................................................254 17.7 Fggsek s szerkezetek..................................................................................... 255 17.8 Kt sszetett szerkezeti problma.....................................................................258 17.9 Az adatmodell fonalai .....................................................................................260 17.10 Apr szerkezeti titkok ......................................................................................264 17.11 A kulcsmtrix ....................................................................................................265

    18. SAJTOS SZERKEZETI TNYEZK.............................................. 268 18.1 Minsgi adatmodellezs...................................................................................268 18.2 Tbbszrs inhomogn kapcsolatok ................................................................269 18.3 A szerepnevek fggsei .......................................................................................271 18.4 Homogn viszonyok .......................................................................................... 273 18.5 A feltteles fggs s az egyedaltpus................................................................ 275 18.6 Unris egyedek...................................................................................................278 18.7 Szingulris egyedek............................................................................................280 18.8 Konstansok s tulajdonsgstruktrk .............................................................282 18.9 Az osztlyozs krdskre.................................................................................284

    19. TIPIKUS TERVEZSI HIBK........................................................ 286 19.1 Fegyelmezett fantzia.........................................................................................286 19.2 ltalnos tervezsi problmk ..........................................................................287 19.2.1 Nv-varicik ...............................................................................................287 19.2.2 Absztrakcis gondok...................................................................................288 19.2.3 A krlrs hinya.......................................................................................292

    19.3 A CSAK szindrma..........................................................................................293 19.4 Egyb csacskasgok ...........................................................................................296 19.5 Statikus szemllet ..............................................................................................298 19.5.1 Az id modellezse.......................................................................................298 19.5.2 Esemny, vltozs, llapot..........................................................................299

    19.6 Modell-sablonok ................................................................................................302 19.7 Szinttveszts .....................................................................................................304

    20. ELEMZS S DOKUMENTLS................................................... 305 20.1 Egy mintaplda ..................................................................................................305 20.2 A mintaplda tartalmi hibi..............................................................................306 20.3 Az adatmodell dokumentlsa .........................................................................308

    21. TERVEZSI ESETTANULMNY.....................................................313 21.1 A plda kerete ..................................................................................................... 313 21.2 A kiindul modell............................................................................................... 314 21.3 Az esettanulmny megoldsa el ......................................................................322 21.4 Ismerkeds az elemzend tervvel .....................................................................323 21.5 Az egyrtelmsg elemzse................................................................................324

  • 7

    21.6 Azonost- s azonossgelemzs....................................................................... 325 21.7 A plda tmenetileg javtott vltozata .............................................................. 327 21.8 A rejtett redundancik elemzse.......................................................................328 21.9 Kapcsolatelemzs ...............................................................................................329 21.10 A plda idleges megoldsa .............................................................................330 21.11 Zrsz.................................................................................................................333

    FELADATMEGOLDSOK....................................................................335

    IRODALOMJEGYZK ........................................................................ 339

    FOGALOMJEGYZK...........................................................................341

  • 8

    ELZMNYEK

    A szerz 1972-ben tallkozott elszr az adatbzisokkal. 1974-ben irnyult a figyelme az adatbzistervezs fel. A UNDP ltal tmogatott SZMOK j mhelynek bizonyult kutatsai-hoz. Mr akkor megismerhette a legkorszerbb irnyzatokat. Lehetsge nylt arra, hogy tbb tzezer oldalnyi szakanyagot ttanulmnyozzon s sszelltson egy terjedelmes magnknyvtrat az adatbzisokra vonatkoz irodalmakbl. Ennek alapjn adta ki 1978-ban az Adatbzisok keze-lsnek alapvet krdsei cm nvdjas munkjt, amelyet 1982-ben jranyomtak. 1980-ban kszlt el az Adatmodellezs, adatbzistervezs cm mve. Mindkt kiadvny kziknyvv vlt az adatbzisok irnt fogkonyak szmra.

    1982-re a szerz rdekldse mindinkbb a gyakorlat fel fordult. Egyrszt az adatbzis-tervezst tmogat szoftverek fejlesztsbe fogott, msrszt ezeket az eszkzket mindennapos munkkban alkalmazta. 1981-ben kszlt el SZIAM nev els adatbzis-normalizl programja, amelyre az IBM is felfigyelt s megvette a licenct. Ez volt a legels szoftver, amit az IBM a kelet-eurpai orszgokbl valaha is vsrolt. 1982-ben a szerzt az IBM eurpai kutatkz-pontjban (E.S.R.I.) tartand eladssorozatra hvtk meg. A Gyakorlati adatmodellezs cm eladst ngyszer ismteltettk meg.

    Ekkor mr a munkt a SZMALK-ban folytatta. Az jabb knyvet (Adatmodellezs a rendszerfejlesztsben, 1983.) jabb szoftver kvette. 1984-ben kszlt el az dm & va adat- s eljrsmodellezsi segdeszkz, amelyet a BMW AG. is megvsrolt. A vonalat a SYDES, majd az ABLAK adatbzistervez programok vittk tovbb. Idkzben az r tucatnyi adatbzis-tervezsi projekt vezetjeknt vagy szaktancsadjaknt tkztethette elmlett a gyakorlattal. Ennek sorn ipari, mezgazdasgi, pnzgyi, kzlekedsi, kereskedelmi, nkormnyzati, mzeu-mi, hradsi, jogvdelmi stb. terleteken volt lehetsge bepillantani az ismeretek sszefgg-seinek a rejtelmeibe.

    1987 vgn az elmleti kutats s a gyakorlati alkalmazs egy idre megszakadt. Kt krh-zakban tbb tucat opercival eltlttt v utn a szerz az B - BEL Kft-nl tallkozott ismt kedvenc adatbzisaival. 1992-ben a Szmtstechnika hasbjain jelent meg Az adatbzistervezs titkai cm cikksorozata, amely ennek a knyvnek a kzvetlen elfutra. Egy-egy mtt kztt sszelltotta legjabb adatmodell-elemz szoftvert, az AMOR-t s az LOM becenev ltal-nostott adatbziskezel rendszert.

    Tbb, mint hsz vnyi elmleti kutats, szoftverfejleszts s gyakorlati alkalmazs kpezi elzmnyknt ennek a mnek a httert...

  • 9

    ELSZ

    Hrom krdskr motoszkl a fejemben. Az egyik az, hogy mikor is rom ezt a knyvet? 1983-ban jelent meg az Adatmodellezs a rendszerfejlesztsben cm munkm. Nagyon sok bartom s kedves kollgm szerint tlzottan korn. Szerintk tz vvel ezeltt mg nem rett meg a helyzet mondanivalm befogadsra. Bezzeg most, amikor minden vllalat talaktja, kor-szersti az informcis rendszert, amikor mr megvehet egy csinos gpet s egy valdi relcis adatkezelt, most szksg lenne az adatbzistervezs ismereteire. Vagyis ezzel a knyvvel szerintk vgl is elkstem.

    n pedig nagyon flek attl, hogy mg mindig tl korai ez a kiadvny. Legalbbis bizonyos rszeinek a befogadsra, megemsztsre mg nem mindenki lesz kpes. A verb, a varj s a sas dilemmjval kell szembenznem. Azok, akik mg csak az xBASE-szer adatkezel verebek-kel bbeldnek, nem fogjk megrteni, hogy mirt van szksg ilyen bonyolult adatbzis-tervezsi mdszerekre. Mg tbb bajuk lesz velem azoknak, akik lttak mr karn varnyt, azaz megamini kategrij relcis adatkezel rendszert. Ht mr az is gond? Hzok egy indexet, aztn annyi. mdon gondolkoznak. A valban sokfle technikai lehetsgtl elbvlve nem reznek r, hogy n mirt mindig a valsg ismereteinek a h s termszetes tkrzst helyezem eltrbe a technikai megoldsokkal (pl. index) szemben. n a jelenlegieknl sokkal, de sokkal jobb kezelket is el tudok kpzelni, amelyek gy viszonyulnak a relcisakhoz, mint sas a varj-hoz. Mondanivalmat e legfels szinthez szabtam s ezrt flek, hogy nem fog mindenki velem szrnyalni.

    A msodik krds az, hogy kinek is rom ezt a knyvet? Az adatbzistervezs komoly technikai tudst felttelez. Ezrt jogosan tnik gy, hogy ez a kiadvny elssorban a mai s a leend fejlesztnek, a szakembernek szl. Csakhogy az informcis rendszerek fejlesztsnek van kt tovbbi rsztvevje is. Az egyik, a kulcsfigura, a vezet. Ha a menedzser nincs tisztban az adatbzis tervezsnek a buktatival, ha azt hiszi, hogy egy ma meglmodott bizonylat alapjn holnap mr l adatbzis fog mkdni, akkor a fejleszt hiba ismeri az adattervezs titkait. Egyszeren nem kap elg idt arra, hogy rvnyestse a tervezs minimlis kvetelmnyeit. A vezet mr x alkalommal tapasztalta, hogy gyorsan nem lehet j adatbzist pteni. Ennek ellen-re az y-dik helyzetben is az azonnali megoldst srgeti. Nemigen pozitv a harmadik rsztvev, a felhasznl szerepe sem. Elhamarkodott ignyekkel ll el, amelyeket azutn nap mint nap mdost. Pedig tudjuk, hogy az adatbzis leginkbb a strukturlis vltozsra rzkeny. Tegyk mindehhez a felhasznli nzst. Az n adatom az n vram! Abba ne szljon bele senki, csak legfeljebb az n fejlesztm, mert nlkle semmire sem megyek. A valjban kzs adatokat alkal-maz felhasznlk gy rejtegetik egyms ell az adatbzisaikat, mint a legrtkesebb kincset.

    A j adatbzis kialaktsnak a sikere a hrom szerepl rtelmes egyttmkdstl fgg. Ezrt ez a knyv elvileg mindhrom partinak szl. Gyakorlatilag nem bzom abban, hogy a kiadvny megtallja a cmzetteket s elri a kvnt vltozst. Hiszen mg sajt kollgimmal, a fejlesztkkel is meg kell kzdenem.

    Persze hrom rteggel nem fogok sokra menni. Az els csapatot azok az aggcsecsemk alkotjk, akik mg mindig a hetvenes vek szmtstechnikai emlit szopogatjk. k mr vn motorosok a szakmban, nekik ne mondjanak mr semmit, mert nincs j a nap alatt. A beverkli-zett mdon, az jabb eszkzkre, mdszerekre, lehetsgekre fittyet hnyva tkolgatjk ssze sdi rendszereiket a jl bevlt sablonok szerint.

    Azutn itt van az ifjtitnok hada. A mindig jabb s jabb gpek s programok mellett elktelezettek. Sokszor megdbbent, hogy velk trsalogva azon kapom magam, hogy nem emberrel, hanem hardverrel vagy szoftverrel beszlek. Te, s ez a rendszer ezt csinlja, meg azt tudja... Srtdtt hallgats a vlasz, amikor megkrdezem, hogy s.... s Te, fiam, szemly

  • 10

    szerint Te mit csinlsz s mit tudsz? A drga gyermek nem rti, hogy egy dolog a technika ismerete, s teljesen ms annak mindenki javra val hasznlata.

    Persze vannak olyanok is, akik mindezzel nem trdnek. A hullmlovagokrl van sz. A flmvelt mtstechnikus a papa pozcija miatt bekerl a vilgbanki klcsnnel tmogatott projektbe. Naponta keres annyit, amennyi egy becsletes dolgoz havi bre. Persze semmihez sem rt valjban, de ez t nem is rdekli. Mondanom sem kell, hogy ez a knyv nem neki, nem is a tanulni kptelen aggcsecsemnek vagy a tanuls rtelmt nem ismer ifjtitnnak - aki maga is hamar koravnn vlik - szl. Ht akkor kinek?

    Ezzel eljutottam a harmadik krdshez. Mirt is rom ezt a knyvet? Azrt, mert Benned bzom. A llekben fiatalban. Aki akar s tud vresen-komolyan jtszani. Akit a krlmnyek korltoznak; aki nem kpes mindig a legjobbat alkotni; de aki egy krtyaparti utn napokkal is elgondolkozik azon, hogy hol szrta el s miknt lett volna - jobb. Ez a knyv a felntten komoly fiataloknak, a humorra kpeseknek szl. Akik tudjk, hogy a humor nem vicc, hanem az let s embertrsaink mlyen blcs, megrt, megmosolyg szeretete.

    Kt szp lnyomnak ajnlom ezt a knyvet akkor is, ha k nem kvetik az n hivatsomat. Igen, hivatst mondtam, nem szakmt. Ez az adatbzistervezs legeslegfbb titka. Nem azrt kell j adatbzist tervezni, hogy engem megdicsrjenek (szakma). Hanem azrt, hogy msokat jl el tudjunk ltni az let nlklzhetetlen kellkvel, az ismerettel (hivats). Elssorban nem a technikt, hanem ezt a szemlletet kell elsajttani. Ha valamit sikerl megreztetnem ebbl a lnyegbl, akkor ez a knyv nem rdott hiba.

    Az adatbzisok tervezshez, felntt rlelshez ppen annyi trelem szksges, mint a fiatalokhoz. Nem mindig ltod erfesztseid azonnali gymlcst. Nem kapod meg rgtn az annyira vrt kszn szavakat. Majd egy napon, amikor a komoly, nehz, becsletes jtk a te rszedrl mr rgen vget rt, amikor mr minden a helyre rendezdtt s neked mr nincs szereped, amikor mr nem is szmtasz r, vratlanul gy szlnak hozzd: Ksznm. Lehet, hogy ezt a szt gy soha meg nem hallod. Csak ppen a szomszd utcban a Kovcs kedves lesz a nejhez, mert hsz helyett kt msodperc alatt adtk ki az informciit a Te j adatbzisterved miatt. No ltod, ezrt hivats az adatbzistervezs.

    Mr csak annyi maradt htra, hogy megksznjem mindazoknak a segtsgt, akik e knyv megszletshez hozzjrultak. Legfkppen pedig ksznetet mondjak Annak, akitl kaptam a tudst s annak tadsnak knyszert illetve lehetsgt.

    Halassy Bla

  • 11

    I. RSZ

    Az adatbzistervezs alapjai

  • 12

    BEVEZETS - I.

    A j adatbzis kialaktshoz (is) kt dologra van szksg. Az egyik az alapos technikai tuds. A msik kellk, amely nlkl az elz szinte semmit sem r, a megfelel szemllet. Ennek a mnek az els rszben - a msodik megalapozsaknt - elssorban az adatbzis helyes szem-lletnek a feltrsa lesz a feladatunk. Legyen szabad egy trivilis pldval lve elre megvil-gtani mondanivalnk tartalmt.

    A lnyeget az rti meg leginkbb, aki ltja a mris, az ulti s a bridzs kztti klnbsgeket. A mris a gyerekek jtka. Ketten jtsszk. A szablyok roppant egyszerek s elre adottak. Ebben a jtkban szinte nem is lehet hibzni. Ha valaki magnclra kszt nhny egymstl valban fggetlen szmtgpes nyilvntartst, akkor az olyan, mint a mris. Gyerekjtk. Persze az alapszablyokat ekkor is kell tudni s azokat illik is betartani.

    Nlunk ma a szmtstechnikai ulti a divat. Nem babra megy ez a jtk: millis alapon mvelik. A szablyok mr sszetettebbek a mrisnl. Egytt kell mkdnnk a partnernkkel s figyelnnk kell minden implicit jelzsre, akr az ellenflre is. Brmennyire is izgalmas, az ulti rutinjtk. Ha valakinek van lapja vagy gyesen csinl magnak, akkor mr nemigen tved-het. Ebben a jtkban a fantzinak nincs tl sok szerepe. Rutinosan, tbb vtizede megismert szablyok alapjn jtsszuk a mai magyar szmtstechnikt.

    A krtyajtkok kirlynje, a bridzs, teljesen ms jelleg. Nem csupn az a cl, hogy nyerjnk. gy illik, hogy a lehet legtbbet hozzuk ki a lapunkbl. St, mg a vesztes is nyerhet akkor, ha minimalizlja az ellenfl nyeresgt. Az alapszablyok adottak, de a bridzsben nagyon fontos szerepet jtszanak az n. konvencik, a szleskren alkalmazott s az sszes jtkos ltal ismert megegyezsek. Az lenne a j, ha a szmtstechnikt nem ultiknt, hanem bridzsknt jtszannk.

    A j jtkosnak ismernie kell magt a lapot. Teht tudnia kell azt, hogy mi az adat. Viszont nem egy, hanem tizenhrom lapot kap, amely egytt mr ms minsg. Tisztban kell lenni azzal, hogy a lapkombincibl mit lehet kihozni (informci). Knyvnk els fejezetben az adat s az informci alapfogalmaival ismertetjk meg az olvast.

    A trsasgi bridzs s a versenybridzs alapjai kzsek, de szablyai msok. A szmtgpes ismeretkezelsnek is tbb mdja van, noha a lnyeg kzs. A msodik fejezetben a szvegszer s az adatszer ismeretkezels azonos s eltr vonsait trjuk fel. Rmutatunk arra, hogy az utbbi lnyegesen feszesebb, de ugyanakkor tbb lehetsget nyjt, izgalmasabb ismeretszer-kesztst kvetel meg.

    Vannak, akik gymond bridzselnek, de ennek a nagyon komoly jtknak az gynevezett kvhzi vltozatt mvelik. Az antibridzset. Mindenki a sajt feje szerint mrlegel, nknyes, msok ltal nem ismert vagy rgen tlhaladott konvencikat hasznl. Sajnos ez jellemz a mai szmtstechnikusok egy rszre is. Ezrt a knyv harmadik fejezetben el kell mondanunk, hogy mi melyik verzit jtsszuk. Vagyis azt, hogy szerintnk mit is jelent maga az adatbzis.

    A bridzs az a jtk, amit mindig lehet tanulni, de sohasem lehet teljesen megtanulni. Az ember mindig rbukkan egy jabb lapsszefggsre, egy jobb megoldsra. A lapkombincikat fokozatosan mrlegeli. Az els rnzsre sejti, hogy ebbl a lapbl egyltaln az hozhat ki, hogy... Azutn mlyebben rtkel. Br ez a hasonlat nem teljesen l, az adatbzis esetben is szintenknt vizsgljuk az adatainkat. Errl szl a negyedik fejezet.

    A bridzsben nincs egyni jtk. A prosoknak - st, mg az ellenflnek is - ugyanazokat a lapokat kell ltniuk. Az egsz licit arra megy ki, hogy megbeszljk kettnk egyttes lapjt, amit gy persze az ellenfl is megismer. Az adatbzis lnyege az, hogy egyni lapjainkbl indu-lunk ki, de a vgn a lapok egyttese alapjn jtszunk. Az adatbzis kzs, br annak egyes rszeit msknt ltjuk. Ezt a gondolatot fejti ki az tdik fejezet.

  • 13

    Mindeddig a jtk alapszablyairl volt csak sz. Arrl nem beszltnk, hogy milyen eltr lapkombincik fordulnak el a bridzsben s azokkal mit lehet kezdeni. Vannak alapszint szerkezetek, hiszen az egyenltlen s az egyenletes eloszts lapokat mr minden kezd krtys meg tudja klnbztetni egymstl. Ezeken bell vannak rafinlt elrendezsek. Mst jelent a hetes hossz treff fej nlkl, mint a hatos fejjel. A knyv hatodik s hetedik fejezete az alapvet s a bonyolultabb adatkombincikat mutatja be.

    A bridzs kt jtkfzisbl ll. A licitbl s a lejtszsbl. Az els szakaszban felptik a jtkot, vagyis meghatrozzk, hogy a lapbl mit akarnak kihozni. A msodik rszben prbljk megvalstani az elkpzelst, vagyis tnylegesen kinyerni a lapbl azt, amit abban lttak. Az adatbzis logikja is hasonlt erre. Van egy szakasz, amelyben az adatbzist megtervezzk s fel-ptjk. Majd hasznlatba vesszk, ksrletet tve arra, hogy a lehet legtbbet hozzuk ki belle. Az adatbzis kezelsrl a nyolcadik fejezet szl. Itt mr kimondottan versenybridzsrl van sz. Vagyis klnbz jtkosok ugyanabbl a paklibl teljesen eltr eredmnyeket csiholhatnak ki. Egyazon adatbzisbl ki tbb, ki kevesebb ismeretet nyer. Ki knnyebben, ki nehezebben - jtktudsa szerint.

    Minden hasonlat sntt. Bridzs-analgink is lassan erltetett vlik. De taln mgsem haszontalan elmondani, hogy a versenybridzs leosztsait megrktik, hogy a flrertseket s az azokbl fakad vitkat elkerljk. A konkrt lapkombincikon kvl ltalnos szablygyjte-mnyek figyelmeztetik a versenyzket az alapvet tudnivalkra. A verseny kezdetekor - nem kzben, nem utlag - a jtkosok bejelentik az ltaluk alkalmazott konvencikat. Mert a jtk csak akkor fair, ha azokat mindenki ismeri. Az adatbzis-jtknak is vannak ltalnos szablyai, specifikus megegyezsei s az adatbzisnak van konkrt leosztsa, szerkezete. gy illik, hogy mindezeket a tnyezket egy helyen, mindenki ltal fellapozhatan, megismerheten rgztsk. Az adatbzis ltalnos lersra szolgl a kilencedik fejezetben bemutatott metaadatbzis.

    A bridzsversenyeken a tulajdonkppeni jtkosokon kvl szmos egyb szemly is kzre-mkdik. A kirk, a zsri, a brk, az osztk stb. Az adatbzis is ilyen sszetett jtk. A fejleszt s felhasznl prosn kvl tbb rsztvevje van, mindegyik sajtos szerepkrrel. Ezekrl a specilis funkcikrl szl a tizedik fejezet.

    Vgl is a bridzsnek az a lnyege, hogy jtsszk. A megfelel elkszletek utn valahol sszejnnek, lelnek, osztanak s belefeledkeznek a vres-komoly jtk varzslatba. A tizen-egyedik fejezet sszegzi az ismeret tjt az adattl az adatbzison t az informciig.

    A mondanival megrtst a pldkon s brkon kvl ellenrz krdsekkel is segteni prbljuk. A feladatokra adott helyesnek tartott vlaszokat a krdsben mutatott betvel vagy a vlasz sorszmval kell megjellni. Adott esetben tbb helyes s rossz vlasz is ltezik. A knyv vgn tallhatk a helyes megoldsok. Ha valakinek ktsgei tmadnak, akkor keresse fel tanr-jt, bartjt stb. Vgs esetben pedig a szerzt.

  • 14

    1. ADAT S INFORMCI

    1.1 Az alapfogalmak szemlletmdja

    Kt dolog van a vilgon, amely nem fogy el soha, ha msokkal is megosztjk. Az egyik a szeretet, a msik pedig az ismeret. Ez a kt dolog szorosan sszefgg. Az ember trsas lny. Azrt kapott partnereket, hogy legyenek, akikkel egyttmkdve meg tudja valstani lete rtel-mt. Megtallja azokat, akikre tmaszkodhat s megkeresse a tmogatandkat. Egsz letnket a msokkal val kommunikci, vagyis az ismeretek cserje hatrozza meg. A klcsns informls nemcsak risi lehetsg, nemcsak sajt ltnk nlklzhetetlen felttele, hanem egyben a szeretet ltal diktlt ktelezettsg is, mivel msok letrt is felelsek vagyunk.

    A fentiekbl kvetkezik, hogy a magt tudatos lnynek vall embernek el kell sajttania a kommunikls megfelel mdjt. Ehhez pedig sokat kellene tudnia magrl az ismeretrl. Persze az emberek a htkznapi rintkezs sorn nem boncolgatjk a kzlsek termszett s nem is rendelkezik mindenki az ehhez szksges felkszltsggel. Vannak azonban olyan szakemberek, akiknek mindennapos munkja valamilyen mdon az informcik kezelshez, feldolgozshoz, tadshoz kapcsoldik. Vilgos, hogy feladatukat csak akkor tudjk kielgten elvgezni, ha alaposan ismerik tevkenysgk ltalnos trgyt. Ehhez kpest elgg elszomort, hogy az ismeretekkel dolgoz emberek nem kellkppen tjkozottak az adat s az informci mibenltt illeten.

    Ennek a fejezetnek az a clja, hogy mlyrehatan feltrja az adat illetve az informci lnyegt s e szavak kznapi jelentsn tlmutat rtelmet adjon nekik.

    Az adat s az informci fogalmak az ismeret rokonai, amennyiben a mindennapos letben e hrom szt felcserlhet, egymst mintegy helyettest kifejezsekknt - szinonimkknt - hasz-nljuk. St, az ismeretekkel foglalkoz tudomnyos vilg elmleti publikciiban s az ismeretek gyakorlati kezelst tmogat szmtgpes rendszerek kziknyveiben is sokszor alternatv fogalomknt jelenik meg az adat s az informci. A htkznapok kellemes pongyolasga nem akadlyozhat meg bennnket abban, hogy megprbljuk szigor kvetkezetessggel feltrni az adat s az informci lnyegt, klnbsgt s viszonyt.

    Az adatkezels s -feldolgozs - szolgltats. Ezt a szolglatot a szakemberek csak akkor tudjk mindenki megelgedsre elltni, ha j magatartst sajttanak el. Ha az ismeretet nem a szmtgp, hanem az ember oldalrl nzik. Knyvnkben arra tesznk ksrletet, hogy be-mutassuk ezt a ma mg sokak szmra szokatlan s jszer szemlletmdot.

    1.2 Az adat - els megkzeltsben

    Induljunk ki az adat sz eredeti latin jelentsbl. A datum szt a latinok fnvknt s igenvknt is hasznltk. Elbbi formjban jelentse adomny, ajndk (v. az elz pont els bekezdsvel). Egybknt adottat jelent - s innen szrmazik a mi dtum szavunk is. Az igenv tbbes szma data, vagyis adottak, az adott dolgok. Ezzel a formval srn tall-

  • 15

    kozunk az angolszsz szakmai irodalomban. Alapvet jelentsgt jl mutatja, hogy az IBM adatfeldolgozsi sztrban [1] tbb mint 100 szszedet kezddik a data szval.

    A hivatkozott sztr hrom meghatrozst is ad magra az adat fogalomra (103. o.). A kittelek kzl kett korltos, mert az adatot annak valamilyen megjelentsi formjhoz kti. Ezrt csak az els defincit idzzk:

    Az adat tnyek, fogalmak, eligaztsok olyan formalizlt reprezentcija (megjelentse, tkrkpe), amely alkalmas az emberi vagy az automatikus eszkzk ltal trtn kommuni-kcira, rtelmezsre vagy feldolgozsra.

    Mivel a fogalmak s az eligaztsok (az eredetiben: instructions) maguk is tnyek, a meg-hatrozs kicsit terjengs. Viszont ppen ezrt jl utal arra, hogy nemcsak a konkrt dolgokat kell tnyekknt felfognunk. Jl kapcsoldik ide a hazai Idegen szavak sztrnak [2] a megfogal-mazsa. E szerint a data ismert tnyeket, adatokat, dolgokat jelent. Teht az adat ismert tny s az ismert tny adat.

    Az IBM meghatrozsa formai elemet is tartalmaz, amennyiben a reprezentcira, az ismeret megjelentsi mdjra utal. Az ember kptelen megismerni azokat a tnyeket, amelyeket nem a megfelel, az ltala is emszthet formban kzlnek vele. ppen ezrt elszr azon kell elgondolkodnunk, hogy milyen mdon jutunk ismereteinknek a birtokba.

    1.3 Az ismeretszerzs momentumai

    Az ismeretet mindig valamilyen kzeg hordozza. Ezrt az ismeret megszerzsnek els momentuma az szlels, vagyis a szembesls a kzeggel. Itt van az jsg: olvassuk el. Most mindegy, hogy kzl-e velnk valami lnyegeset, vagy sem; ha nincs kznl, nem tudjuk t-bngszni. Ha az szmunkra fontos, akkor rte kell mennnk. Mivel az ismeret tkrzi a tnyeket, ha nincs pldul kszletkimutatsunk, vagy az nem ll rendelkezsnkre amikor s ahol ignyeljk, az csaknem annyit jelent, mintha kszletnk sem lenne. Az ismerethordoz kzeg aktulis jelenlte az szlels alapvet felttele.

    Az ismeretekkel foglalkoz szakemberek mris levonhatjk az els tanulsgot: az ismeretkzls sikernek legels felttele az ismerethordoz kzeg aktualitsa. Mit r az a levl, amely egy mai fontos esemnyre hvna meg, de csak holnap kapom meg?

    Az ismeretszerzs msodik momentuma az rzkels. Brmennyire is fjdalmas, vannak embertrsaink, akik nem ltnak s/vagy nem hallanak. A cskkentlt szmra az rs, a kp, a cskkenthall rszre a hang, a zaj nem rzkelhet. Az ismeret mindig valamilyen formt lt. Az IBM fenti meghatrozsnak megfelelen olyat, amely alkalmas az emberi kommunikcira. (A gpet egyelre mellzzk.) Az rzkels felttele, hogy a forma megfeleljen az ismeretet fogad ember fizikai kpessgeinek.

    A fentiekbl kvetkezik a msodik tanulsg. Az ismeretkzlsnek szmos formja van. A szakembereknek trekednik kell arra, hogy a formt a sz szoros rtelmben az ismeret cmzettjnek a testre szabjk. Az IBM tovbbi meghatrozsait ppen azrt nem idztk, mivel azok az adatot a szemmel lthat tnyekhez ktttk. Holott ismeret szmos ms mdon is tadhat - s nem csak cskkentlt embertestvreinknek.

  • 16

    A harmadik momentum a felfogs. Most ide runk kt jelet, kicsit elnagyoltan:

    Az olvask mindegyike szleli s rzkeli e jeleket, de csak pran fogjk fel a jelentsket. Hiba adnnk meg latin bets vltozatukat - nyippon vagy nyihon - is. A megfejtst csak az tudja, aki rt japnul. Mert a jelek valjban betk, az bra valban rs, s a nyippon illetve nyihon sz ennyit jelent: Japn.

    Az ismeretekkel dolgoz szakemberek mr lthatjk a harmadik tanulsgot is. A tnyeket felfoghatan, azaz rthet jelekkel kell ismertetni. A kzlsekben mellzni kell az ltalunk hasznlt, de az ismeretet fogad fl szmra felfoghatatlan sajtos jeleket.

    A negyedik ismeretszerzsi momentum a megrts. A felfogs s a megrts nagyon kzel llnak egymshoz, de nem teljesen azonos lnyegek. Vegyk csak pldul a kvetkez hrom jelsort: Bla - alB - bela. Az els minden rett magyar ember szmra rthet ismeretet kzl, de egyltaln nem biztos, hogy mond valamit a latin betket amgy ismer knainak. A rejtvnyeket kedvelk felfedezik, hogy a msodik jelsor ugyanazt a tartalmat hordozza, mint az els. A harmadik szrl adott krnyezetben nhny bennfentes tudja, hogy valjban azonos a Bla karaktersorral, csak bizonyos technikai krlmnyek miatt gy brzoltk az ismeretet. Viszont egy szlv npbe tartoz valaki a jelsort ltva gy szl magban: J, itt valami fehrrl van sz. Az ismeretet felfogja, de annak valdi lnyegt nem rti meg.

    A felfogs s a megrts eltrse kt dologra hvja fel a szakemberek figyelmt. Egyrszt az zlsessgre. Megengedhetetlen s zlstelen az ismeretek formailag pontatlan kzlse. Ugyan ki szeretn becsletes lmos nevt almos mdon rtan olvasni? Msrszt arra, hogy a kzls legfontosabb hordozkzege az emberi nyelv, amely npekhez, nemzetekhez kttt. Teht a tnyeket zlsesen (formailag pontosan), az alkalmazott kzeg (esetnkben: a nyelv) szablyait betartva kell tudatni az ismeret megclzott fogadjval.

    Az szlelhet, rzkelhet, felfoghat, st megrthet kzls, - amelynek tartalmt meg is akarjuk ismerni, mert szmunkra elfogadhat, zlses formban tlaltk - mr alkalmas az rtelmezsre (a kommunikcira, a feldolgozsra - v. az IBM defincijval). Most mr mdunk van az adat meghatrozsra s arra, hogy elgondolkodjunk az rtelmezs lnyegn.

    (Megjegyzs: Az ismeretszerzsnek van egy msik mdja is. j tudsra a mr meglv ismeretek kezelsvel s feldolgozsval is szert tehetnk. Ezekrl a lehetsgrl majd knyvnk 8.5 pontjban emlkeznk meg.)

    1.4 Az adat s az informci lnyege illetve viszonya

    A fentiekben lertuk - azaz sokak szmra szlelheten, rzkelheten, felfoghatan s rtheten kzltk - e jelsort: Bla. Bizonyra akadtak, akik a karaktersorozat olvastn gy szltak magukban: J, hiszen itt valakinek a keresztneve Bla.

    Pardon, lljunk csak meg! Mindeddig sz sem volt keresztnvrl! Nem mi jelentettk ki, hogy a Bla keresztnv, hanem az olvas vonta le ezt a kvetkeztetst. Az ismeretet fogad a jelsor lttn nkntelenl is elvgzett magban egy gondolkodsi mveletet. Ha felfedezi ennek a tevkenysgnek a lnyegt, akkor mris kzel jut az adat s az informci meglehetsen pontos elhatrolshoz.

  • 17

    D 1/1 Az adat rtelmezhet (szlelhet, rzkelhet, felfoghat s megrthet) ismeret.

    A Bla jelsor szlelhet (itt van), rzkelhet (rva van), felfoghat (ismert jelekkel rtuk le), megrthet (a lert jelsor tartalma nem idegen) ismeretet hordoz. Nem pusztn a B, az , az l s az a betk egyvelege. Meghatrozsunk az ltalnosan megszokott definciktl kt lnyegben klnbzik:

    Nem hangslyozza a tnyszer lnyeget. Az adat kzlhet tnyt, m utalhat elkpzelsre, tervre, szndkra, fikcira is.

    Nem kti meg a megjelentsi formt. Az rs, a kp, a hang, a szag, az rints, a mozdulat stb. egyarnt hordozhat ismeretet.

    Most trjnk t a fenti j-re! Ez a meglehetsen vulgris (kznsges) kittel igen jl tkrzi az informci lnyegt. Egy szval sem lltottuk, hogy a Bla jelsor keresztnevet takar. Az olvas mgis ezt a kvetkeztetst vonta le - helyesen. szlelte, rzkelte, felfogta, megrtette a jelsort, amit ekknt mr rtelmezni is tudott. Az rtelmezs lnyege, hogy az jonnan kapott kzlst rgi tudsunkhoz ktjk.

    Tudjuk, hogy a Bla keresztnv. Ezrt a Bla jelsor olvastn azonnal keresztnvre asszocilunk, azaz sszektjk az j rtelmezhet ismeretet a mr rtelmezettel. Ha nem rte-nnk, hogy mit is jelent a Bla jelsor s mi a keresztnv, nem volna mit mihez kapcsolnunk. Nem szletne bennnk - informci.

    Az informci szokvnyos meghatrozsai tbbnyire floldalasak. Az Idegen szavak szt-ra [2] szerint az informci felvilgosts, tudsts, tjkoztats, hrkzls illetve rtesls, adat. Ez a definci sszemossa az rtelmezhet dolgot (adat) az rtelmezs eredmnyvel. Az IBM [1] megfogalmazsa sokkal jobban megkzelti a lnyeget. Az informci Az a jelents, amelyet az ember tulajdont az adatnak .... Sajt, ltszlag sokkal egyszerbb meghatrozsunk kzlse utn kifejtjk, hogy a kt definci mirt floldalas. Szerintnk:

    D 1/2 Az informci j ismerett rtelmezett adat.

    Az informci nem azonos az adattal, hanem az adatnak az a jelentse, amit az ember annak tulajdont az rtelmezs ltal. Ennyiben az IBM meghatrozsa teljesen korrekt. Viszont az infor-mci mindig hr, mindig valamilyen jdonsg, j ismeret, felvilgosts. Az IBM defincija ezt a tnyezt elhanyagolja. Pedig az jdonsg momentum nagyon is fontos. Ha tvenszer el-mondjuk ugyanazon szemlyeknek, hogy e knyv szerzje Bla, azzal semmi jat sem kzlnk. Az olvasban nem szletik j ismeret - informci.

    Az Idegen szavak sztra helyesen emeli ki az informci jszersgnek a vonst, viszont nem utal arra, hogy az ismeretrt rtelmezssel kell megdolgoznunk. gy elrejti ellnk azt a tnyt, hogy ugyanaz a tudsts teljesen eltr informcikra vezethet attl fggen, hogy a felvilgostsnak milyen jelentst tulajdontunk. Lssuk csak a kvetkez pldamondatot:

    1.1 plda

    Az X agrrvllalatnl a tengeri hozama az idn Z mzsa rgi magyar holdanknt.

    A kzlst sokan nem rtik, mert nem tudjk, hogy a tengeri az a trkbza, vagyis a kukorica. Msok fennakadnak a rgi magyar hold kifejezsen. Mi az, hogy magyar s rgi? Mirt nem hektr? Ismt msok figyelmeztetnek, hogy a mzsa mr nem bevett mrtkegysg. Mrmost akik rtik a mondatot s rtelmezik is annak mondanivaljt, azok is eltr kvetkez-

  • 18

    tetsre jutnak. Van, aki a Z hozamot kevesli. Ms szerint elegend vagy j. Ezek az emberek mr tovbbi httrismerethez is tudnak kapcsolni: a tengeri hozama annyi szokott lenni... Azon a tjon s olyan idjrs mellett... - teszik hozz a mg rtbbek. Milyen volt a tengeri fajtja? Milyen technolgival vetettk, gondoztk, arattk?

    Az egyetlen ismeret akr szz krdst is szlhet. A krdsekre adott vlaszok eredmnyezik a vgs kvetkeztetst. Krdezni viszont csak az tud, aki az eredeti kzlst is informciv tudta rtelmezni.

    Amint ltjuk, az adat egy, mg a belle szlet informci szmos lehet. Az adat szemly-telen, tnyt kzl objektv ismeret. Ezzel szemben az informci mindig szemlyes, az adatot fogad szubjektumhoz ktd lnyeg. Ebbl a kettssgbl az adat kezelsre s -feldolgozsra vllalkoz gyakorlati szakembereknek s az ismeretekkel elmletileg foglalkoz tudsoknak tbb kvetkeztetst kellene levonniuk.

    1.5 Szintaktika, szemantika, pragmatika

    Az albbi elmlkeds tjkoztat jelleg. Nem tartozik szorosan az adat s az informci elvi lnyegnek a kifejtshez. Csupn a mai ismeretkezelsi gyakorlatot s elmletet kvnja megvilgtani. Fantasztikus szmtgpekkel s csodlatos ismeretkezel szoftverekkel rendelke-znk. Akkor mirt van az, hogy mgis lland ismeretnsgben szenvednk? A kvetkez bekezdsek adnak magyarzatot erre a krdsre.

    A gyakorlati szakemberek ltalnos hibja, hogy nem ismerik fel az adat s az informci elmleti klnbsgt. Nevezetesen azt, hogy az elbbi tnyt kzl, teht objektv valami, mg az utbbi szemlyesen rtelmezett dolog, vagyis szubjektv. Ezrt nem alkalmazzk azt az elvet, hogy az ismeretet mindig gy kell tlalni, hogy az a megclzott felhasznl ltal knnyen rtel-mezhet legyen. Szelektv, emberre szabott adatszolgltatsra, szemlyes jelleg ismeretkzlsre lenne szksg. Ezzel a kvetelmnnyel szemben a mai felhasznl gyakran kap elrhetsgben (szlels), megjelentsben (rzkels), formjban (felfogs) s tartalmban (megrts) korltos, elnagyolt, tmegszer, nem-szemlyes s gy ltala informciv nehezen rtelmezhet adat-halmazokat. Olyan ismeret-egyvelegeket, amelyek sokkal inkbb a szakember kpessgeit, semmint a felhasznl ignyeit tkrzik.

    A fentiek mentsgre szoltl, hogy az elmleti szakemberek nagy rsze sajt elefnt-csonttornyba zrkzik s nem kpes elfogadhat fogdzt nyjtani a gyakorlat szmra. A sok-sok elvi irnyzat kzl most csak egynek a pldjt emltjk. Az informcielmletrl (angolul: information theory) van sz, amely az ismereteknek pusztn csak a mennyisgi oldalval foglal-kozik. Az informcielmlet szerint a Szereti-e Jnos Lujzt? s a Szereti-e Jnos a karalbt? krdsekre adott igen-nem vlasz ugyanannyi hatrozatlansgot szntet meg. A teoretikusoknak taln Jnost vagy fleg Lujzt kellene megkrdeznik arrl, hogy valban ugyanannyi hatrozatlansg sznik-e meg bennk a kt ismeret kapcsn. Ez a plda a terik ltalnos hinyossgra akarja felhvni a figyelmet. Az informcielmlet, az informcialgebra, a hierarchikus-hls-relcis adatmodellezsi koncepcik mind-mind mennyisgorientltak s a lehetsgesnl sokkal kevesebbet trdnek az ismeretek minsgi oldalval. Kicsit pongyoln, de taln kifejezen fogalmazva: az informci praktikumval.

    A j elmleten alapul gyakorlat s a gyakorlatias elmlet hinyt jl mutatja az a tny, hogy az ismeret hrom aspektusa kzl az els kettvel jval tbbet foglalkozunk, mint a harmadikkal.

    Ugyanis minden adatnak hrom szemlletmdja van. Az ismereteket valamilyen formai mdon jelentjk meg. Jelsoraink rtelmezhet tartalmakat hordoznak. Vgl - amirl sokszor

  • 19

    megfeledkeznk - az ismeretkzlsnek meghatrozott clja van. Az albbiakban rviden ttekintjk ezt a hrom nzpontot.

    A szintaktika az ismeret kzlsre szolgl jelek s/vagy jelcsoportok ltalnos elrendezst jelenti, amely fggetlen az ismeret tartalmtl, a megjelents mdjtl s hasznlattl (ld. [1], 413. oldal). Teht a szintaktika az rzkels s a felfogs tartomnyba tartozik. Olyan jeleket hasznlunk s azokat gy rendezzk el, hogy az ismeretet fogad magt a jelsort rzkelhesse s felfoghassa.

    A szemantika a jeleknek s/vagy jelcsoportoknak a kzlend tartalomhoz val viszonyt jelenti, fggetlenl a megjelents mdjtl (ld. [1] 375. oldal). A Bla, bla, bela stb. az ltalunk ismert szablyok szerint itt s most ugyanazt a tartalmat hordozza, rsmdtl fgget-lenl. Teht a szemantika a megrts tartomnyba tartozik. Olyan jelsorokat lltunk ssze, amelyek egyttes tartalmt az ismeretet fogad megrtheti.

    Sajnlatos mdon a szintaktikt s a szemantikt a mai ismeretkezelsi gyakorlatban sokszor flrertelmezik. A szmtgpes programok utastsaira szktik le ezt a kt lnyeget. (Arrl most ne is beszljnk, hogy a kt tnyezt gyakran sszekeverik. Szintaktikainak mondjk a szeman-tikai hibt - vagy ppen megfordtva - aszerint, hogy azt a fordt/szerkeszt milyen alapon fedezi fel.) Teszik ezt annak ellenre, hogy a szintaktika s szemantika az ismeretkzls ltalnos aspektusai. Teht ppen gy, st taln mg inkbb vonatkoznak az adatra, mint a programutas-tsra.

    Az adatoknak van egy harmadik nzete is, amelyrl taln ppen az elbbi hibs szemllet, a szintaktika s a szemantika programozsbeli tldimenzionlsa miatt feledkeznk el. Az IBM sztra szerint a pragmatika a karaktereknek illetve jelsorozatoknak az azok rtelmezshez s hasznlathoz val kapcsolata (ld. [1], 317. oldal). Ez a meghatrozs helytll, de kicsit res, azaz nmi magyarzatra szorul. A pragmatika lnyegben a kzlt ismeret gyakorlati hasznl-hatsgt jelenti. Magyarul azt, hogy partnernknek olyan ismeretet adjunk t, amelyet knnyen s gyorsan azz az informciv tud rtelmezni, amelyre ppen szksge van.

    A szintaktika s szemantika objektv jelleg, klnben aligha vizsglhatnnk szmtgppel a programok formlis megfelelsgt. Ezzel szemben a pragmatika a szubjektum szfrjba tar-tozik. Nincs olyan szmtgp, amely el tudn dnteni, hogy szmunkra hasznos adatot kzlt-e velnk. Ezrt van szksg az emberre, a szakemberre, aki rti az adat s az informci klnbsgt, vagyis tisztban van a pragmatika lnyegvel.

    A mai adatbzisok tervezi tlsgosan el vannak foglalva az adatok fizikai trolsval s megjelentsvel, vagyis a tisztn szintaktikai aspektusokkal. Mr kevesebbet trdnek az egyedi adatok jelentsvel s az adatok elemi sszefggseivel, a szemantikval. Az ismeretek pragma-tikai hasznossgt az adatbzis fogalmi szerkezete nagymrtkben befolysolja. Ez a terlet pedig sokak szmra vgleg ismeretlen.

    1.6 Mirt hibdzik a kommunikci?

    A kvetkez gondolatokat egy 1972-es halvny xeroxmsolatbl idzzk, ezrt a forrst nem tudjuk pontosan megadni. S. J. Harris maga is egy 1920-as rsra hivatkozik, amelyben W. James a kommunikcirl elmlkedik. E rejtlyek dacra is rdemes megfontolni, amit mond.

    Ha Jancsi s Lajos beszlget, akkor a diskurzusnak valjban hat rsztvevje van. Jancsi, ahogyan magt ltja. Jancsi, ahogyan t Lajos ltja. Jancsi, amilyen a valsgban. Lajosra ugyanez a hrom szemllet vonatkozik. A kommunikci emiatt a tbbszrssg miatt veszik el. Jancsi valamit mond, amin Lajos teljesen mst rt. St, kt dolgot rt. Mert ms az, amit Lajos

  • 20

    gy fog fel, mint a valdi Lajos s ms az, amit Lajos gy rt meg, mint ahogyan magt elkpzeli. Persze mieltt Lajos brmit is hallana, Jancsi ugyanilyen zavarban van sajt magval.

    A felesg a frjnek esik, mikzben nem is vele, hanem valami egszen mssal van baja. A disputa vgn mr egyikk sem rti, hogy egyltaln mirl is volt sz. A drga nej kijelent valamit gy, ahogyan az sajt magbl fakad. Nem figyel arra, hogy kzben mindez a frjre teljesen msknt hat, mert ura mshogyan szemlli t, mint sajt magt. A hlgy azt sem veszi szre, hogy valjban nem azt mondja, amire gondol, mivel nem ismeri nmagt s kifejezsi eszkzei is szksek.

    Hasonl a helyzet a gyerekekkel. A szl bekpzeli magnak, hogy azt teszi, ami a klyknek j. A picur mindezt msknt ltja: szmra az s arra val, hogy kiszolglja az ignyeit... Ha kt emberi lny nem tud kommuniklni, akkor vajon mi a helyzet a szervezetek, a csoportok s az egsz trsadalom szintjn...?

    Az emberisg mg nem jutott el arra a fokra, hogy megoldja az zenetek kdolsnak, kldsnek, fogadsnak s dekdolsnak elsdleges problmjt.

    Eddig az idzet. A hetven vvel ezeltti gondolatok ma is rvnyesek. Sohasem lehet j informatikus abbl, aki nem rti, hogy a kldtt s a fogadott szavak nem azonosak. Aki nem ltja az adat (az zenet) s az informci (a hats) klnbsgt. Aki nclknt a szmtgppel, a programmal, a trolt adattal trdik, nem pedig azzal, hogy legyen msok ltal fogadhat zenete.

    Ms elfakult msolatbl csak a gondolatcsrt kvnjuk elltetni. Egyes fensbbsges emberek sajtja, hogy sszetvesztik a kommuniklst s az informlst. Az elbbi ktoldal tevkenysg, amelyben mindkt fl egyenl szerepet jtszik. Az utbbi egyirny folyamat, amelyben az ismeretkld a meghatroz.

    El kellene elmlkednnk azon, hogy vajon mi, mai szmtstechnikusok, melyik gondolat-krben mozgunk... Csak kzljk a sajt elkpzelseinket a felhasznlval, azaz informlunk, vagy nagyon is odafigyelnk arra, amit az alkalmaz mond s logikusan rvelve kommuniklunk. Persze ugyanezek a krdsek a felhasznli oldalon is felvetdnek. Mert a kedves alkalmaz lehetetlent akar, de azt viszont azonnal. Nem figyel a fejleszt nehzsgeire. Nem kommunikl, hanem informl.

    1.7 Mit lehet megtudni?

    A kilencvenes vek elejn tudomnyos rangra emeltk a kosz-elmletet. A vilgot nem a vakvletlen uralja, minden trvnyszer. Csakhogy az ember kptelen felismerni a szablyokat. Elksve s utlagosan reagl a tnyekre. Mire a trvnyt felfedezi, mr az nem is l. A hetven vvel ezeltti, az elz pontban idzett kittel - Az emberisg mg ... - tkletesen illeszkedik a kosz-elmlet megismerhetetlensgi aximihoz.

    Mit jelent mindez az informatikusnak? Taln azt, hogy Madchot feledve adjuk fel a remnyt s a kzdelmet? ppen ellenkezleg. Csak azrt is bele fogunk pislantani az ismeretkzls rejtelmesnek tartott titkaiba. A tnyeket rgzt adatokat adatbzisokban fogjuk trolni s megprbljuk azokat onnan gy elbogarszni, hogy embertrsaink informcikat nyerhessenek.

    Ebben a knyvben nyomon fogjuk kvetni az adat tjt az adatbzison keresztl az inform-ciig. Megprblunk megkzdeni a kosszal. Bizakodan, de nem elbizakodottan. Mr tudjuk, hogy a fizikai srobbans szellemi detoncival is jrt. Vlaszt adunk sok krdsre, de mindegyi-

  • 21

    ket nem fogjuk tudni megoldani s minden egyes megoldott problma a felvetsek tucatjait vonja majd maga utn.

    Tudsunk, ernk, akaratunk s ezeknek megfelelen knyvnk is vges. Az adatbzis viszont vgtelen. Ha ezt az olvas megrti, akkor nem hiba harcolunk az informatikai kosz ellen.

    Ellenrz krdsek - 1

    1/01 Informcit (I) vagy adatot (A) takar-e a kvetkez mondat: Halassy Bla e mszerzje.

    1/02 Informcit (I) vagy adatot (A) rejt-e a kvetkez lert mondat: A szerznek BMZ 873 rendszm 1300-as Ladja van..

    1/03 Informcit (I) vagy adatot (A) hordoz-e a kvetkez mondat, vagy netn egyiket sem (S): Sri 6 ves..

    1/04 Ez a jelsor navigadnoj szlelhet-e (1), rzkelhet-e (2), felfoghat-e (3) s rtel-mezhet-e (4) az n szmra? Adja ssze vlasznak megfelelen a pontokat.

  • 22

    2. AZ ISMERETKEZELS KT MDJA

    2.1 Az ismeret hordoz kzegei

    Az ismeret tadsnak s tvtelnek szmos kzvett eszkze van. Minden rzkszervnket az ismeretszerzs szolglatba llthatjuk. A kp, a hang, a mozdulat, a hrzkels, a zene mind-mind ismereteket kzvettenek felnk. Nem informcikat, hanem adatokat. Ezeket az adatokat msokkal sszegyrva mi rtelmezzk informciv. Pldul ugyanaz a mozdulat kt klnbz arckifejezssel prosulva teljesen ms hrtartalm. A vllvonst ksr mosoly sajnos nem-et jelent. A vllrndtssal prosul fintor viszont azt mondja, hogy nem, s nem is rdekel.

    Brmennyire is rdekesek az ismeret tadsnak s tvtelnek ezek a mdozatai, neknk egy kzegre kell szortkoznunk. Ahhoz az eszkzhz fordulunk, amely az ember sajtja s amely az embert azz teszi. Ez a kzeg pedig nem ms, mint a nyelv, a termszetes emberi nyelv. Ezen bell is alkalmazunk egy megktst: csak az rsos ismeretekkel trdnk annak dacra, hogy kzeleg a hangokat is megrt szmtgpek korszaka. (Persze amit itt elmondunk, az jrszt a beszlt nyelvre is vonatkozik.)

    Ennek a fejezetnek az a clja, hogy bemutassa a termszetes emberi nyelv s a szmt-gpes ismeretkezels sszefggseit gy, hogy prhuzamot von a kett alkotelemei kztt.

    A fejezet sorn elszr az adat ngy dimenzijt fogjuk ismertetni a mindennapos mondatok kt alapvet alkotelemhez, az alanyhoz s az lltmnyhoz kapcsoltan. R fogunk mutatni arra, hogy a szmtgpes ismeretkezels sorn is valjban alanyban s lltmnyban gondolkozunk. Csak ppen a szmtgpes ismerethordoz kzegek termszete miatt ezeket a tnyezket merev egysgekbe kell knyszertennk. gy szembeslnk az adat fogalom egy szkebb rtelmvel. Ez nem jelenti azt, hogy korbbi adatmeghatrozsunkat ne tartannk tovbbra is rvnyesnek.

    Mr a dimenzik megismerse sorn is rdemes felfigyelni az alany s az lltmny relati-vitsra. Az egyik mondat lltmnya a msik alanya lehet. A mindennapos letben ppen ez a tny ad lehetsget arra, hogy a klnbz dolgokra vonatkoz ismereteinket sszefzzk. Ez a kapcsolds az alapja az adatbzisnak is, amelynek lnyegt a kvetkez fejezetben fejtjk ki.

    A fejezet msodik felben az ismeretkezels ktfle mdjrl lesz sz. A fentiekben a nyelvet jelltk meg, mint bennnket rdekl kzeget. Azonban nem mindegy, hogy termszetes emberi nyelvben fogalmazzuk-e meg az ismeretet, vagy erre a clra mestersges nyelvet hasznlunk. Ezrt r kell mutatnunk a szveg- s az adatszer ismeretkezels kzs alapjain tl azok eltr lehetsgeire s konverglsukra is.

    2.2 Az ismeret ngy dimenzija

    Az emberi kzls legtermszetesebb egysge a (kijelent) mondat. A mondat szavakbl ll. Ezek klnbz szerepeket tltenek be a mondatban s ezeknek megfelelen mondatrszeket alkotnak. A teljes, de minimlis kijelent kzlsben alany s lltmny szerepel. Ez idig

  • 23

    kzismert, elemi szint tuds. ssunk azonban kicsit mlyebbre, komolyabban megvizsglva a mondatrszek szerepeit. Elbb nzzk meg, hogy mirt is szksges ez a vizsglds. Ehhez vegyk alapul a kvetkez kt pldamondatot:

    2.1 plda

    Rzsa kocsija fehr. Gabi kocsija Lada.

    A fenti mondatokat brmilyen szvegszerkesztvel be lehet vinni a szmtgpre. A szveget el lehet trolni; azt ki lehet rni a nyomtatra; ki lehet jeleztetni a kpernyn; t lehet msolni stb. Kikereshetjk a mondat brmelyik szavt vagy jelsor-rszlett. Azonban a szvegszerkesztvel trolt ismeretek tartalmra nem tudunk okosan rkrdezni. Nem tudunk feltenni ilyen krdseket:

    Milyen szn Rzsa kocsija? Kinek a kocsija fehr? Milye fehr Rzsnak? Van-e Rzsnak kocsija?

    A szvegszerkesztvel trtn ismeretkezels nem adhat mst, mint lnyege. Ezek az eszkzk nem arra kszltek, hogy segtsgkkel informciv rtelmezhet adatokat kezeljnk. Ezrt az ismeretkezelsnek ms mdjt kell keresnnk. Olyant, amivel a fentiekhez hasonl krdsek is megvlaszolhatk. Ehhez pedig zekre kell szednnk a kijelent mondatokat, hogy azutn az azok rszeivel kapcsolatos krdseinket jl tudjuk megfogalmazni.

    A mondatok alanya mindig kt rszbl tevdik ssze. Ezek hivatalos neve legkzelebbi nem (genus proximum) s megklnbztet jegy (differentia specifica). Pldink esetben a legkzelebbi nem a KOCSI, a megklnbztet jegyet pedig a Rzsa s a Gabi jelentik. A most elmondottakat azonnal ki kell egsztennk pr megjegyzssel. A legkzelebbi nemnek nem kell expliciten, teht lthatan szerepelnie a mondatban. Az lehet rejtett, implicit is. Pl. a Rzs fehr. kijelentshez is ktdik legkzelebbi nem. Hiszen evidens, hogy ennek a mondatnak a megrtshez kellett lennie egy korbbi kzlsnek is, amelyben utaltunk arra, hogy mirl (kirl) van sz. Ugyanez vonatkozik a megklnbztet jegyre is: A kocsija fehr. (Ms jelleg problma, hogy valban behatrol-e a megklnbztet jegy. Ha tbb Rzsa vagy Gabi is szba jhet, akkor a mondat alanyt pontostanunk kell.)

    A fenti kettssg a mondatok lltmnyra is vonatkozik. Az els mondat lltmnyban a legkzelebbi nem a Szn, a megklnbztet jegy pedig a fehr. Itt is rvnyesek a fentebb tett megjegyzsek. A generikus lltmny (Szn illetve Tpus) lehet implicit, szerepelhet ms mondat-ban s behatrolnak kell lennie. Pldul nagyon is elkpzelhet, hogy a Lada megklnbztet jegy nem egszen pontos, mert tbbfle Lada tpus gpkocsi ltezik.

    Az ismeretkezels nagy mestere, C. Bachman mr a hatvanas vekben az adat hrom dimen-zijnak nevezte [3] az ismeret specifikus alanyt (Rzsa kocsija), generikus (Szn) s specifikus (fehr) lltmnyt. Abban a korban mg nem lteztek adatbzisok. Egyszerre csak egyfle jelensggel trdtek az ismeretkezels sorn. Ezrt nem utalhatott Bachman akkor a negyedik tnyezre, a generikus alanyra (KOCSI), amelyet az nyomdokn joggal nevezhetnk most mr az ismeret els dimenzijnak.

    A ngy dimenzit brn is szemlltethetjk. Ebben a knyvben a ngy dimenzi jellsre a kvetkez egyezmnyes rsmdokat (konvencikat) fogjuk hasznlni: Nagybetvel rjuk az ltalnos alanyt (KOCSI), vastag dltbetvel a specifikusat (Rzsa). Nagybetvel kezdjk az ltalnos lltmny nevt (Szn) s kiemels nlkli, kisbets a specifikus lltmny (fehr).

  • 24

    ALANY LLTMNY

    Generikus KOCSI Szn Specifikus Rzsa fehr

    2.1 bra: Az adat ngy dimenzija

    A tnyeket kzl kijelentsek persze lehetnek bonyolultabbak is. Pldul: Rzsa kocsija fehr s Lada tpus. vagy Rzsa Lada kocsija fehr. vagy Rzsa fehr kocsija Lada.. Az sszetett mondatok is ngy dimenzira bonthatk a fentiek szerint, hiszen mindig visszavezet-hetk egyszerekre. Pldul: Rzsa kocsija fehr. s Rzsa kocsija Lada tpus.. Az alany ismtlsvel takarkoskodunk a kzlseinkben is, meg az ismeretek dimenzikba val besoro-lsnl is. Az sszetettsg nem jelent j dimenzit, csak az lltmny tartalmnak a tbbsz-rzst. Jl mutatja ezt a kvetkez bra:

    ALANY LLTMNY1 LLTMNY2

    Generikus KOCSI Szn Tpus Specifikus Rzsa fehr Lada

    2.2 bra: sszetett dimenzik

    A termszetes nyelv mondatokban nemcsak alany s lltmny, hanem ms mondatrszek is szerepelhetnek: trgy, hatroz, jelz. Ezekrl azt kell tudni, hogy maguk is lltsok. Ezrt a mi felfogsunkban azokat is a generikus s specifikus lltmny kt dimenzijba soroljuk. Az elz bekezds elejn lv hrom mondat ezrt nemcsak a mindennapos nyelvben hordoz azonos ismeretet, hanem a mi taglalsunk szerint is azonos kpet ad. Mindhrom mondat a 2.2 bra sematikus szerkezetre kpezhet le.

    Az brkat a mondatokkal sszevetve tbb kvetkeztetst vonhatunk le. Egyrszt a ktfle mdon kzlt ismeret tnyleges tartalma pontosan lefedi egymst. Msrszt a mondatok kere-kebbek, szebbek - mg a smk kattogsabbak, resebbek. Harmadrszt viszont a smk ponto-sabbak, mert - szemben a mondatokkal - expliciten tartalmazzk mind a ngy dimenzit. Mrpedig lnyeges megjegyeznnk, hogy az ismeretkzlshez mind a ngy dimenzira szksg van. Tegynk csak ellenprbt a kvetkez mondatokkal:

    A rzsa ra 50 Ft. Krumplifajtrl vagy virgrl van sz? Nincs generikus alany. A virg ra 50 Ft. Melyik virg? A rzs, a liliom? Nincs specifikus alany. A rzsa 50. Milye 50? Ennyi darab? Ennyi kil? Nincs generikus lltmny. A rzsa szne. Mi van vele? Hinyzik a specifikus lltmny.

    2.3 Trtneti kitr: A szemantikai adatbzis

    A termszetes nyelvi ismeretkzls jl beilleszkedik a sematikus ngy dimenziba. Ez a tny a 70-es vekben nhny kutatt arra sztnztt, hogy megalkossk a szemantikai adatbzis koncepcijt [4]. Ebben az elkpzelsben a szmtgpen trolt ismeret alapvet egysge a

  • 25

    mondat (angolul: sentence). Ez majdnem azonos a termszetes nyelvi mondattal: kerek, emberi, rthet kijelents. Lssunk nhny pldt:

    2.2 plda

    X. Rzsa 1957-ben szletett. Y. Gabi 1946-ban szletett. X. Rzsa Szegeden lakik. Y. Gabi Pcsett lakik.

    A mondatokban nem kellett expliciten utalni a generikus alanyra (SZEMLY) s lltmnyra (Szletsi dtum, Lakhely). A dimenzikat gy adtk meg, hogy mondattpusokat kreltak. Pldnk esetben a SZEMLY SZLETETT s a SZEMLY LAKIK mondattpusokat (angolul: sentence type) fogalmazhatjuk meg. Persze akkor, ha a szemlyeknek mindig csak az aktulis lakcmre vagyunk kvncsiak, sszetett mondatot is alkothatunk: X. Rzsa 1957-ben szletett s Szegeden lakik..

    Az elgondols humnus clokat, emberibb ismeretkezelst kvnt szolglni s egy ideig meg-valsthatnak ltszott. Az ember ne sematikus formkkal, hanem kerek mondatokkal kommuni-kljon a szmtgppel. Az ismeretkezel programnak kell kihmoznia a mondat lnyegt, ami a mondat elemeinek a mondaton belli elhelyezse ltal gymond adott. Vagyis a tartalom a mondat struktrjbl kvetkezik. Innen kapta ez a koncepci a szemantikai jelzt.

    Ktsgtelen, hogy a viszonylag egyszer angol nyelvi szerkezetek megfelelni ltszottak az elzetes felttelezseknek. Arrl most ne beszljnk, hogy a magyar nyelvben ez a megolds egyelre kizrt a ragok s a ragozsok kavalkdja miatt. A ksrlet vgl angolszsz terleten is csdt mondott. Az angol nyelvben sem mindent ugyangy s ugyanolyan sorrendben runk le. Kln gondot okozott a felhasznl szmra annak megjegyzse, hogy az sszetett mondatokat alkot tagok mikppen kvetik egymst s annak emlkezetben tartsa, hogy milyenek a kln-bz mondattpusok kztti kapcsoldsok. Ezrt a felhasznlnak olyan smkat kellett volna adni, amelyek mr az ismeretkezels albbi adatszer mdjnak a sajtjai.

    Vgeredmnyben az akkori prblkozs meghisult. Ennek nem kis rszben az is oka volt, hogy az ismeretrgztk - pusztn fizikai okokbl - kerek mondatok helyett jobban szeretnek szavakkal dolgozni. Ragok, tltszavak s egyebek nlkl kevesebb jelet kell lerni. A ksrlet annyiban mgis figyelemre mlt, hogy a jv szzad egyik lehetsges megoldst vetti elre. Ha majd hanggal, jsg-, knyv-, iratletapogatssal gy lehet ismereteket vinni a szmtgpbe, hogy a programokkal a mondatok struktrit s kapcsolatait is meg tudjuk llaptani, akkor ismt napirendre fog kerlni a szemantikai adatbzisok idlegesen elvetlt koncepcija.

    2.4 Ktfle mondat

    A termszetes nyelvi vagy ahhoz kzeli ismeretkezels sok problmt vet fel. Egy szemlyre vonatkozan hnyfle mondattpust clszer alkotni? lltmnyonknt (szletett, lakik) egyet? Ez risi redundancival jr, hiszen mindig le kell rni pldul azt, hogy X. Rzsa. Egyetlen egyet? Ebben az esetben a mondat kgynyi hosszsg lesz. Tovbbi krds, hogy miknt kapcsoldnak egymshoz az azonos alanyra vonatkoz eltr tpus mondatok illetve a klnbz generikus alany mondatok? Pldul hogyan kthetk ssze a szemly s az ltala birtokolt gpkocsi(k) ismeretei?

  • 26

    A szemantikai adatbzis koncepcija ezeket a grcsket nem tudta feloldani. Nzzk meg, hogy mire jutunk egy msik fajta megkzeltssel. Vegyk csak alapul a kvetkez pr mondatot (ld. 2.3 plda). A gondolatjtk kedvrt ezeket a kijelentseket sematikus formban is megadjuk (ld. 2.3 bra).

    2.3 plda

    Gabi kocsija Lada tpus. Gabi kocsija tszemlyes. Laci kocsija Lada tpus. Laci kocsija tszemlyes.

    ALANY LLTMNY1 LLTMNY2

    Generikus KOCSI Tpus Frhely Specifikus Gabi Lada 5 szemly Specifikus Laci Lada 5 szemly

    2.3 bra: A kocsik ismeretei sematikus formban

    Ha a mondatokat pronknt (a Gabi s a Laci alanyok szerint) vesszk, akkor azok nagyon rtelmeseknek tnnek. m a ngy mondat egytt nmi ellenrzst kelt bennnk, amiben meger-stve rezzk magunkat, ha a 2.3 bra sematikus kpt nzzk. Maga mindent ktszer mond? - vetdik fel bennnk a krds (Lada - 5 szemly).

    Tudomsul kell vennnk, hogy a termszetes nyelv kzlsek igen komoly redundancit, ismeretismtlst hordoznak magukban. (Ez az x+1-dik oka a szemantikai adatbzisok kudarc-nak.) Az ismerettfeds gondjaival-bajaival most ne trdjnk. Csak annyit jegyezznk meg, hogy az a mai szmtgpes ismeretkezelsben nemkvnatos jelensg. Ezrt nagyon sokan foglalkoznak a redundancia elkerlsnek a mdjaival. A megolds pedig kzen fekszik. Nzzk csak meg a kvetkez hrom kijelentst:

    2.4 plda

    Gabi kocsija Lada tpus. Laci kocsija Lada tpus. A Lada tpus kocsik tszemlyesek.

    Mint ltjuk, gy takartottunk meg egy mondatot, hogy kzben ismeretet nem vesztettnk. Tovbbra is tudjuk, hogy Gabi s Laci kocsija t frhelyes. Csak a megfelel mondatokat kell sszektnnk. Ekzben felfedezzk, hogy a mondatoknak ktfle fajtja van:

    2.5 plda

    Gabi kocsija fehr. Gabi kocsija Lada tpus.

    A kt mondat ltszlag teljesen azonos jelleg. Csakhogy mr tudjuk, hogy az els kijelents lezrt, befejezett egy gondolatfonalat. A msodik pedig ppen megnyitott egy jat s a 2.4 plda harmadik kittelhez juttat bennnket.

    Most kap igazn rtelmet az ismeret els dimenzija, a generikus alany, mert mr ktflt is meg kell klnbztetnnk (SZEMLY, KOCSITPUS). jabb megoldsunk sematikus kpt a

  • 27

    2.4 bra mutatja. Az brn dlt nemkvr szedet mutatja az egyik mondattpusbl a msikba tvezet lltmnyt.

    A kpet vegyes rzelmekkel fogadjuk. Az ALANY-LLTMNY s a Generikus-Specifikus megjellsektl eltekintve a 2.3 brn 9, ezen pedig 10 bejegyzs tallhat. Mit nyertnk? Inkbb vesztettnk, mert most is dadogunk a Tpus ktszeri feltntetsvel. mde szmoljunk utna, hogy ngy Ladt birtokl szemly esetben a 2.3 bra szerinti sma 15, a 2.4 brnak megfelel mr csak 14 bejegyzst tartalmazna. 10000 Lada-tulajdonosnl pedig az arny mr 30003/20006 lenne stb.

    Nem vletlenl jtszunk itt a szmokkal. A 2.3 bra esetben egyetlen dologgal kell fog-lalkoznunk, mg a 2.4 brnl kt dolgot ssze kell tudnunk kapcsolni. Vilgos, hogy ennek az sszefggsnek a megteremtse a szmtgpen idt, helyet - pnzt - ignyel. Akkor fizetdik ki, ha ellenttelknt nyernk valamit. A plda esetben a nyeresg vilgosan ltszik, noha egyelre a tbbszrs ismerettrolsnak a mellkkltsgeirl mg nem is beszltnk.

    ALANY1 LLTMNY1 ALANY2 LLTMNY2

    Generikus KOCSI Tpus TPUS Frhely Specifikus Gabi Lada Lada 5 szemly Specifikus Laci Lada

    2.4 bra: A kocsiismeretek talaktott smja

    Most, hogy mr tudjuk mit kellene a szmtgpeken trolni az ismeret dimenziinak meg-felelen, rtrhetnk a hogyan krdsre.

    2.5 Adatszer ismeretkezels

    A szmtgpeket a kezdetek kezdetn elssorban knyvelsi, nyilvntartsi feladatok tmo-gatsra hasznltk. Mgpedig gy, hogy ezek a nyilvntartsok egymstl teljesen fggetlenl kerltek szmtgpes trolsra s feldolgozsra. A kimutatsokat irattartkban, magyarul dosszikban vezettk, amelyek angol neve file (ejtsd: fjl). Ezt ma az elkel adatllomny nvvel illetjk. Egyfle dossziban voltak az egyfajta jelensgre vonatkoz ismeretek. Az irattartfle teht pontosan megfelel a generikus alanynak, az ismeret els dimenzijnak. Volt SZEMLY, ANYAG, ESZKZ, KOCSI, KOCSITPUS stb. fjl. Mint emltettk, ezek kztt nem volt semmi sszefggs.

    A fjlban vezettk a feljegyzsre mlt tnyeket. Feljegyzsre mlt az olimpiai cscs, amit a latin emlkezs szbl szrmaz angol feljegyzs - record - kifejezsen t a magyar rekord fogalom is tkrz. Persze a vllalatokban ms dolgokat tartanak feljegyzsre mltaknak. Ettl fggetlenl rekordnak neveztk a valakirl, valamirl feljegyzett ismeretek egyttest. gy Kovcs rnak a SZEMLY fjlban volt egy szemly mintj, Kovcs cmkj rekordja. A rekord teht megfelel a specifikus alanynak, az ismeret msodik dimenzijnak.

    A dosszik paprjain elre behatrolt, nvvel nevezett dobozkk szerepeltek. Olyan rovatok, amelyekbe be kellett vezetni a megfelel ismereteket. A rovatok a papr adott terlett foglaltk el, ezrt ht elneveztk e terleteket mezknek (angolul: field). A mez kt dolgot jelentett: egy rovatfajtt (pl. Nv), azaz meztpust s egy konkrt tartalmat (Kovcs). Itt tallkozunk az ismeret tovbbi kt dimenzijval, a generikus s specifikus lltmnnyal.

  • 28

    A ksbbiekben ezeket az ismereti egysgeket gy vagy gy tkereszteltk. A rekord helyett pldul hasznltk a mondat, a mez helyett a sz kifejezst is. (Arra most nem trhetnk ki, hogy ezeket a megjellseket vltogatva alkalmaztk az ismeret logikai tartalmra s az annak a szmtgpes trolsra szolgl bels fizikai egysgekre.)

    A lnyeg - nvtl fggetlenl - ugyanaz maradt. Az ismereteket a rendes gyjtk mdjra elre megcmkzett dobozkkba helyeztk el, pontosan az eddigi brinknak megfelel mdon. A KOCSI cmkj dobozokba kerltek a tulajdonosok nevei, a Gabi, a Laci s a tbbiek. A cmke s a tartalom egyttest pedig mr nem meznek, hanem adatttelnek vagy egyszeren csak adatnak kezdtk hvni. gy kapott az adat az eredeti, tg jelentse (rtelmezhet ismeret) mellett egy szkebbet - cmkzett ismeretdoboz - is.

    A fentiek miatt nem tautolgia, ha adatszer ismeretkezels-rl beszlnk. Ez azt jelenti, hogy az adatokat dobozokba rendezzk el. Ami knyelmetlen, picit inhumnus, sok gondot okoz. Viszont a cmkzs miatt mr vlaszt tudunk adni azokra a krdsekre, hogy Van-e kocsija Rzsnak?, Milyen szn a kocsija? stb. A dobozok gyes sszekapcsolsval azt is megismer-jk, hogy hny frhelyes Gabi Lada tpus kocsija. Mivel ugyanahhoz a rekordhoz elvileg tetszleges szm adatttelt rendelhetnk, az ismereteket nem kell ismtelgetnnk. Nem kell tbbszr trolnunk azt, hogy Gabi kocsija....

    2.6 Szvegszer ismeretkezels

    Viszonylag hossz id telt el addig, amikor a szmtgpek szvegtrolsi kpessgt azok szmtsi kpessgeivel egyenrangnak, st adott esetben fontosabbnak kezdtk ltni. Az adat-szer nyilvntartsok mellett kezdtek megjelenni a termszetes nyelv szvegeket trol s kezel rendszerek.

    A ktfle megoldst nagyon knny sszehasonltani. Csak kpzeljnk egyms mell pr berovatozott, rubrikzott s kitlttt bizonylatot, meg pr egyszer knyvoldalt vagy nhny folyamatosan telert A4-es paprt.

    A szvegszer ismeretkezels sorn termszetes emberi nyelvben megrt szavakbl alkotott termszetes mondatokat trolunk. Ezek a szavak nincsenek megcmkzett, nvvel elltott dobo-zokhoz rendelve. A lersi sorrend ktetlen. rhatjuk azt is, hogy Rzsa kocsija fehr., de azt is, hogy Fehr a Rzsa kocsija..

    A szvegszer ismeretkezelst nem szabad sszetveszteni a szvegszerkesztssel. Az utbbi esetben minden egyes szveg kln llomnyt kpez, teht az llomny s a feljegyzs, a rekord lnyegben ugyanaz. Ezzel szemben a szvegszer ismeretkezels a kezdetek kezdete ta meg-klnbzteti az ismeret kt dimenzijt, az ltalnos s a specifikus alanyt. A szvegkezelvel ismereteket rgzthetnk ltalban a szemlyekrl, a kocsikrl stb. s ezeken bell a konkrt X s Y szemlyrl illetve a Z s Q kocsirl. Teht ezek az llomnyok tbb rekordbl llnak.

    Az ismeretek termszetes nyelvben trtn bevitelnl ktetlen szrendet s eltr ragozsi formkat alkalmazhatunk. Ez a termszetes rugalmassg ktsgtelen elnyt jelent. Viszont az ismeretek visszakeressnl ppen ez okozza a gondokat. A ragozsok miatt sajtos sztrakat kell fenntartani s/vagy a sztveket felismer programokat kell alkalmazni, pldul a fehret, fehrben, fehrnek stb. lnyegi azonossgnak a feltrsra. Szinonimatrakra van szksg pldul a piros s a vrs rokonsgnak a felismersre. A legnagyobb gondot pedig a homonimk jelentik. Mert honnan tudn a kezel, hogy a mondat elejn nagybetvel rt Rzsa virgot, szemlyt vagy krumplifajtt jelent-e? A Gabi finak, lnynak vagy az sszeraks gyerekjtknak a neve-e?

  • 29

    Az adatszer ismeretkezelsben egy pillanat alatt megtallhatjuk, hogy melyek a fehr kocsik, mert csak a Szn nev doboz tartalmait kell vgigvizsglnunk. Ezzel szemben a szvegszer ismeretkezels kezdetn a tartalmak ilyen elklntsre nem volt md. A kezelnek minden egyes karaktersort ssze kellett vetnie a fehr jelsorozattal. Ennek a teljes - s gy termszetesen lass - tbngszsnek az elkerlse rdekben, a keress felgyorstsra hamaro-san szkincstrat, tezauruszt kezdtek alkalmazni. Ez a segdtr olyan index, amely rzi a szvegelforduls tartalmt (fehr) s llomnybeli megjelensi helyeit. Ezzel tmogatja az ismeret negyedik dimenzijt, a specifikus lltmnyt.

    Viszont tovbbra is megoldatlan maradt a jelsorozat rtelmezsnek a problmja. A Rzsa szvegrszt mr gyorsan ki tudtuk keresni, de neknk kellett eldntennk a szveg krnyezete alapjn, hogy a jelsor szemlyre vagy virgra utal-e. Ezt a gondot a deszkriptor konstrukcival szntettk meg. A ler az ismeretrszeket kategorizl ismrv. A Rzsa sz bevitelekor kijelenthetjk, hogy az most a virg vagy a keresztnv deszkriptorhoz ktdik-e. Ezzel a szveg-szer ismeretkezels is kikerekedett az ismeretkezels harmadik dimenzijval, a generikus lltmnnyal (pl. Keresztnv, Szn stb.).

    Ettl mg a szvegszer ismeretkezels nem csapott t az adatszerbe. A terjedelmes szve-gek bevitelekor nyilvn nem minden szt fogunk deszkriptorokhoz rendelni, mert ez nemcsak fradsgos, hanem felesleges is lenne. Ezzel szemben az adatszer ismeretkezelsben minden ismeretdarabot a megfelel adatdobozhoz kell illesztennk.

    Mivel a ktfle kezels egyarnt fontos a szmunkra, rdemes pr gondolattredk erejig ttekinteni azok kapcsoldst s egyttes jvjt. Mieltt ezt megtennnk, el kell mondanunk, hogy a szveges ismereteket esetleg tbb llomnyt is tartalmaz knyvtrakban troljk. Az ilyen knyvtrak egyttest nevezzk adatbanknak.

    2.7 A ktfle ismeretkezels viszonya

    Az adat- s a szvegszer ismeretkezelsnek ms a clja. Ezrt balgasg lenne azt mondani, hogy az egyik jobb, fontosabb, szebb, mint a msik. Nyilvnval, hogy a knyveket nem adat-mezkre szabdalva fogjuk a szmtgpben trolni, mert az effajta mveket folyamatosan akarjuk olvasni. Ezzel szemben a vllalat fknyvi adatait nem dban rjuk le, hanem roppant szigoran meghatrozott rovatokhoz illesztjk.

    Amita az ismeret ngy dimenzijt a szvegszer kezels is tmogatja, a ktfle kezelsi md egyre inkbb konvergl, azonos irnyba tart. A fejlesztk felismertk, hogy az adatszer ismeretkezels sorn is szksgesek a ktetlen szvegek. A trgyak formai lersakor, a nvnyek lelhelynek a kzlsekor, a szemlyek letrajznak a megadsakor ktetlen mret s tetszleges tartalm adatdobozokra van szksg. A dBASE-fle kezelk memo-tpus adatmezi mg csak gyatra prblkozsok ennek a feladatnak a megoldsra, de mr a helyes irnyba mutatnak. Megfordtva: a szvegkezelket egszen komoly adatszer kezelsi kpessgekkel bvtettk ki. Hiszen nem elg magt az rsmvet szmtgpen trolni, hanem ki kell tudni keresni a m szerzjt, cmt, kiadjt, kiadsi dtumt, formtumt stb. Ezeket az ismereteket pedig adat-szeren rdemes megfogalmazni s kezelni.

    Valamikor majd megsznik a ktfle ismeretkezels mai klnbsge. Egyelre azonban a kt megolds prhuzamosan l s fejldik, mert a kztk lv legnagyobb klnbsg ma mg feloldhatatlannak ltszik.

    Az ismeretek kombinlsnak a lehetsgrl van sz. Tegyk fel, hogy arra vagyunk kvncsiak, hogy mikor, hol, milyen kresemnyekben vett rszt Rzsa Lada tpus fehr kocsija! Itt ngy eltr jelensg (kocsi, kocsitpus, tulajdonos s kresemny) adatainak az egyttes

  • 30

    kimutatsrl van sz. Adatszer kezels esetn a ngy dologra vonatkoz ismereteket egy-egy - egymssal sszekapcsolhat - llomnyban troljuk. Ezen llomnyok adatmezit tetszleges kombincikban elkereshetjk.

    Ezzel szemben szvegkezels esetben egyelre nincs lehetsgnk a klnbz llomnyok ismereteinek az sszekapcsolsra. Ha a kocsi, kocsitpus, tulajdonos s kresemny ismereteit egytt akarjuk ltni, akkor azokat egy szvegben kell egyttesen megjelentennk. Ez ismeret-tbbszrzshez s/vagy nehzkes kezelshez vezet. Mert pldul egy kresemnyben tbb kocsi is rszt vehet s gy az esemny krlmnyeit minden kocsinl le kell rnunk. Ha viszont csak a kocsik adataira vagyunk kvncsiak, a krokra nem, akkor vagy ksztnk egy rvidebb, csakis a kocsikra vonatkoz szveget (ami redundancia), vagy szmunkra felesleges ismeretek oldalai kztt kell tallznunk.

    A szvegszer ismeretkezels nem ad mdot az adatok talaktsra; az adatfeldolgozsra. A felhasznlnak egyszeren csak el kell olvasnia a trolt szveget. Ezutn vagy nyer abbl infor-mcit, vagy sem. Nem vezet klnsebb t az adattl az informciig. Ezrt br a szvegk