This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ
ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ
ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ∆ΩΝ ΠΛΗΡΟΦΟΡΙΚΗ
ΕΝΑΛΛΑΚΤΙΚΟ ∆Ι∆ΑΚΤΙΚΟ ΥΛΙΚΟ ΓΙΑ ΤΗ ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ
ΠΛΗ31 - ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΕΦΑΡΜΟΓΕΣ
ΣΥΝΟΨΗ στον Τόµο Α΄
ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΑΙ ΕΜΠΕΙΡΑ ΣΥΣΤΗΜΑΤΑ
Αδάµ Αδαµόπουλος
Αλεξανδρούπολη 2005
2
0. Πρόλογος
1. Σύνοψη 1ου Κεφαλαίου
2. Σύνοψη 2ου Κεφαλαίου
3. Σύνοψη 3ου Κεφαλαίου
4. Σύνοψη 4ου Κεφαλαίου
5. Σύνοψη 5ου Κεφαλαίου
6. Σύνοψη 6ου Κεφαλαίου
7. Σύνοψη 7ου Κεφαλαίου
8. Σύνοψη 8ου Κεφαλαίου
9. Σύνοψη 9ου Κεφαλαίου
10. Σύνοψη 10ου Κεφαλαίου
11. Βιβλιογραφία
12. Στα Αγγλικά
13. Στα Ελληνικά
3
0. Πρόλογος
Το παρόν Εναλλακτικό ∆ιδακτικό Υλικό (Ε∆Υ) αφορά σε µια προσπάθεια εισαγωγής
στον τόµο Α΄ υπό τον τίτλο Έµπειρα Συστήµατα και Εφαρµογές, της Θεµατικής
Ενότητας ΠΛΗ31 Τεχνητή Νοηµοσύνη και Εφαρµογές του Προγράµµατος Σπουδών
Πληροφορική της Σχολής Θετικών Επιστηµών και Τεχνολογίας του Ελληνικού Ανοικτού
Πανεπιστηµίου. Ο Τόµος Α΄ της Θεµατικής Ενότητας ΠΛΗ31 γράφηκε από την
Καθηγήτρια του Τµήµατος Πληροφορικής του Πανεπιστηµίου Κύπρου κ. Ελπίδα
Κεραυνού το 2000. Στο υλικό που ακολουθεί, γίνεται µια προσπάθεια παρουσίασης µε
σχετικά απλό και εύληπτο τρόπο των βασικών θεµάτων που αναπτύσσονται στα 11
Κεφάλαια του τόµου Α΄ της ΠΛΗ31 µε τη θεωρητική ανάπτυξη των θεµάτων αυτών να
συνοδεύεται από ένα αριθµό ασκήσεων – παραδειγµάτων που ελπίζουµε ότι θα
βοηθήσουν στην καλύτερη κατανόηση της θεωρίας. Όπως τονίζεται και από τη
συγγραφέα κ. Κεραυνού ο Τόµος Α΄ µπορεί να χωρισθεί σε δυο µέρη. Το πρώτο µέρος,
αποτελούµενο από τα πρώτα 6 Κεφάλαια αφορά στις βασικές, εισαγωγικές έννοιες της
Τεχνητής Νοηµοσύνης και το µεγαλύτερο βάρος πέφτει σε θέµατα που σχετίζονται µε
την αναπαράσταση γνώσης (knowledge representation) και την επίλυση προβληµάτων
(problem solving). Το δεύτερο µέρος του Τόµου Α΄, δηλαδή τα τελευταία τέσσερα
Κεφάλαια από το 7ο έως το 10
ο επικεντρώνονται σε πιο εφαρµοσµένα θέµατα που
σχετίζονται µε την αρχιτεκτονική Εµπείρων Συστηµάτων πρώτης και δεύτερης γενεάς,
καθώς επίσης και µε την Τεχνολογία Γνώσης (Knowledge Engineering) που αναφέρεται
και διέπει τη µεθοδολογία ανάπτυξης των Εµπείρων Συστηµάτων.
Βλέποντάς τη συνολικά, η Θεµατική Ενότητα ΠΛΗ31 πλην του Τόµου Α΄ υπό τον τίτλο
Έµπειρα Συστήµατα και Εφαρµογές, περιλαµβάνει άλλους δυο τόµους. Τον Τόµο Β΄ υπό
τον τίτλο 14. Νευρωνικά ∆ίκτυα και Εφαρµογές και τον Τόµο Γ΄ υπό τον τίτλο 15.
Γενετικοί Αλγόριθµοι και Εφαρµογές. Από τους τίτλους και µόνο των τριών τόµων είναι
φανερό ότι ο Τόµος Α΄ σκοπό έχει να µας εισαγάγει στον αρχικό, βασικό προβληµατισµό
που οδήγησε στην ανάπτυξη του κλάδου της Επιστήµης Υπολογιστών που ονοµάστηκε
Τεχνητή Νοηµοσύνη (Artificial Intelligence) και τις θεµελιώδεις αρχές ανάπτυξης και
κάποια χαρακτηριστικά παραδείγµατα ανάπτυξης εφαρµογών των Εµπείρων Συστηµάτων
(Expert Systems). Οι άλλοι δυο τόµοι αναφέρονται σε θέµατα που τείνουν να
4
αποτελέσουν κλάδους της λεγόµενης Υπολογιστικής Νοηµοσύνης (Computational
Intelligence) και αναφέρονται στις αρχές θεµελίωσης και ανάπτυξης των Τεχνητών
Νευρωνικών ∆ικτύων (Artificial Neural Networks) που γίνεται στον Τόµο Β΄ και σε
αυτές των Γενετικών Αλγορίθµων (Genetic Algorithms) που γίνεται στον Τόµο Γ΄.
Συνολικά, η ύλη των τριών αυτών τόµων προσφέρει µια σφαιρική παρουσίαση τριών
διαφορετικών τρόπων προσέγγισης και ανάπτυξης αντίστοιχων εφαρµογών για την
επίλυση προβληµάτων.
Είναι σηµαντικό να καταλάβουµε ότι οι τρεις διαφορετικές αυτές µεθοδολογίες και
τρόποι προσέγγισης αν και διαφορετικές, δεν είναι ούτε εντελώς ξένες µεταξύ τους, ούτε
αλληλοαποκλειόµενες. Αντιθέτως όπως θα έχουµε την ευκαιρία να δούµε, πολλά
προβλήµατα µπορούν να επιλυθούν µε τρόπους που προτείνονται και από τρεις
διαφορετικές αυτές µεθοδολογίες. Αρκετές φορές µάλιστα θα δούµε ότι µπορούν να
συνδυαστούν στους λεγόµενους υβριδικούς αλγορίθµους (hybrid algorithms) οι οποίοι
έχουν ενσωµατώσει, ολοκληρώσει και υλοποιήσει επιµέρους τµήµατα και από τις τρεις
αυτές µεθοδολογικές προσεγγίσεις.
Ίσως η κύρια διαφοροποίηση των Εµπείρων Συστηµάτων από τις άλλες δυο
µεθοδολογίες, δηλαδή από τα Τεχνητά Νευρωνικά ∆ίκτυα και τους Γενετικούς
Αλγορίθµους να βρίσκεται στον τρόπο µε τον οποίο κωδικοποιείται η υπάρχουσα γνώση
που θα µας οδηγήσει στην επίλυση ενός προβλήµατος. Για τα µεν Έµπειρα Συστήµατα, ο
τρόπος αναπαράστασης της γνώσης είναι συµβολικός (symbolic knowledge
representation) και η µέθοδος επίλυσης ακολουθεί ντετερµινιστικά τα βήµατα της
µαθηµατικής λογικής, υιοθετώντας συχνά τη χρήση ευρετικών (heuristics) δηλαδή
µηχανισµών ειδικών µηχανισµών πλοήγησης και εστίασης µέσα σε ένα πολύ µεγάλο
χώρο αναζήτησης λύσεων (search space). Αντίθετα, τόσο στα Τεχνητά Νευρωνικά
∆ίκτυα, όσο και στους Γενετικούς Αλγόριθµους η υπάρχουσα γνώση κωδικοποιείται µε
διαφορετικό, µη-συµβολικό τρόπο, ενώ η µέθοδος επίλυσης δεν ακολουθεί αυστηρά
µαθηµατικά βήµατα, αλλά είναι περισσότερο εξελικτική (evolutionary) και
πιθανοκρατική (probabilistic). Στα µεν Τεχνητά Νευρωνικά ∆ίκτυα η αποθήκευση της
γνώσης γίνεται µέσα στην ίδια τη δοµή και τα χαρακτηριστικά του Νευρωνικού ∆ικτύου
5
που έχει υλοποιηθεί για την επίλυση του προβλήµατος. Στους δε Γενετικούς
Αλγόριθµους η υπάρχουσα γνώση έχει µε κατάλληλο τρόπο κωδικοποιηθεί στην δοµή
των υπό αναζήτηση λύσεων του προβλήµατος, στον τρόπο που οι λύσεις αυτές
συνδυάζονται µεταξύ τους µε την ελπίδα ότι οι προκύπτοντες συνδυασµοί θα είναι
καλύτερες λύσεις και στον µαθηµατικό τρόπο µε τον οποίο οι διάφορες λύσεις τις οποίες
επεξεργάζεται ο Γενετικός Αλγόριθµος αξιολογούνται και χαρακτηρίζονται ως καλές,
καλύτερες, βέλτιστες λύσεις ή αντίθετα ως κακές, χειρότερες ή χείριστες λύσεις του
προβλήµατος.
Είναι επίσης οι διαφορετικές χρονικές περίοδοι ανεξάρτητης εµφάνισης και ανάπτυξης
των τριών αυτών µεθοδολογιών που οδήγησαν στον διαχωρισµό της «κλασικής»
Τεχνητής Νοηµοσύνης που αναφέρεται στον συµβολικό τρόπο αναπαράστασης και
µαθηµατικής επίλυσης των προβληµάτων όπως γίνεται στα Έµπειρα Συστήµατα, από τον
περιγραφικό, µη-συµβολικό, εξελικτικό, υπολογιστικό και σε ένα µεγάλο βαθµό
πιθανοκρατικό τρόπο επίλυσης των προβληµάτων που ακολουθούν οι τεχνικές των
Τεχνητών Νευρωνικών ∆ικτύων και των Γενετικών Αλγορίθµων. Για το λόγο αυτό και
εντελώς περιγραφικά χρησιµοποιούµε τη διάκριση µεταξύ Τεχνητής (εννοώντας
συµβολικής) Νοηµοσύνης που αφορά κυρίως στα Έµπειρα Συστήµατα και
Υπολογιστικής Νοηµοσύνης που αφορά στα Τεχνητά Νευρωνικά ∆ίκτυα και τους
Γενετικούς Αλγόριθµους. Φυσικά, όπως όλες οι διακρίσεις και οι ταξινοµήσεις, έτσι και
η προαναφερθείσα είναι γέννηµα του δικού µας µυαλού και γίνεται περισσότερο για δική
µας ευκολία και όχι γιατί κατ’ ανάγκη υφίσταται κατ’ ουσία. Έτσι, όπως τονίστηκε
προηγουµένως οι τρεις αυτές τεχνικές συχνά µπορούν να συνδυαστούν για την
υλοποίηση υβριδικών αλγορίθµων που παρουσιάζουν συνδυαζόµενες υψηλότερη
απόδοση απ’ ότι η καθεµία από τις µεθόδους αυτές χωριστά.
Μένει λοιπόν σε σας να ανακαλύψετε µέσα από την Θεµατική Ενότητα ΠΛΗ31 του
Ελληνικού Ανοικτού Πανεπιστηµίου τους θαυµαστούς αυτούς τρόπους µε τους οποίους
η Επιστήµη Υπολογιστών συνδυάζεται σε µια καινούργια σύνθεση µε τη Φιλοσοφία, τα
Μαθηµατικά, τη Νευροφυσιολογία, τις Γνωσιακές Νευροεπιστήµες, την Γνωστική
Ψυχολογία, τη Βιολογία και την ∆αρβινική Θεωρία της εξέλιξης των ειδών. Η
6
καινούργια και συνεχώς εµπλουτιζόµενη αυτή σύνθεση που αφορά στην Τεχνητή /
Υπολογιστική Νοηµοσύνη και τις εφαρµογές της προσπαθεί µε τα µεθοδολογικά της
εργαλεία να απαντήσει στα καίρια ερωτήµατα σχετικά µε τη φύση, τις ιδιότητες, τα
χαρακτηριστικά και τις λειτουργίες της Νοηµοσύνης όπως αυτή απαντάται στα φυσικά-
βιολογικά συστήµατα όπως ο άνθρωπος, αλλά και να καταφέρει να ενσωµατώσει τα
νοήµονα αυτά χαρακτηριστικά και τις νοητικές λειτουργίες στα υπολογιστικά
συστήµατα. Ίσως είναι αυτά τα δυο καίρια ζητήµατα που κάνουν την Θεµατική Ενότητα
ΠΛΗ31 ιδιαιτέρως ενδιαφέρουσα και συναρπαστική.
7
1. Σύνοψη 1ου Κεφαλαίου
Στο 1ο Κεφάλαιο του Τόµου Α΄ (σελ. 15 - 32), που είναι το εισαγωγικό του τόµου αυτού
δίνονται τέσσερις διαφορετικοί ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) σε µια
προσπάθεια καθορισµού και οριοθέτησης του σχετικού επιστηµονικού πεδίου. Πέρα από
την προσπάθεια ορισµού του τι είναι η ΤΝ, γίνεται µια ιστορική αναδροµή των
προσπαθειών ανάπτυξης της, των προβληµάτων που παρουσιάστηκαν, των λανθασµένων
οδών που κατά καιρούς ακολουθήθηκαν αλλά και των επιτυχιών που επιτεύχθηκαν.
Ιδιαίτερη αναφορά γίνεται σε έναν από τους θεωρούµενους ως πατέρες της ΤΝ, δηλαδή
στον Alan Touring και την περίφηµη οµώνυµη δοκιµή Touring (Touring Test) που
πρότεινε προκειµένου για να διαπιστώσει κάποιος αν κάποιο τεχνητό σύστηµα (για
παράδειγµα ένα υπολογιστικό σύστηµα) διαθέτει ευφυΐα ή όχι. Στη συνέχεια
παρουσιάζονται δυο πολύ βασικές έννοιες της ΤΝ, συγκεκριµένα η έννοια του συµβόλου
και της επεξεργασίας συµβόλων (symbolic processing) του και η έννοια του ευρετικού
(heuristic), έννοιες που θα αναπτυχθούν θεωρητικά πιο αναλυτικά στα επόµενα
Κεφάλαια όπου και θα παρουσιασθούν χαρακτηριστικά παραδείγµατα χρήση τους.
1.1 Προσπάθειες Ορισµού της Τεχνητής Νοηµοσύνης
Στο βασικό θέµα του 1ου Κεφαλαίου, δηλαδή στο ερώτηµα «τι είναι η Τεχνητή
Νοηµοσύνη», εύκολα καταλαβαίνει κανείς ότι δεν µπορεί να δοθεί µονοσήµαντη και
οριστική απάντηση. Ίσως ο πιο ευσύνοπτος και µαθηµατικοποιηµένος (άρα καθόλου
περιγραφικός) ορισµός να είναι ο εξής:
ΤΝ = Αναπαράσταση Γνώσης + Αναζήτηση
Παρουσιάζονται τέσσερις διαφορετικοί ορισµοί, γεγονός που επιτείνει την αίσθηση ότι ο
ορισµός της έννοιας Τεχνητή Νοηµοσύνη δεν είναι ούτε εύκολος, πιθανόν ούτε και
µονοσήµαντος. Οι τέσσερις ορισµοί που δίνονται είναι οι εξής:
1. Τεχνητή Νοηµοσύνη είναι ένας κλάδος της Πληροφορικής ο οποίος ασχολείται µε
την αυτοµατοποίηση ευφυούς συµπεριφοράς.
8
2. Τεχνητή Νοηµοσύνη είναι η µελέτη των µηχανισµών που διέπουν την ευφυή
συµπεριφορά, µέσω της κατασκευής και αξιολόγησης συστηµάτων τα οποία
παριστάνουν τους µηχανισµούς αυτούς.
3. Τεχνητή Νοηµοσύνη είναι η ανάπτυξη υπολογιστικών συστηµάτων για την επίλυση
δύσκολων προβληµάτων, τα οποία δεν µπορούν να επιλυθούν µε την εξαντλητική
εξέταση όλων των πιθανών λύσεων µια και αυτές µπορεί να είναι πάρα πολλές.
4. Τεχνητή Νοηµοσύνη είναι η µελέτη του πως κάνουµε τον υπολογιστή να πράξει κάτι
που επί του παρόντος ο άνθρωπος µπορεί να πράξει καλύτερα.
Από τους παραπάνω τέσσερις ορισµούς, οι πρώτοι δύο εισάγονται από τους Luger και
Stubblefield, ο τρίτος έχει προταθεί από διάφορους ερευνητές, ενώ τον τελευταίο
οφείλουµε στους Rich και Knight. Επιπρόσθετα ίσως είναι χρήσιµο να αναφερθούµε
στους παρακάτω ορισµούς της Τεχνητής Νοηµοσύνης:
5. Τεχνητή Νοηµοσύνη είναι η προσπάθεια να κατασκευάσουµε υπολογιστές µε
διανοητική ικανότητα µε την πλήρη και την κυριολεκτική έννοια του όρου.
6. Τεχνητή Νοηµοσύνη είναι η µελέτη των υπολογισµών που καθιστούν εφικτή την
αντίληψη, τη λογική σκέψη και την αντίδραση.
Ο πέµπτος ορισµός προτάθηκε από τον Haugeland, ενώ ο έκτος από τον Wilson. Ίσως
ισχυριστεί κάποιος ότι οι παραπάνω συνολικά έξι ορισµοί αντί να καλυτερεύουν τα
πράγµατα, µάλλον συσκοτίζουν το θέµα, επιτείνοντας τη σύγχυση. Ωστόσο είναι φανερό
ότι όλοι τους καταφέρνουν και φωτίζουν κάποιες όψεις ή χαρακτηριστικά της Τεχνητής
Νοηµοσύνης, αλλά φαίνεται να αδυνατούν να τα συµπεριλάβουν όλα και να τα
περιγράψουν µε την βαρύτητα που απαιτείται. ∆εν θα πρέπει όµως να απογοητευόµαστε,
αλλά να οδηγηθούµε σε πιο σύνθετες περιγραφές και ορισµούς, όπως αυτός που δίνεται
από τους Βλαχάβα και συνεργάτες:
9
7. Τεχνητή Νοηµοσύνη είναι ο τοµέας της Επιστήµης Υπολογιστών που ασχολείται µε
τη σχεδίαση και την υλοποίηση προγραµµάτων τα οποία είναι ικανά να µιµηθούν
τις ανθρώπινες γνωστικές ικανότητες, εµφανίζοντας έτσι χαρακτηριστικά που
αποδίδουµε σε ανθρώπινη συµπεριφορά, όπως η επίλυση προβληµάτων, η αντίληψη
µέσω των όρασης, η µάθηση, η εξαγωγή συµπερασµάτων, η κατανόηση φυσικής
γλώσσας, κλπ.
Ο παραπάνω ορισµός αν και αρκετά πιο ανθρωποκεντρικός από τους προηγούµενους,
προσπαθεί να ορίσει την ΤΝ µε βάση κάποιες χαρακτηριστικές ανθρώπινες νοητικές
λειτουργίες και την ανθρώπινη συµπεριφορά. Φυσικά απέχει από το να είναι πλήρης και
περιεκτικός. Θα µπορούσε να γενικευθεί ακόµα περισσότερο, δεδοµένου ότι πολλά από
τα χαρακτηριστικά και τις ιδιότητες που αναφέρει δεν είναι αποκλειστικά ανθρώπινα.
Για παράδειγµα αντίληψη µέσω όρασης έχουν τα περισσότερα από τα ζώα, µάλιστα
κάποια από αυτά σε πολύ υψηλότερα επίπεδα απόδοσης από τα ανθρώπινα. Επιπλέον,
θαλάσσια θηλαστικά όπως τα δελφίνια ή ιπτάµενα θηλαστικά όπως οι νυχτερίδες έχουν
ενσωµατωµένους µηχανισµούς ηχω-ακουστικής αντίληψης (sonar) που τους επιτρέπουν
να έχουν τρισδιάστατη αντίληψη του περιβάλλοντος χώρου όχι µέσω της όρασης αλλά
από την λήψη των ανακλάσεων υψίσυχνων ήχων που τα ίδια εκπέµπουν. Εναλλακτικά θα
µπορούσε να γίνει αναφορά στην ικανότητα αντίληψης µέσω των αισθήσεων (κι όχι της
όρασης αποκλειστικά). Επίσης ιδιότητες µάθησης διαθέτουν λίγο ως πολύ όλα τα έµβια
όντα. Τέλος ούτε η δυνατότητα παραγωγής και επεξεργασίας γλώσσας είναι
αποκλειστικά ανθρώπινο προνόµιο, καθώς απαντάται σε πολλά είδη του ζωικού
βασιλείου και µάλιστα µε πολύ πλούσιο ρεπερτόριο λέξεων.
Παρ’ όλες τις αδυναµίες των ορισµών που παρατέθηκαν προκύπτει ότι το βασικό
πρόβληµα σχετίζεται περισσότερο µε το γεγονός πως η ΤΝ πρέπει να ορισθεί µε βάση
άλλες έννοιες που είναι εξίσου δύσκολο, αν όχι δυσκολότερο να ορισθούν. Έννοιες όπως
ευφυΐα, µάθηση, αντίληψη, κατανόηση, διανοητική ικανότητα, κλπ., που συναντήσαµε
στους παραπάνω ορισµούς είναι εξαιρετικά δύσκολο να ορισθούν από µόνες τους χωρίς
να οδηγηθούµε σε κυκλικές αναφορές και ορισµούς (δηλαδή µια από τις έννοιες να
ορίζεται µε βάση κάποιες από τις υπόλοιπες). Μια επιπλέον δυσκολία είναι ότι η ΤΝ σαν
10
επιστηµονικός κλάδος είναι ραγδαία αναπτυσσόµενος µε αποτέλεσµα πολλές
προσπάθειες ορισµού της να ξεπερνιούνται από τις ίδιες τις εξελίξεις αυτού ή άλλων
επιστηµονικών πεδίων.
1.2 Η ∆οκιµή Turing
Ήδη από το 1950, κι ενώ ο κλάδος της ανάπτυξης υπολογιστών σε θεωρητικό και
πρακτικό επίπεδο ήταν ακόµα στα σπάργανα, ο άγγλος µαθηµατικός Alan Turing (1912 –
1954) εµπνεύστηκε και πρότεινε την οµώνυµη δοκιµή προκειµένου να προσδιοριστεί αν
κάποιο τεχνητό σύστηµα διαθέτει ή όχι ευφυΐα (νοηµοσύνη). Σύµφωνα µε όσα πρότεινε
ο Turing η δοκιµή περιλαµβάνει τρεις ξεχωριστούς χώρους (δωµάτια), έναν για το υπό
δοκιµή τεχνητό σύστηµα, έναν για έναν άνθρωπο που χρησιµοποιείται ως σύστηµα
αναφοράς και σύγκρισης και τέλος ένα τρίτο χώρο για έναν άνθρωπο που παίζει το ρόλο
του εξεταστή. Ο εξεταστής δεν γνωρίζει σε ποιον από τους τρεις χώρους βρίσκεται το
υπό εξέταση τεχνητό σύστηµα και σε ποιο ο άνθρωπος-σύστηµα αναφοράς. Η δοκιµή
Touring προβλέπει την υποβολή από τον εξεταστή µιας σειράς ερωτήσεων προς τους
εβρισκόµενους στα δυο πρώτα δωµάτια και αξιολόγηση των απαντήσεων που λαµβάνει
από αυτούς. Αν στο τέλος της δοκιµής, δηλαδή αν ο εξεταστής εξαντλήσει τον κατάλογο
των ερωτήσεων και δεν είναι σε θέση να διακρίνει σε ποιο δωµάτιο βρίσκεται το υπό
δοκιµή τεχνητό σύστηµα και σε ποιο χώρο βρίσκεται ο άνθρωπος-σύστηµα αναφοράς,
τότε το τεχνητό σύστηµα διαθέτει ευφυΐα.
Η δοκιµή Touring αποτελεί µια (επίσης ανθρωποκεντρική) προσπάθεια όχι τόσο ορισµού
αλλά εντοπισµού της ευφυΐας. Είναι εξόχως ανθρωποκεντρική, όπως κάποιοι από τους
ορισµούς της ΤΝ που είδαµε στην προηγούµενη παράγραφο 1.1, αλλά και αφοπλιστικά
απλή στη σύλληψή της. Κλειδί της επιτυχίας ή αποτυχίας της δοκιµής Touring είναι το
περιεχόµενο της σειράς των ερωτήσεων που θα τεθούν κατά τη διάρκειά της. Κάποιες
από αυτές θα µπορούσε να είναι ερωτήσεις-παγίδες. Για παράδειγµα, ένα αρκετά
υψηλών επιδόσεων υπολογιστικό σύστηµα θα πρέπει να είναι ικανό για να απαντήσει
σωστά σε ερωτήσεις που θα αφορούσαν στην κατανόηση φυσικής γλώσσας,
αναγνώρισης προτύπων, εξαγωγής συµπερασµάτων, κλπ., αλλά ταυτόχρονα θα έπρεπε
να είναι αρκετά «έξυπνο» ώστε να αργήσει να απαντήσει σε µια ερώτηση που θα
11
αφορούσε στον πολλαπλασιασµό ή τη διαίρεση πολυψήφιων αριθµών, καθυστερώντας
δηλαδή όπως θα έκανε και ο µέσος άνθρωπος (όπως ο άνθρωπος-σύστηµα αναφοράς που
βρίσκεται στο διπλανό δωµάτιο) αν είχε να αντιµετωπίσει παρόµοιο πρόβληµα και
έπρεπε να κάνει τον ζητούµενο υπολογισµό µε το µυαλό του ή µε µολύβι και χαρτί.
Όπως ήταν φυσικό, η ∆οκιµή Touring δεν βοήθησε µόνο στο να τεθεί µε καθαρά
πρακτικούς όρους το πρόβληµα εντοπισµού και αναγνώρισης της νοηµοσύνης και της
ευφυούς συµπεριφοράς, αλλά ταυτόχρονα έβαλε πολύ υψηλά τον πήχη για την απόδοση
του χαρακτηρισµού ενός συστήµατος ως ευφυές. Ως εκ τούτου κανένα από τα µέχρι
τώρα υπολογιστικά συστήµατα δεν έχει καταφέρει να περάσει επιτυχώς τη ∆οκιµή
Touring, αν και σχετικοί διαγωνισµοί οργανώνονται σε ετήσια βάση. Επιπλέον, ως
ευχάριστη παρενέργεια ενέπνευσε τον κόσµο της Τέχνης όπως πολλά λογοτεχνικά
κείµενα ιδιαίτερα της κατηγορίας της επιστηµονικής φαντασίας, αλλά και
κινηµατογραφικά έργα µε χαρακτηριστικότερο το Blade Runner του Ridley Scott, του
οποίου η αρχική σκηνή είναι η διενέργεια µιας παραλλαγµένης δοκιµής Touring.
1.3 Ιστορική Αναδροµή
Στην ιστορική αναδροµή τονίζονται επιτυχίες των υπολογιστών σε πεδία που κατ’
εξοχήν θεωρούνται ίδιον της ανθρώπινης ευφυΐας, όπως αυτή του υπολογιστή της
εταιρείας IBM µε την κωδική ονοµασία Deep Blue ο ποίος κατόρθωσε το 1996 να
νικήσει τον παγκόσµιο πρωταθλητή Garry Kasparov στο σκάκι. Ωστόσο και αυτό το
αποτέλεσµα που δικαίως θεωρείται η µεγαλύτερη επιτυχία της ΤΝ δεν παύει να µας
υπενθυµίζει ότι είναι άλλο η µηχανική ευφυΐα του Deep Blue που απορρέει από την
γρήγορη ανάλυση κινήσεων και άλλο η ύπαρξη βαθιάς κατανόησης και συνείδησης των
κινήσεων αυτών.
Η αρχική προσέγγιση της προσπάθειας ανάπτυξης συστηµάτων για επίλυση
προβληµάτων ελάχιστα αναγνώρισε τον ουσιαστικό ρόλο που διαδραµατίζει η γνώση και
ο κατάλληλος χειρισµός της για την επίλυση προβληµάτων. Υπήρχε η λανθασµένη όπως
αποδείχθηκε εκ των υστέρων άποψη ότι το µόνο που χρειάζεται είναι η εξερεύνηση ενός
µεγάλου (όσο µεγάλου) αριθµού λύσεων και η επιλογή της καλύτερης. Η αντίληψη αυτή
οδήγησε τους Newell και Simon στην ανάπτυξη του Συστήµατος Γενικής Επίλυσης
12
Προβληµάτων (General Problem Solver - GPS), που θα µπορούσε να λύσει οποιοδήποτε
πρόβληµα σε οποιοδήποτε τοµέα. Σχέδιο υπερβολικά φιλόδοξο, το οποίο
εγκαταλείφθηκε µετά από µια δεκαετή άγονη προσπάθεια, αλλά βοήθησε στο να υπάρξει
µια ριζική αλλαγή προσανατολισµού µε πιο ανθρωποκεντρική διάθεση. Έτσι
αναπτύχθηκε ενδιαφέρον για την αναπαράσταση γνώσης µε συµβολικό και περιγραφικό
τρόπο που οδήγησε στην ανάπτυξη γλωσσών προγραµµατισµού ειδικών για εφαρµογές
ΤΝ.
1.4 Συστήµατα και Επεξεργασία Φυσικών Συµβόλων
Όπως είδαµε στην προηγούµενη παράγραφο 1.3 η γνώση αποτελεί βασικό µέρος ενός
συστήµατος ΤΝ. Το ίδιο και η αναπαράστασή της µε τη µορφή δοµών συµβόλων (symbol
structures), και η συνακόλουθη υπόθεση του συστήµατος φυσικών συµβόλων (physical
symbol system hypothesis) που προτάθηκε από τους Newell και Simon το 1976. Ένα
τέτοιο σύστηµα αποτελείται από σύµβολα, που απαρτίζουν δοµές συµβόλων οι οποίες
υπόκεινται σε επεξεργασία µέσα από ένα αριθµό διεργασιών που περιλαµβάνει το
σύστηµα, όπως αυτές της δηµιουργίας, τροποποίησης, αναπαραγωγής και καταστροφής.
Οι δοµές συµβόλων του συστήµατος εξελίσσονται δυναµικά. Σύµφωνα µε την υπόθεση
των Newell και Simon (και εδώ είναι το ενδιαφέρον), ένα τέτοιο σύστηµα έχει τα
αναγκαία και επαρκή µέσα για την ανάπτυξη ευφυούς συµπεριφοράς. Η υπόθεση αυτή
δεν µπορεί βέβαια ούτε να αποδειχθεί ούτε να απορριφθεί λογικά. Έτσι, µένει η κατά
περίπτωση πειραµατική της επιβεβαίωση.
1.5 Αλγόριθµοι και ευρετικά
Είναι σηµαντικό να κατανοήσουµε την έννοια του ευρετικού και τη χρησιµότητά του
στην επίλυση προβληµάτων µε χρήση ΤΝ. Για να γίνει κατανοητό το ευρετικό πρέπει να
αντιδιαστείλουµε τις καθαρά αυστηρές αλγοριθµικές τεχνικές µε τις λεγόµενες ευρετικές
υπολογιστικές µεθόδους. Μια καθαρά αλγοριθµική µέθοδος είναι µια βήµα-προς-βήµα
µέθοδος που ανάλογα µε τα δεδοµένα του προβλήµατος θα αναζητήσει εξαντλητικά το
ζητούµενο αποτέλεσµα. Στον πραγµατικό κόσµο αυτό δεν είναι πάντα εφικτό, καθώς
υπάρχουν προβλήµατα που ο χώρος αναζήτησης (search or problem space) µπορεί να
αποδειχθεί τεράστιος και έξω από τις δυνατότητες του υπολογιστικού συστήµατος. Άλλα
13
προβλήµατα είναι η αβεβαιότητα (uncertainty) και η ηµιτέλεια (incompleteness) των
δεδοµένων. Η ύπαρξη τέτοιων προβληµάτων µπορεί να οδηγήσει σε ατέρµονη
αναζήτηση, να καταστήσει αδύνατη την κατάληξη σε λύση ή να οδηγήσει σε
λανθασµένη λύση του προβλήµατος.
Σε αυτές τις περιπτώσεις µια ευρετική µέθοδος µπορεί να οδηγήσει σε λύση είτε στη
βέλτιστη, είτε σε λύση κοντά στη βέλτιστη (το οποίο είναι προτιµότερο από το να µην
έχουµε λύση). Οι ευρετικές µέθοδοι ενσωµατώνουν τα λεγόµενα ευρετικά που δεν είναι
τίποτα περισσότερο παρά κανόνες που παρέχουν µια χρήσιµη και πολλές φορές πιο
γρήγορη πλοήγηση και καθοδήγηση στον χώρο αναζήτησης του προβλήµατος οδηγώντας
σε βέλτιστες ή υποβέλτιστες λύσεις. Χρειάζεται προσοχή και πρέπει να είναι κατανοητό
ότι τα ευρετικά δεν εγγυώνται αναγκαστικά την επιτυχία, ούτε είναι κατ’ ανάγκη
αλάνθαστα. Μπορούν δηλαδή να οδηγήσουν πιο γρήγορα µεν αλλά να καταλήξουν σε
σηµεία που να µην υπάρχει λύση. Συνεπώς µπορεί να αυξάνουν την ταχύτητα σύγκλισης
του αλγορίθµου, ενδεχοµένως όµως σε βάρος της πληρότητας του.
Αν εξαιρέσουµε τις καθολικές αλήθειες (universal truths), όλη η υπόλοιπη γνώση που
χρησιµοποιούµε είναι ουσιαστικά ευρετικά µια και πρόκειται για εµπειρική γνώση και
απέχει πολύ από το να θεωρηθεί αλάνθαστη. Σε ένα σύστηµα ΤΝ ενδεχοµένως να
υπάρχουν διάφορα σηµεία και επίπεδα που εφαρµόζονται ευρετικά. Στη γενική
περίπτωση µπορεί να έχουµε τα λεγόµενα µετα-ευρετικά (meta-heuristics), δηλαδή
ευρετικά που καθοδηγούν τη χρήση άλλων ευρετικών.
Φυσικά ευρετικά χρησιµοποιούµε και στην καθηµερινή µας ζωή. Όταν οδηγούµε στο
δρόµο για να πάµε από το σηµείο Α στο σηµείο Β υπάρχουν πολλές διαφορετικές
διαδροµές που µπορούµε να ακολουθήσουµε εναλλακτικά. Το σύνολο αυτών των
διαδροµών αποτελεί το χώρο αναζήτησης, µέσα στον οποίο πρέπει να ερευνήσουµε για
να βρούµε τη βέλτιστη ή κάποιες υποβέλτιστες λύσεις. Εδώ σαν βέλτιστη λύση είναι η
διαδροµή που θα µας πάει στον προορισµό µας στο λιγότερο χρόνο. Όταν αποφασίζουµε
να µην περάσουµε από κάποιο σηµείο που εµπειρικά γνωρίζουµε ότι υπάρχει
συνωστισµός (π.χ. γίνεται τη συγκεκριµένη µέρα γίνεται λαϊκή αγορά, ή τη
14
συγκεκριµένη ώρα έχει πολύ αυξηµένη κίνηση, κλπ), ουσιαστικά κάνουµε χρήση ενός
ευρετικού για να αποκλείσουµε κάποια ή κάποιες πιθανές διαδροµές από το σύνολο
λύσεων που υπάρχουν στο χώρο αναζήτησης. Συνεπώς η υιοθέτηση του συγκεκριµένου
ευρετικού µειώνει το χώρο αναζήτησης, άρα µειώνει το χρόνο που θα χρειαστούµε για να
επεξεργαστούµε τα δεδοµένα και να καταλήξουµε στην βέλτιστη διαδροµή-λύση.
Το παραπάνω είναι παράδειγµα ευρετικού που λειτουργεί ως κλαδευτήρι (pruning
heuristics) καθώς φαίνεται ότι η λειτουργία του είναι να ψαλιδίζει το χώρο αναζήτησης
του προβλήµατος. Υπάρχουν όµως και ευρετικά που οδηγούν απ’ ευθείας σε κάποια
λύση (homing heuristics). Ανεξάρτητα από τη λειτουργία τους, τα ευρετικά πρέπει να
διατυπώνονται µε κατά το δυνατόν γενικότερους όρους.
Για τη χρήση (απλής) λογικής στην επίλυση προβληµάτων δείτε την 16. Άσκηση 1: Το
νησί των εντίµων και των απατεώνων και την 17. Άσκηση 2: Καπέλα µε φτερά.
15
2. Σύνοψη 2ου Κεφαλαίου
Το 2ο Κεφάλαιο αναφέρεται στην Επίλυση Προβληµάτων (problem solving). ∆εδοµένου
ότι η ΤΝ ασχολείται µε προβλήµατα πολύπλοκων προβληµάτων των οποίων η επίλυση
συχνά απαιτεί διερεύνηση σε πολύ µεγάλους χώρους αναζήτησης, τίθενται επιτακτικά
ζητήµατα που αφορούν σε θέµατα αναπαράστασης του υπό διερεύνηση προβλήµατος και
των αναζητούµενων λύσεων. Σε ότι αφορά τις µεθόδους αναζήτησης λύσεων,
συζητούνται δυο από τις πιο χαρακτηριστικές τυφλές µεθόδους αναζήτησης (blind search
methods), όπως η αναζήτηση σε βάθος (depth-first search) και η αναζήτηση σε πλάτος
(breadth-first search). Σαν επόµενο βήµα περιγράφεται ο αλγόριθµος Α* ο οποίος
υλοποιεί αναζήτηση µε χρήση ευρετικών. Παρουσιάζονται οι έννοιες της ενέργειας και
του τελεστή δράσης που οδηγεί από µια κατάσταση αναζήτησης σε κάποια άλλη, όπως
και το πρόβληµα πλαισίου (frame problem) που περιγράφει τις αλλαγές που επέρχονται
σε µια κατάσταση από την εφαρµογή µιας ενέργειας (τελεστή δράσης). Τέλος, γίνεται
αναφορά στα προβλήµατα ταξινόµησης και τα προβλήµατα σύνθεσης και τη
διαφοροποίησή τους.
2.1 Αναπαράσταση ενός προβλήµατος και το πρόβληµα της αναπαράστασης
Για την επίλυση ενός προβλήµατος µέσω αναζήτησης µιας σειράς καταστάσεων,
απαιτούνται τα εξής:
• αναπαράσταση των καταστάσεων του προβλήµατος
• προσδιορισµός των ενεργειών, δηλαδή τελεστών δράσης που µας οδηγούν από
µια κατάσταση σε µια άλλη
• ένας µηχανισµός πλοήγησης στον χώρο αναζήτησης, ο οποίος πιθανόν να
υιοθετεί τη χρήση ευρετικών
Τα παραπάνω τρία στοιχεία αποτελούν το λεγόµενο πρόβληµα αναπαράστασης
(representation problem) ενός υπό εξέταση προβλήµατος, πράγµα που σηµαίνει πως για
να λύσουµε ένα πρόβληµα, πρέπει πρώτα να λύσουµε το πρόβληµα της αναπαράστασης
του προβλήµατος αυτού. Είναι σηµαντικό να κατανοήσουµε ότι η επίλυση του
προβλήµατος της αναπαράστασης ενός προβλήµατος, ουσιαστικά οδηγεί στη λύση το
υπό εξέταση πρόβληµα. Το πρόβληµα της αναπαράστασης ενός προβλήµατος δεν είναι
16
πάντοτε εύκολη υπόθεση καθώς µπορεί να προκύψουν µεγάλοι ή εναλλακτικοί χώροι
αναζήτησης για τους οποίους δεν µπορούµε να αποφανθούµε ποιος είναι ο προτιµότερος.
Ας σηµειωθεί επίσης ότι από τα τρία προαναφερόµενα στοιχεία του προβλήµατος
αναπαράστασης τα δυο πρώτα (δηλαδή η αναπαράσταση των καταστάσεων και ο
προσδιορισµός των τελεστών δράσης) εξαρτώνται άµεσα από το υπό εξέταση πρόβληµα.
Αντίθετα, το τρίτο στοιχείο, δηλαδή ο µηχανισµός πλοήγησης και οι γενικές µέθοδοι στις
οποίες βασίζεται ένας τέτοιος µηχανισµός είναι εν γένει ανεξάρτητος από το υπό εξέταση
πρόβληµα.
Όπως και σε οποιοδήποτε άλλο πρόβληµα, έτσι και το πρόβληµα της αναπαράστασης
του υπό εξέταση προβλήµατος πρέπει να διέπεται από τις αρχές της οικονοµίας, της
απλότητας και της γενικότητας. Αν και γενικά δεν τίθεται περιορισµός σε σχέση µε την
πολυπλοκότητα της δοµής αναπαράστασης των καταστάσεων ενός προβλήµατος, ούτε
τίθεται κάποιος περιορισµός σε σχέση µε τον αριθµό και τη δοµή των τελεστών δράσης,
είναι αυτονόητο πως και ο χώρος αναζήτησης του προβλήµατος και οι τελεστές δράσης
πρέπει να είναι κατά το δυνατόν µικρότεροι αριθµητικά και απλούστεροι ως προς τη
δοµή του. Αντίστοιχη προσέγγιση πρέπει να υιοθετείται στην περίπτωση που έχει
επιλεγεί η χρήση ευρετικών για την καθοδήγηση της πλοήγησης στο χώρο αναζήτησης.
Έτσι, τόσο οι τελεστές δράσης, όσο και τα ευρετικά, πρέπει να είναι όσο πιο γενικά
γίνεται.
Όπως ειπώθηκε προηγούµενα, ένας τελεστής δράσης µας οδηγεί από µια κατάσταση σε
µια άλλη. Στη γενική του µορφή, ένας τελεστής δράσης περιγράφεται ως εξής:
Τελεστής ∆ράσης : Προκείµενο → Ενέργειας
όπου το προκείµενο είναι µια συνθήκη που πρέπει να ικανοποιείται ως βασική
προϋπόθεση για την εφαρµογή της συγκεκριµένης δράσης. Στη γενική περίπτωση οι
ενέργειες µπορεί να λειτουργούν αθροιστικά ή µη-αθροιστικά, ανάλογα µε το αν
συνεπάγονται απλώς την προσθήκη ενός νέου στοιχείου στη δοµή των καταστάσεων ή
αν έχουν σαν αποτέλεσµα την προσθήκη νέων δεδοµένων και τη διαγραφή (αναίρεση)
17
παλιότερων δεδοµένων. Η περιγραφή των αλλαγών που επέρχονται σε µια κατάσταση
µετά από την εφαρµογή µιας ενέργειας είναι το λεγόµενο πρόβληµα πλαισίου.
Κλείνοντας σε σχέση µε το πρόβληµα της αναπαράστασης πρέπει να διακρίνουµε τις
διάφορες καταστάσεις σε ανοικτές και κλειστές σε σχέση µε το σηµείο πλοήγησης στο
οποίο βρισκόµαστε. Οι ανοικτές καταστάσεις είτε δεν έχουν διερευνηθεί, είτε χρήζουν
περαιτέρω διερεύνησης. Οι κλειστές καταστάσεις είναι αυτές που επί του παρόντος
θεωρούνται πως έχουν διερευνηθεί. Επίσης πρέπει να έχουν προσδιοριστεί η αρχική, όσο
και η τελική κατάσταση (ή τελικές καταστάσεις, γιατί στη γενική περίπτωση µπορεί να
είναι περισσότερες από µια).
2.2 Μηχανισµοί πλοήγησης
Οι µέθοδοι πλοήγησης µας επιτρέπουν τη διερεύνηση του χώρου αναζήτησης και την
εξέταση των διαφόρων καταστάσεων που αυτός περιέχει, µε σκοπό την µετάβαση από
µια αρχική κατάσταση σε µια (ικανοποιητική) τελική κατάσταση που θεωρούµε λύση
του υπό εξέταση προβλήµατος. Στην πιο απλή µορφή τους οι µέθοδοι πλοήγησης µπορεί
να είναι εξαντλητικοί, επισκεπτόµενοι όλες τα πιθανά σηµεία (καταστάσεις) του χώρου
αναζήτησης. Μπορεί όµως να είναι πιο συστηµατικοί, όπως επίσης και να έχουν
υιοθετήσει διάφορα ευρετικά µε σκοπό την ταχύτερη εύρεση µιας αποδεκτής (ή της
µοναδικής) λύσης του υπό εξέταση προβλήµατος. Ως ελάχιστο λειτουργικό
χαρακτηριστικό, ένας µηχανισµός πλοήγησης πρέπει να είναι σε θέση να εντοπίζει
κυκλικές διαδροµές, διαφορετικά ενέχεται ο κίνδυνος η πλοήγηση να εγκλωβιστεί σε
ατέρµονης διάρκειας βρόχους. Επιπλέον για κάθε µηχανισµό πλοήγησης πρέπει να
εξετάζονται ζητήµατα που σχετίζονται µε τη χρήση πόρων του συστήµατος (απαιτήσεις
σε µνήµη και υπολογιστική ισχύ). Για την περιγραφή ενός µηχανισµού πλοήγησης πρέπει
να υιοθετήσουµε τους εξής όρους:
• ανοικτές καταστάσεις, δηλαδή αυτές που προς το παρόν δεν έχουν διερευνηθεί ή
χρειάζονται περαιτέρω διερεύνηση
• κλειστές καταστάσεις, δηλαδή αυτές που επί του παρόντος έχουν διερευνηθεί
18
• προκάτοχος s΄ µιας κατάστασης s είναι η κατάσταση που οδηγεί στην s µέσω µιας
µοναδικής ενέργειας ενώ ισχύει πως η διαδροµή από την αρχική κατάσταση προς
την s, µέσω της s΄ είναι προς το παρόν η καλύτερη
• διάδοχοι της κατάστασης s είναι καταστάσεις για τις οποίες η s είναι προκάτοχος
• αδιέξοδο που είναι µια µη-τελική κατάσταση η οποία δεν έχει διαδόχους ή όλες οι
διάδοχοί της οδηγούν σε αδιέξοδο
Ως παραδείγµατα µηχανισµών πλοήγησης παρουσιάζονται στη συνέχεια η αναζήτηση σε
βάθος και η αναζήτηση σε πλάτος (που είναι τυφλές, συστηµατικές µέθοδοι) και η
µέθοδος Α* που υιοθετεί ευρετικά.
2.3 Αναζήτηση σε βάθος (depth-first search)
Αυτή η µέθοδος πλοήγησης στο χώρο αναζήτησης είναι µια γενική, τυφλή µέθοδος η
οποία εισχωρεί γρήγορα σε βάθος του χώρου αναζήτησης, θεωρώντας ότι όσο προχωρά
σε βάθος τόσο εγγύτερα βρίσκεται στην τελική κατάσταση. Η µέθοδος δεν έχει
υπερβολικές απαιτήσεις σε µνήµη και µπορεί να λειτουργήσει αποδοτικά. Μπορεί όµως
να χαθεί στο χώρο αναζήτησης ή να οδηγήσει σε αδιέξοδο χωρίς απαραιτήτως να µπορεί
να φτάσει στη βέλτιστη λύση. Σε επίρρωση αυτών των αδυναµιών µπορεί να υιοθετηθεί
ένα άνω φράγµα στο µήκος διαδροµής (δηλαδή στο βάθος) που διανύει η µέθοδος το
οποίο να τερµατίζει την περαιτέρω διερεύνηση στο σηµείο αυτό και να ξεκινά τη
διερεύνηση από την επόµενη ανοικτή κατάσταση. Για την αποφυγή του εγκλωβισµού σε
αδιέξοδο µπορεί να υιοθετηθεί η ενέργεια της οπισθοδρόµησης (backtracking), της
επιστροφής δηλαδή πίσω κατά ένα βήµα και της συνέχισης από νέα ανοικτή κατάσταση.
2.4 Αναζήτηση σε πλάτος (breadth-first search)
Σε αντίθεση µε την προηγούµενη µέθοδο αναζήτησης, η αναζήτηση σε πλάτος διερευνά
πρώτα όλες τις καταστάσεις µήκους Ν, (δηλαδή απέχουν Ν βήµατα από την αρχική
κατάσταση) πριν ξεκινήσει τη διερεύνηση καταστάσεων µήκους Ν+1. Εύκολα µπορεί να
αποδειχθεί ότι η µέθοδος οδηγεί σε βέλτιστη λύση, δηλαδή σε λύση όσο το δυνατόν
εγγύτερα στην αρχική κατάσταση. Έχει όµως υψηλότερες απαιτήσεις σε µνήµη και
χρόνο διερεύνησης, µεγέθη τα οποία αυξάνονται εκθετικά. Πράγµατι, για την εξέταση
19
καταστάσεων σε απόσταση β από την αρχική η πολυπλοκότητα της αναζήτησης (σε
µνήµη, αλλά και χρόνο επεξεργασίας) είναι τάξης Ο(δβ), όπου δ ο συντελεστής
διακλάδωσης, δηλαδή ο µέσος αριθµός των διαδόχων µιας κατάστασης.
2.5 Ευρετική Αναζήτηση και ο Αλγόριθµος Α*
Οι δυο µέθοδοι πλοήγησης που αναφέρθηκαν στις παραγράφους 2.3 και 2.4 αποτελούν
συστηµατικές, τυφλές τεχνικές. Η υιοθέτηση ευρετικών σα σκοπό έχει τη µείωση των
υπό εξέταση καταστάσεων στο χώρο αναζήτησης, δηλαδή την αποφυγή επίσκεψης
συγκεκριµένων τµηµάτων του χώρου αναζήτησης µε στόχο την ταχύτερη εξεύρεση
λύσης. Σε κάθε βήµα αναζήτησης, οι ανοικτές καταστάσεις αξιολογούνται και η
διερεύνηση συνεχίζεται προς την περισσότερο «υποσχόµενη» διάδοχο κατάσταση. Η
συνάρτηση αξιολόγησης f µιας κατάστασης si ορίζεται ως:
f(si) = g(si) + h(si)
όπου η συνάρτηση g είναι το πραγµατικό (και γνωστό) κόστος µετάβασης από την
αρχική κατάσταση s0 στην κατάσταση si , ενώ η συνάρτηση h είναι µια εκτίµηση του
(άγνωστου) κόστους µετάβασης από την si στην τελική κατάσταση sg. Η επιλογή της
ευρετικής συνάρτησης πρέπει να γίνεται πολύ προσεκτικά. Τυχόν επιλογή της h που
υπερεκτιµά το κόστος µετάβασης µπορεί να οδηγήσει σε απόρριψη της κατάστασης si ,
ενώ αντίθετα, υποεκτίµηση του κόστους µπορεί να οδηγήσει σε άκαρπη διερεύνηση. Η
ευρετική συνάρτηση είναι ένας τρόπος ενσωµάτωσης γνώσης (π.χ προϋπάρχουσα
εµπειρία) σε κάποια µορφή. Ο βασικός ρόλος της γνώσης στη διαδικασία της πλοήγησης
έχει τονισθεί στο 1ο Κεφάλαιο.
Ο αλγόριθµος Α* υιοθετεί ακριβώς αυτή τη συνάρτηση αξιολόγησης και όπως
αποδεικνύεται σε περίπτωση που η τιµή της h είναι µικρότερη ή το πολύ ίση µε το
πραγµατικό κόστος µετάβασης στην τελική κατάσταση, τότε βρίσκει πάντα τη βέλτιστη
λύση. Ένας τέτοιος ευρετικός µηχανισµός ονοµάζεται αποδεκτός (admissible) καθώς
ικανοποιεί το κριτήριο αποδοχής (admissibility criterion).
20
2.6 Προβλήµατα ταξινόµησης και σύνθεσης
Ως τελευταίο ζήτηµα, εξετάζεται η διαφορά των προβληµάτων ταξινόµησης
(classification problems) από αυτά της σύνθεσης (constructive problems). Η βασική
διαφορά αυτών των δυο κατηγοριών προβληµάτων είναι ότι στα προβλήµατα
ταξινόµησης η λύση επιλέγεται από ένα προκαθορισµένο σύνολο λύσεων ή κατηγοριών
µε την αναγνώριση του υπό εξέταση προβλήµατος ως περιστατικού (instance) της
συγκεκριµένης κατηγορίας (class). Έτσι, η διαδροµή προς τη λύση δεν έχει ιδιαίτερη
σηµασία. Αντίθετα η λύση ενός προβλήµατος σύνθεσης, ουσιαστικά κατασκευάζεται από
απλούστερα στοιχεία. Σε αυτή την περίπτωση, η διαδροµή προς τη λύση έχει ουσιαστική
σηµασία γιατί αποτελεί η ίδια τη λύση του προβλήµατος.
Για την καλύτερη κατανόηση της λειτουργίας των διαφόρων µεθόδων αναζήτησης και
της χρήσης των ευρετικών δείτε την 18. Άσκηση 16: Το ροµπότ και τα κουτάκια, την 19.
Άσκηση 17: The 8-puzzle, την 20. Άσκηση 18: Τρίλιζα, την 21. Άσκηση 21: Βασίλισσες
στη σκακιέρα και την 22. Άσκηση 22: Από πόλη σε πόλη µε τον Α*.
21
3. Σύνοψη 3ου Κεφαλαίου
Απ’ όσα έχουµε δει στο 1ο Κεφάλαιο, όπου επιχειρήθηκε να δοθεί ένας ορισµός της ΤΝ
ως πεδίου της Επιστήµης Υπολογιστών, είναι φανερό ότι η γνώση, η αναπαράσταση
γνώσης και η Τεχνολογία Γνώσης διαδραµατίζουν καθοριστικό ρόλο στα συστήµατα ΤΝ.
Το 3ο Κεφάλαιο αποτελεί µια θεωρητική εισαγωγή στα ζητήµατα της γνώσης και της
αναπαράστασή της, έτσι ώστε να δηµιουργηθεί το απαραίτητο υπόβαθρο για να
προχωρήσουµε στα επόµενα Κεφάλαια στους βασικούς τρόπους φορµαλισµού της
αναπαράστασης γνώσης. Έτσι, στο 3ο Κεφάλαιο αναπτύσσονται οι έννοιες των
δεδοµένων, της πληροφορίας και της γνώσης µε στόχο τη διάκριση µεταξύ τους και την
κατανόηση του τρόπου µε τον οποίο δοµείται η γνώση από τα δεδοµένα και τις
πληροφορίες. Στη συνέχεια αναπτύσσονται τα διάφορα είδη γνώσης που συνήθως
αποτελούν όψεις της γνώσης που της εµπειρογνωµοσύνης που κατέχει κάποιο άτοµο. Τα
διάφορα είδη γνώσης συγκροτούν µια πυραµιδοειδή διάταξη που οδηγεί στην
εµπειρογνωµοσύνη. Μετά από αυτά εξετάζονται η αναπαράσταση γνώσης και οι
διάφορες πρακτικές και θεωρητικές ιδιότητές της. Τέλος παρουσιάζεται η ιστορική
αντιπαράθεση µεταξύ της περιγραφικής και της διαδικαστικής αναπαράσταση γνώσης.
3.1 ∆εδοµένα, Πληροφορία και Γνώση
Απαιτείται να γίνει ένας διαχωρισµός των τριών αυτών εννοιών. Ως δεδοµένο (data)
µπορούµε να ορίσουµε τη µετρήσιµη ή υπολογίσιµη τιµή µιας ιδιότητας. Τα δεδοµένα
δηλαδή αφορούν συγκεκριµένες καταστάσεις ή οντότητες και µπορούν να
συγκεντρωθούν στις αποκαλούµενες βάσεις δεδοµένων (databases). Τα δεδοµένα από
µόνα τους δεν αποτελούν πληροφορία. Χρειάζεται κάποιο πλαίσιο αναφοράς γι’ αυτό. Η
πληροφορία (information) δεν αποθηκεύεται απ’ ευθείας στη βάση δεδοµένων, αλλά
παράγεται (εξάγεται) από ένα σύνολο δεδοµένων και αποτελεί ένα τρόπο συµπερίληψης
των δεδοµένων αυτών. Είναι φανερό ότι ενώ τα δεδοµένα είναι στατικά, συγκεκριµένα
και µονοσήµαντα, οι πληροφορίες είναι δυναµικές και συγκεκριµένες. Κινούνται δε, σε
υψηλότερο βαθµό αφαίρεσης και γενικότητας από τα δεδοµένα τα οποία συνοψίζουν. Το
συγκεκριµένο σύνολο δεδοµένων από το οποίο εξάγεται η πληροφορία αποτελεί την
εµβέλεια της αλήθειας της (truth scope). Σε ακόµα υψηλότερο επίπεδο αφαίρεσης και
γενίκευσης από την πληροφορία, βρίσκεται η γνώση (knowledge). Σε αντίθεση µε την
22
πληροφορία που η εµβέλεια αλήθειας της είναι τοπική (local), η εµβέλεια αλήθειας της
γνώσης πρέπει να είναι καθολική (universal), καλύπτοντας όλα τα σχετικά περιστατικά.
Η γνώση είναι δυναµική στο βαθµό που είναι εµπειρική και προσαρµόζεται για να έλθει
εγγύτερα µε την πραγµατική αλήθεια. Θεωρητικά, η πραγµατική γνώση εκτός από
καθολική είναι και διαχρονική. Κατά κανόνα, µια βάση δεδοµένων είναι πολύ
µεγαλύτερη από µια βάση γνώσης (knowledge base) µια και η δεύτερη κινείται σε
υψηλότερο επίπεδο αφαίρεσης από την πρώτη. Ο κλάδος της εξόρυξης δεδοµένων (data
mining) αφορά στην επεξεργασία µεγάλων βάσεων δεδοµένων µε σκοπό τον εντοπισµό
προτύπων και την εξαγωγή γνώσης από αυτά.
3.2 Είδη γνώσης
Είναι λογικό να υπάρχουν περισσότερα του ενός είδη γνώσης, όπως αυτά που διαθέτει
ένας άνθρωπος. Μπορούµε να διακρίνουµε τα διάφορα είδη γνώσης σε γενικές και
εξειδικευµένες γνώσεις. Στις γενικές γνώσεις µπορούµε να συµπεριλάβουµε τα εξής είδη
γνώσης:
• Αυτονόητη γνώση (commonsense knowledge): ίσως είναι αυτό που αποκαλούµε
«εγκυκλοπαιδικές γνώσεις», δηλαδή στοιχεία που αφορούν τη φύση, τη
λειτουργία και τη συµπεριφορά του κόσµου, αλλά και του ανθρώπου, τις
ιδιότητες του χώρου και του χρόνου. Η αυτοµατοποίηση της γνώσης αυτής, όπως
και του αυτονόητου συλλογισµού είναι υπόθεση ιδιαίτερα δύσκολη λόγω του
µεγάλου εύρους της.
• Γνώση υποδοµής (background knowledge): είναι η βασική, θεµελιώδης γνώση
που σχετίζεται µε το συγκεκριµένο γνωστικό ή επαγγελµατικό πεδίο κάποιου.
• Γνώση άλλων τοµέων: είναι ουσιαστικά συµπλήρωµα του προηγούµενου µια και
δεν σχετίζεται άµεσα µε τη γνώση υποδοµής, αλλά αφορά άλλους συγγενικούς ή
συναφείς τοµείς. Η γνώση αυτή µας επιτρέπει να αναγνωρίζουµε σε ένα
πρόβληµα κατά πόσο ανήκει σε ένα πεδίο ή σε κάποιο άλλο συναφές πεδίο.
• Γνώση αιτίου – αποτελέσµατος: αφορά άµεσα όλα τα πεδία που η αλλαγή και ο
συλλογισµός αναφορικά µε αλλαγή και η αιτιολογική σχέση (clausal relation) έχει
σηµασία.
23
Στις εξειδικευµένες γνώσεις µπορούµε να συµπεριλάβουµε τα εξής είδη γνώσεων:
• Θεωρητική γνώµη: αποτελείται από δοµικά και σχεσιακά µοντέλα, βασικές αρχές,
µαθηµατικές σχέσεις, όπως επίσης ταξινοµίες και µερονοµίες εννοιών. Η γνώση
αυτή είναι η βαθιά γνώση, δηλαδή η γνώση των πρωτευόντων αρχών (first
principles).
• Γνώση από πηγές αναφοράς: προέρχεται από υλικό αναφοράς (έγγραφα,
επιστηµονικές δηµοσιεύσεις) και άλλα έµπειρα άτοµα.
• Πρακτική ή λειτουργήσιµη (operational) γνώση: αφορά γνώση σε πρακτικά
θέµατα αναφορικά µε την επίλυση προβληµάτων. ∆ιαδικασιακή γνώση επίλυσης
προβληµάτων µε συγκεκριµένη µεθοδολογία, διάφορα ευρετικά, µεταγλωττισµένη
(compiled) ή συµπιεσµένη (compressed) γνώση της µορφής «Αν Α, τότε Β» είναι
αυτής της µορφής γνώση.
• Γνώση περιστατικών: αν και είναι σαφής η διάκριση µεταξύ δεδοµένων,
πληροφορίας και γνώσης (βλ. § 3.1) είναι σαφές ότι η ύπαρξη εκτενούς και
πλατειάς εµπειρίας πραγµατικών περιστατικών του προβλήµατος βοηθά στην
εµπειρογνωµοσύνη.
• Μετά-γνώση (meta-knowledge): ουσιαστικά πρόκειται για αναπαράσταση της
γνώσης των γνώσεων που έχει κάποιος και έχει δυο όψεις, την στρατηγική όψη
(strategic view) και την στοχαστική όψη (reflective view). Η στρατηγική όψη
ενσωµατώνει στρατηγικές για την αποδοτικότερη και αποτελεσµατικότερη
εφαρµογή των γνώσεων. Η στοχαστική όψη είναι η γνώση του τι γνωρίζω και
κατά συνέπεια του τι δεν γνωρίζω, είναι δηλαδή η επίγνωση των ορίων της
γνώσης µου και των ικανοτήτων µου στην επίλυση προβληµάτων.
Τα περιεχόµενα των παραπάνω ειδών γνώσης πολύ απέχουν από το να θεωρηθούν
αµετάβλητα και στατικά. Αντιθέτως µεταβάλλονται δυναµικά και τα διάφορα είδη
αλληλεπιδρούν µεταξύ τους. Μπορούν δε σχηµατικά, να αναπαρασταθούν ως να
συγκροτούν ένα είδος πυραµίδας, µε τα είδη των γενικών γνώσεων να στηρίζουν τα είδη
εξειδικευµένων γνώσεων µε κορωνίδα τη µετά-γνώση.
3.3 Μέθοδοι αναπαράστασης γνώσης
24
Όπως θα έχουµε την ευκαιρία να αναπτύξουµε σε επόµενα Κεφάλαια, υπάρχουν πολλοί
τρόποι αναπαράστασης γνώσης, µεταξύ των οποίων είναι οι βασιζόµενοι στη Λογική,
στις ∆οµηµένες Αναπαραστάσεις και σε Κανόνες, ως εξής:
Λογική
• Προτασιακή Λογική (propositional logic)
• Κατηγορηµατική Λογική (predicate logic)
• ∆ιαζευκτική µορφή της Λογικής (clausal form of logic)
∆οµηµένες αναπαραστάσεις
• Σηµασιολογικά ∆ίκτυα (semantic networks)
• Πλαίσια (frames)
• Εννοιολογική εξάρτηση (conceptual dependency)
• Σενάρια (scripts)
Κανόνες (if-then-else rules)
3.4 Ιδιότητες της αναπαράστασης γνώσης
Υπάρχουν διάφορες ιδιότητες που είναι επιθυµητές να υπάρχουν σε µια αναπαράσταση
γνώσης και που η ύπαρξή τους µας επιτρέπει να αξιολογήσουµε µια αναπαράσταση
γνώσης. Οι ιδιότητες αυτές διακρίνονται σε πρακτικές και θεωρητικές.
Στις πρακτικές ιδιότητες µια αναπαράστασης µπορούµε να συµπεριλάβουµε τις εξής:
• Λογική επάρκεια (representational adequacy): η δυνατότητα να εκφράσουµε όλα
τα είδη γνώσης που αναφέρθηκαν στην § 3.2 και να µπορούµε να κάνουµε
σηµασιολογικούς διαχωρισµούς.
• ∆ιευκόλυνση συµβολισµού ή αποδοτικότητα απόκτησης (acquisitional efficiency):
εξαρτάται από πόσο κοντά βρίσκεται το επίπεδο αναπαράστασης στο επίπεδο
γνώσης γεγονός που σχετίζεται µε την απόκτηση νέας γνώσης εύκολα και
γρήγορα.
25
• Ευρετική επάρκεια: σχετίζεται µε τη δυνατότητα να εξάγονται συµπερασµατικά
πορίσµατα µε αποδοτικό και αποτελεσµατικό τρόπο από την ανάκληση
υπάρχουσας γνώσης ενός προβλήµατος.
Στις θεωρητικές ιδιότητες µια αναπαράστασης µπορούµε να συµπεριλάβουµε τις εξής:
• Εγκυρότητα (soundness): που δηλώνει ότι τα εξαγόµενα συµπεράσµατα είναι
έγκυρα, δηλαδή δεν µπορούν ταυτόχρονα να εξαχθούν δυο αντικρουόµενα
συµπεράσµατα (για παράδειγµα η πρόταση p και η πρόταση ~p που αποτελεί την
άρνηση της p).
• Πληρότητα (completeness): η ικανότητα του µηχανισµού εξαγωγής
συµπερασµάτων να αποδείξει ότι αν µια πρόταση είναι αληθής, τότε αυτό ισχύει,
χωρίς τη χρήση εξωγενών υποθέσεων / µηχανισµών.
• Αποφασισιµότητα (decidability): η ικανότητα του µηχανισµού εξαγωγής
συµπερασµάτων να απαντήσει θετικά ή αρνητικά σε οποιαδήποτε ερώτηµα
επαλήθευσης.
Οι ιδιότητες της εγκυρότητας και της πληρότητας είναι εκ των ουκ άνευ για την εγγύηση
της ορθότητας του συλλογισµού. Φυσικά, θεµελιώδης προϋπόθεση είναι η βάση γνώσης,
η οποία αντιπροσωπεύει ένα «µικρόκοσµο» είναι συνεπής και δεν περιέχει αντιλογίες.
3.5 Περιγραφική v’s διαδικασιακή αναπαράσταση
Στο αρχικό στάδιο ανάπτυξης του πεδίου της αναπαράστασης γνώσης έλαβε χώρα µια
ιδιότυπη αντιπαράθεση ανάµεσα σε δυο διαφορετικές προσεγγίσεις: την περιγραφική
(declarative) και την διαδικασιακή (procedural) µορφή αναπαράστασης γνώσης.
Σε σχέση µε την πρώτη µορφή, δίνεται ιδιαίτερη έµφαση στην στατική (κάθε φορά) όψη
της γνώσης και το περιγραφικό σώµα διερµηνεύεται µε βάση κάποιους γενικούς κανόνες
συλλογισµού για την εξαγωγή συµπερασµατικών πορισµάτων. Για παράδειγµα, η
γλώσσα προγραµµατισµού PROLOG µια από τις πιο δηµοφιλής στο χώρο της ΤΝ, είναι
µια περιγραφική γλώσσα αναπαράστασης γνώσης µια και βασίζεται σε ένα υποσύνολο
της κατηγορηµατικής λογικής η οποία αποτελεί µια καθαρά περιγραφική αναπαράσταση
26
µε γενικούς κανόνες συλλογισµού. Σηµαντικά πλεονεκτήµατα της περιγραφικής
αναπαράστασης είναι τα εξής:
• αποθήκευση ενός τµήµατος γνώσης µια φορά, χρήση του πολλές φορές
• απουσία πλεονασµού που διευκολύνει την ενηµέρωση της βάσης γνώσης
• υψηλή διαφάνεια στο τι αναπαριστά, πράγµα που διευκολύνει τον συµβολισµό
Από την άλλη πλευρά, η καθαρά διαδικασιακή αναπαράσταση παρουσίαζε το
πλεονέκτηµα της παρουσίασης της δυναµικής όψης της γνώσης και σύµφωνα µε τους
υποστηρικτές της σε αυτό το χαρακτηριστικό υπερτερεί από την περιγραφική
αναπαράσταση, καθώς η γνωστική συµπεριφορά αναπαρίσταται καλύτερα σε µορφή
διαδικασιών που διατυπώνουν πως χρησιµοποιείται η γνώση κι όχι ποια είναι η γνώση.
Βασικά µειονεκτήµατα της διαδικασιακής αναπαράστασης είναι τα αντίθετα των
πλεονεκτηµάτων της περιγραφικής αναπαράστασης, δηλαδή η πολλαπλή αποθήκευση
γνώση σε κάθε διαδικασία, ο πλεονασµός και η έλλειψη διαφάνειας. Υπάρχουν όµως και
πλεονεκτήµατα όπως:
• είναι ευκολότερο να εκφραστεί το πώς να κάνεις κάτι παρά τι γνωρίζεις γι’ αυτό
σε αφηρηµένο επίπεδο
• υπάρχει άµεση σχέση ανάµεσα στη γνώση και την συγκεκριµένη εργασία, ενώ
στην περιγραφική αναπαράσταση µπορεί εκ των υστέρων να φανεί πως ένα
µεγάλο τµήµα της δεν χρειαζόταν
• µπορεί να υιοθετήσει ευρετικά, δηλαδή εύλογες υποθέσεις µε πιθανότητα όλα να
µπορούν να εκφραστούν ευκολότερα µέσω διαδικασιών
• η υλοποίηση µε χρήση µεταγλώττισης παρά διερµήνευσης οδηγεί σε ταχύτερη
επεξεργασία
Ιστορικά, είναι η περιγραφική αναπαράσταση αυτή που έχει επικρατήσει, κυρίως για
λόγους διαφάνειας. Αναµφίβολα καλύτερος τρόπος αναπαράστασης της στατικής γνώσης
είναι ο περιγραφικός, αλλά η γνώση ελέγχου µπορεί να εκφραστεί είτε µε περιγραφικό,
είτε µε διαδικασιακό τρόπο, οπότε κάποιες φορές µπορεί κάλλιστα να υπάρξει
συνδυασµός των δυο µορφών αναπαράστασης.
27
4. Σύνοψη 4ου Κεφαλαίου
Είδαµε στο προηγούµενο Κεφάλαιο (§ 3.3) ότι υπάρχουν διάφοροι τρόποι
αναπαράστασης γνώσης µεταξύ αυτών και η Κατηγορηµατική Λογική που είναι το
αντικείµενο του 4ου Κεφαλαίου. Πιο συγκεκριµένα παρουσιάζεται ο φορµαλισµός της
µεθόδου αυτής, οι κανονικές µορφές προτάσεων, οι ισοδυναµίες και οι τρόποι
συλλογισµού. Ειδικότερα δε, παρουσιάζεται το σχήµα συµπερασµατικού συλλογισµού,
γνωστού ως αναγωγή µέσω της αντίκρουσης της αντίφασης. Τέλος γίνεται αναφορά στα
Horn Clauses, µια ειδική υποκατηγορία της Clausal Form και τη σχέση τους µε το λογικό
προγραµµατισµό και γλώσσες προγραµµατισµού όπως η PROLOG.
4.1 Σύνταξη και ορολογία
Η Κατηγορηµατική Λογική είναι µια τυπική γλώσσα, όπου η εγκυρότητα των
συλλογισµών βασίζεται στη µορφή τους κι όχι στο περιεχόµενό τους. Το λεξιλόγιό της
περιλαµβάνει σταθερές (constants), που συµβολίζονται µε κεφαλαία γράµµατα (π.χ. Α,
Β), µεταβλητές (variables) που συµβολίζονται µε µικρά γράµµατα (π.χ. x, y) και
συναρτήσεις (functions). Επεκτείνει την Προτασιακή Λογική µε την εισαγωγή όρων
(terms) που µπορεί να είναι µια σταθερή, ή µια µεταβλητή, ή µια συνάρτηση µε τα
ορίσµατά της, κατηγορηµάτων (predicates) των οποίων τα ονόµατα δίνονται µε κεφαλαία
γράµµατα και ποσοδεικτών (quantifiers) όπως οι ,∃ ∀ . Ένα γεγονός αναπαρίσταται από
ένα ατοµικό τύπο (atomic formula) της µορφής:
P( A1, A2, … , An)
Για κάθε πρόταση P µπορούµε να έχουµε την άρνησή της ~P. Η συντακτική κατηγορία
των κυριολεκτικών (literals) αποτελείται από ατοµικές προτάσεις και τις αρνήσεις τους.
Τέλος, έχουµε τη συντακτική κατηγορία των καλώς σχηµατιζόµενων προτάσεων (well
defined formulae – wff) ο ορισµός της οποίας χρησιµοποιεί αναδροµικότητα και εµπλέκει
λογικά συνθετικά (π.χ. ^ για τη σύζευξη, ~ ή ¬ για την άρνηση, ⇒ή ⊃ για τη
συνεπαγωγή, κλπ.). Ισχύει ότι:
• κάθε ατοµική πρόταση είναι wff
28
• αν είναι Α µια wff, τότε ~Α, x∀ Α και x∃ Α, είναι wff
• αν Α και Β είναι wff, τότε Α ^ Β, Α v B και Α ⇒ Β είναι επίσης wff
Οι σταθερές αντιπροσωπεύουν αντικείµενα ή οντότητες. Οι µεταβλητές
αντιπροσωπεύουν πεδία σταθερών. Οι συναρτήσεις αντιπροσωπεύουν αντιστοιχίες
ανάµεσα σε πεδία σταθερών.
Κατηγορήµατα χωρίς ορίσµατα (0-place predicates) είναι απλές λογικές προτάσεις που
µπορεί να είναι είτε αληθείς, είτε ψευδείς. Κατηγορήµατα µε τουλάχιστον ένα όρισµα
αντιπροσωπεύουν σχέσεις.
Η πρόταση: κάθε άνθρωπος είναι θνητός µπορεί να διατυπωθεί:
x∀ ΑΝΘΡΩΠΟΣ(x) ⇒ΘΝΗΤΟΣ(x)
Η πρόταση: η ντοµάτα είναι κόκκινη, µπορεί να διατυπωθεί µε διαφόρους τρόπους:
ΚΟΚΚΙΝΟ(ΝΤΟΜΑΤΑ_1)
ΧΡΩΜΑ(ΝΤΟΜΑΤΑ_1, ΚΟΚΚΙΝΟ)
ΤΙΜΗ(ΧΡΩΜΑ, ΝΤΟΜΑΤΑ_1, ΚΟΚΚΙΝΟ)
όπου η ΝΤΟΜΑΤΑ_1, αναφέρεται στη συγκεκριµένη ντοµάτα.
4.2 Κανονικές µορφές προτάσεων
Η χρήση των λογικών συνθετικών επιτρέπει τη έκφραση υψηλής πολυπλοκότητας
προτάσεων. Ωστόσο είναι προτιµότερη η απλότητα στην έκφραση, η οποία µπορεί να
οδηγήσει σε απλότητα του συλλογισµού µε ενδεχόµενο την αποτελεσµατική
αυτοµατοποίηση. Παρουσιάζονται τρεις απλοποιήσεις έκφρασης ή τρεις κανονικές
µορφές (normal forms) της κατηγορηµατικής λογικής:
• Συζευκτική Κανονική Μορφή (ΣΚΜ) – Conjunctive Normal Form (CNF)
• ∆ιαζευκτική Κανονική Μορφή (∆ΚΜ) – Disjunctive Normal Form (CNF)
• Clausal Form που είναι κατ’ ουσία ΣΚΜ
29
Το σηµαντικό είναι πως οποιαδήποτε wwf µπορεί να µετασχηµατιστεί σε οποιαδήποτε
από τις παραπάνω τρεις κανονικές µορφές. Και στις τρεις περιπτώσεις η απλοποίηση
έκφρασης επιτρέπει την εφαρµογή ενός συµπερασµατικού κανόνα (resolution).
Μια πρόταση σε ΣΚΜ είναι η σύζευξη ατοµικών διαζεύξεων, δηλαδή της µορφής:
1 2 ... nA A A∧ ∧ ∧
µε κάθε A να είναι της µορφής:
1 2 ... mB B B∨ ∨ ∨
και κάθε Β είναι κυριολεκτικό (literal) δηλαδή είτε ατοµική πρόταση είτε η άρνηση
ατοµικής πρότασης.
Αντίστροφα µε το προηγούµενο, µια ∆ΚΜ είναι µια διάζευξη ατοµικών συζεύξεων,
δηλαδή της µορφής:
1 2 ... nA A A∨ ∨ ∨
µε κάθε A να είναι της µορφής:
1 2 ... mB B B∧ ∧ ∧
και κάθε Β είναι κυριολεκτικό.
Τέλος η clausal form αποτελείται από ένα σύνολο προτάσεων (clause), όπου η κάθε
πρόταση είναι της µορφής:
1 2 1 2... ...n mA A A B B B∨ ∨ ∨ ⇐ ∧ ∧ ∧
30
όπου 0n ≥ και 0m ≥ και κάθε φορά τα Α και Β είναι ατοµικές προτάσεις. Τα γεγονότα Β
αποτελούν υποθέσεις και τα γεγονότα Α είναι τα συµπεράσµατα. Όπως επισηµάνθηκε
νωρίτερα, η clausal form είναι ένας απευθείας µετασχηµατισµός της ΣΚΜ µε χρήση της
ισοδυναµίας:
A B A B⇒ ≡ ∨∼
µε στόχο την απάλειψη της άρνησης.
4.3 Ισοδυναµίες και κανόνες συλλογισµού
∆υο wff είναι ισοδύναµες, αν για οποιαδήποτε ερµηνεία έχουν την ίδια τιµή αλήθειας.
Μια πρώτη ισοδυναµία παρουσιάστηκε στο τέλος της αµέσως προηγούµενης