Kā notiek sentenciālo formu iegūšana, ja izmanto atvasināšanu no labās puses
Jan 22, 2016
Kā notiek sentenciālo formu iegūšana,ja izmanto atvasināšanu no labās puses
ABS .1
A
aaAA
.3
.2
B
BbB
.5
.4
aabaaAbAbABbABS32541
VirkneAtvasinājums, sākot no labās puses :
aab
aabaaAbAbABbABS32541
Gribētos šo ceļu veikt pretējā virzienā:
aabaaAbAbABbABS32541
ABS .1
A
aaAA
.3
.2
B
BbB
.5
.4
aabaaAbAbABbABS32541
Kā uzminēt, kurā brīdī kuru produkciju lietot?Varianti var būt vairāki:
aabaaAb3
aabAaab3
aabaAab3
aabaBab
5
aabaabA3
aabBaab5
aabaaBb5
aabaabB5
ABS .1
A
aaAA
.3
.2
B
BbB
.5
.4
“Pārbīdīt/savērst” veida analizētāji
Iespējamās darbības:
• pārbīdīt (shift) simbolu no ievada uz steku
• vienkāršot, savērst (reduce) izmantojot noteiktu produkciju
• akceptēt ievadu (accept) brīdī, kad skaidrs, ka tas atbilst gramatikai
• paziņot par kļūdu (error)brīdī, kad skaidrs, ka ievads neatbilst
gramatikai
Steks Ievads Izpildāmā darbība
$ aab$ shift
$a ab$ shift
$aa b$ reduce 3
$aaA b$ reduce 2
$A b$ reduce 5
$AB b$ shift
$ABb $ reduce 4
$AB $ reduce 1
$S $ accept
Augšupejošā analīze (BOTTOM-UP parsing)
• Sāk ar doto termināļu virkni
• Cenšas atrast produkcijas labai pusei atbilstošu daļu un aizvietot ar produkcijas kreiso pusi
• Ja izdodas reducēt līdz starta simbolam, tad virkne atbilst dotajai gramatikai
LR(k) analīzes algoritmi
Efektīva augšupejošās analīzes algoritmu klase
L – ievada virkni lasa no kreisās puses uz labo
R – būvē atvasinājumus no labās puses pretējā secībā
k – ievada simbolu skaits, kāds nepieciešams, lai noteiktu analizētāja nākošo darbību
LR(k) analīze
Ja pietiek tikai ar steka saturu, tad LR(0)
Ja vajag vienu ievada simbolu, tad LR(1). Ja k nav norādīts, tad uzskata, ka k=1.
Ja vajag zināt vairāk kā vienu simbolu uz priekšu, tad LR(k) k>1
“Reālās” gramatikas parasti ir LR(1)
LR analizētāju pievilcība
LR analizētājus var izveidot praktiski visu programmēšanas valodu, kurām iespējams uzrakstīt bezkonteksta gramatiku, analīzei.
LR analīzes metode ir pazīstamākā no “pārnese-savēršana” tipa metodēm, pie kam efektivitātē neatpaliek no citām šī tipa metodēm.
LR analizētāji var atpazīt sintakses kļūdas uzreiz kā tas kļūst iespējams ievada skenēšanas laikā.
LR analizētāju ēnas puse
Nopietnām gramatikām LR analizētājus grūti izveidot “ar roku” – nepieciešami speciāli programmēšanas līdzekļi.
LR analizētāju varianti
SLR – Simple LR
LALR – Look ahead LR
kanoniskā LR Sti
prā
ka
Piemērs
cP
bPbP
aPaP
Gramatika valodai, kas satur palindromus:
Piemērs
cP
bPbP
aPaP
PS
$
Nepatīk, ka starta simbols var būt labajā pusē – pievieno jaunu starta simbolu
Mēģināsim uzminēt, kā izskatās virknes abcba analīzes process.
Steks Ievads Darbība
$ abcba$ shift
$a bcba$ shift
$ab cba$ shift
$abc ba$ reduce
$abP ba$ shift
$abPb a$ reduce
$aP a$ shift
$aPa $ reduce
$P $ reduce
$S $ accept
abcba abPba aPa P S
cP
bPbP
aPaP
PS
$
LR(0) analizētāji
Konstruē GDA, kas satur visus analizētāja stāvokļus un pārejas, atkarībā no termināļiem (action tabula) vai netermināļiem (goto tabula).
Steku izmanto šī GDA darbības simulācijā.
LR(0) analizētājiLR(0) analizētāja stāvoklis norāda, cik
daudz no dotās produkcijas ievada ir ieskenēts.
Stāvokļa raksts (item) ir kāda produkcija ar punktu tās labajā pusē.
Piemēram, no produkcijas PaPa iespējams iegūt sekojošus rakstus:P.aPa Pa.Pa PaP.a PaPa.
No produkcijas Pε iegūst tikai vienu rakstu P.
RakstiIntuitīvi punkts norāda, cik daudz no
attiecīgās produkcijas labās puses “esam redzējuši”.
Izšķirsim vairāku veidu rakstus:
• ar punktu kreisajā galā (initial items)P.aPa
• ar punktu labajā galā (complete items)PaPa.
Rakstu slēgumi (Closure)Pieņemsim, ka I ir rakstu kopa.
Tad:
• IClosure(I)
• ja raksts A.B pieder Closure(I) , un ir produkcija formā B, tad Closure(I)
jāpievieno raksts B. (ja tas tur vēl nebija) un šādas darbības jāatkārto tikmēr, kamēr neko papildināt vairs nevar.
Rakstu slēgumiIntuitīvi attēlo ekvivalentus stāvokļus –
visi veidi kā to varēja sasniegt.
Piemērs:
I = {S.P$}Closure(I) = {S.P$, P.aPa,
P.bPb, P.c}
Rakstu slēgumi veido būvējamā GDA stāvokļus.
Operācija GOTO
Ja si ir rakstu kopa un X ir kāds gramatikas simbols (terminālis vai neterminālis), tad
GOTO(si,X)=Closure(AX.|A.Xsi)
Stāvokļu veidošana• Sāk ar Closure({S’.S$})
(produkciju, kurā ir starta simbols)
• Ja no kāda stāvokļa si iespējams atrast tādu gramatikas simbolu X, ka GOTO(si,X) ir netukša, tad tas veido jaunu stāvokli (jāatceras, ka X var būt gan terminālis, gan neterminālis).
Piemērs
cP
bPbP
aPaP
PS
$
cP
bPbP
aPaP
PS
.
.
.
$.
1
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PbbP
.
.
.
.
4
b
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PbbP
.
.
.
.
4
.cP 5
c
cb
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PbbP
.
.
.
.
4
b.cP 5
c
c
aaPP . 6P
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PbbP
.
.
.
.
4
b.cP 5
c
c
aaPP . 6P
.aPaP 7
a
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PbbP
.
.
.
.
4
b.cP 5
c
c
aaPP . 6P
.aPaP 7
a
bbPP . 8
P
cP
bPbP
aPaP
PS
.
.
.
$.
1 .$PS 2
P
cP
bPbP
aPaP
PaaP
.
.
.
.
3
a
cP
bPbP
aPaP
PbbP
.
.
.
.
4
b.cP 5
c
c
aaPP . 6P
.aPaP 7
a
bbPP . 8
b
.bPbP 9P
Kā veidot analīzes tabulu?
action goto
a b c $ P
1 s3 s4 s5 g2
2 acc
3 s3 s4 s5 g6
4 s3 s4 s5 g8
5 r(4) r(4) r(4) r(4)
6 s7
7 r(2) r(2) r(2) r(2)
8 s9
9 r(3) r(3) r(3) r(3)
LR(0) analīzes tabula
cP
bPbP
aPaP
PS
)4(
)3(
)2(
$ )1(
Analīzes GDA konfigurāciju katrā brīdī nosaka
s0X1s1X2... Xmsm aiai+1...an$ steka saturs
(pārmaiņus - stāvokļi un gramatikas simboli)
ievada neapskatītā
daļa
Īstenībā tā pati labēji sentenciālā forma: X1X2... Xmaiai+1...an (tikai papildināta ar stāvokļiem)
Darbības ar analīzes tabulu1)Ja action[sm,ai] = “shift s”, tad no
konfigurācijas (s0X1s1X2... Xmsm , aiai+1...an$)pāriet konfigurācijā(s0X1s1X2... Xmsmais , ai+1...an$)
Darbības ar analīzes tabulu (turp.)2)Ja action[sm,ai] = “reduce Ab”, tad
konfigurācijai (s0X1s1X2... Xmsm , aiai+1...an$)veic vienkāršošanu un pāriet konfigurācijā(s0X1s1X2... Xm-rsm-rAs , aiai+1...an$),kur s = goto[sm-r,A] r ir b garums
Vispirms no steka izņem 2r simbolus, virsotnē nonāk sm-r, ieliek stekā A un ierakstu no goto[sm-r,A] . Ievada tekošais simbols nemainās.
Darbības ar analīzes tabulu (turp.)
3)Ja action[sm,ai] = “accept”, tad ievada virkne tiek atzīta par derīgu un analīze beidzas
4) Ja action[sm,ai] = “error”, tad ievada virkne netiek atzīta par derīgu un analīze beidzas (var iedarbināt speciālu kļūdu apstrādes mehānismu)
Steks Ievads Darbība
$1 abcba$ shift 3
$1a3 bcba$ shift 4
$1a3b4 cba$ shift 5
$1a3b4c5 ba$ reduce 4
$1a3b4P8 ba$ shift 9
$1a3b4P8b9 a$ reduce 3
$1a3P6 a$ shift 7
$1a3P6a7 $ reduce 2
$1P2 $ accept
Steks Ievads Darbība
$1 abca$ shift 3
$1a3 bca$ shift 4
$1a3b4 ca$ shift 5
$1a3b4c5 a$ reduce 4
$1a3b4P8 a$ error
Steks Ievads Darbība
$1 abba$ shift 3
$1a3 bba$ shift 4
$1a3b4 ba$ shift 4
$1a3b4b4 a$ shift 3
$1a3b4b4a3 $ error
Piemērs
bxBB
axAA
BAS
|
|
|
Piemērs(1) S’S$(2) SA(3) SB(4) AxA(5) Aa(6) BxB(7) Bb
S’.S$S.AS.BA.xAA.aB.xBB.b
S’S.$
SA.
Bb.
Ax.AA.xAA.aBx.BB.xBB.bAa.
SB.
BxB.
AxA.
S
B
A
A
B
x
a
b
x
a
b
Piemērs
A
aAA
AbS
SS
SS
)(
$'
Piemērs
A
aAA
AbS
SS
SS
)(
$'
}{)(
{),$})(
},{)(
},{(,)(
bAFOLLOW
SFOLLOW
aAFIRST
baSFIRST
LR(0) analīzes tabula
A (5)
aAA (4)
AbS (3)
(S)S (2)
S$S' (1)action goto
a b ( ) $ S A
1 s6r(5)
r(5) s3r(5)
r(5) r(5) g2 g4
2 acc
3 s6r(5)
r(5) s3r(5)
r(5) r(5) g8 g4
4 s5
5 r(3) r(3) r(3) r(3) r(3)
6 s6r(5)
r(5) r(5) r(5) r(5) g7
7 r(4) r(4) r(4) r(4) r(4)
8 s9
9 r(2) r(2) r(2) r(2) r(2)
Nav viennozīmības!
Konflikti
• “shift-reduce” konflikts
• “reduce-reduce” konflikts
Saka, ka gramatika ir LR(0) gramatika, ja tabula nesatur šādus konfliktus.