ROMNIA MINISTERUL APRRII NAIONALE Academia Tehnic Militarmr.
ing. ALEXEI Adrian-Mihai
REZUMAT TEZ DE DOCTORAT
TEMA: CONTRIBUII PRIVIND CULEGEREA
SEMIAUTOMAT A DATELOR CARTOGRAFICE DIGITALE CONDUCTOR TIINIFIC:
gl. bg. (r) prof. univ. dr. ing. NIU Constantin - BUCURETI 2005
Academia Tehnic Militar (ATM)CUPRINS
3
CUPRINSCUPRINS.................................................................................
.................................................3 1. INTRODUCERE
........................................................................
...........................................5 2. STADIUL ACTUAL
PRIVIND EVOLUIA
SIG................................................................62.1
Evoluia Sistemelor Informaionale
Geografice.......................................................................
6 2.2 Evoluia metodelor de culegere a datelor
cartografice............................................................
7
3. METODE DE CULEGERE A
DATELOR...........................................................................9
3.1 Tipuri de date cartografice
....................................................................................
.................... 9 3.2 Structuri de date n SIG
.................................................................................................
.......... 103.2.1 Structuri de date de nivel
inferior........................................................................................................
10 3.2.2 Structuri de date de nivel nalt
............................................................................................................
11
3.3 Surse de
date................................................................................................
............................. 12
3.4 Evaluarea preciziei metodelor de digitizare
...........................................................................
13
4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTERVECTOR
.................15
4.1 Algoritmi de
vectorizare......................................................................................
..................... 154.1.1 Algoritmi de vectorizare ntr-un
singur pas
........................................................................................
15 4.1.2 Algoritmi de vectorizare n doi
pai....................................................................................................
16
4.2 Prelucrri post vectorizare
.....................................................................................
............... 16 4.3 Algoritm propus pentru vectorizare
.....................................................................................
.. 164.3.1 Vectorizarea elementelor liniare prin algoritmul propus
....................................................................
17 4.3.2 Vectorizarea elementelor areale prin algoritmul propus
.....................................................................
20
4.4 Analiza performanelor algoritmilor de vectorizare
.............................................................
21
5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE
PRIN SEMNE CONVENIONALE
PUNCTUALE.............................23
5.1 Segmentarea imaginii
..........................................................................................
..................... 23 5.2 Generarea descriptorilor formei pentru
interpretarea automat ........................................ 24
5.3 Recunoaterea semnelor convenionale
punctuale.................................................................
285.3.1 Recunoaterea automat a semnelor convenionale punctuale pe
baza semnturii formei ................. 28 5.3.2 Recunoaterea
automat a semnelor convenionale punctuale pe baza descriptorilor
Fourier............ 30
5.4 Algoritm propus pentru identificarea semnelor convenionale
punctuale .......................... 32
6. SURSE DE ERORI N SIG
........................................................................................
........34
6.1 Precizia hrilor
...........................................................................................
............................. 346.1.1 Eroarea de poziionare
.....................................................................................................................
... 34 6.1.2 Eroarea atributelor (datelor tematice)
.................................................................................................
35
6.1.3 Eroarea conceptual
...................................................................................................................
......... 35 6.1.4 Eroarea de
consisten.....................................................................................................................
... 35
6.2 Surse de erori
...............................................................................................
............................. 36 6.3 Verificarea preciziei datelor
spaiale.......................................................................................
376.3.1 Testarea preciziei de
poziie................................................................................................................
38 6.3.2 Testarea preciziei
atributelor...............................................................................................................
44CUPRINS
4
6.4 Propagarea i cumularea erorilor n SIG
...............................................................................
466.4.1 Propagarea
erorilor............................................................................................................................
.47 6.4.2 Cumularea erorilor
...........................................................................................................................
...47
7. STUDII I CERCETRI
EXPERIMENTALE.................................................................
487.1 Testarea scanerului CONTEX Chameleon TX
........................................................................
49 7.2 Rectificarea imaginii
scanate...........................................................................................
......... 50 7.3 Culegerea datelor cartografice cu ajutorul
algoritmilor propui .........................................
547.3.1 Vectorizarea originalului de editare cu relieful
...................................................................................55
7.3.2 Vectorizarea originalului de editare cu
hidrografia.............................................................................57
7.3.3 Recunoaterea semnelor convenionale prin algoritmul
propus..........................................................58
7.4 Editarea / Corectarea datelor culese
.......................................................................................
59 7.5 Generarea bazei de date
geografice.......................................................................................
.. 607.5.1 Proiectarea bazei de date
.....................................................................................................................60
7.5.2 Popularea cu atribute a bazei de date
geografice.................................................................................61
7.5.3 Propunere de structur de date
............................................................................................................61
7.6 Determinarea preciziei bazei de date
......................................................................................
63
7.7 Software de gestiune a bazelor de date geografice
.................................................................
64
8. CONCLUZII
FINALE....................................................................................
.................... 67 GLOSAR DE
TERMENI.................................................................................
....................... 73 BIBLIOGRAFIE
SELECTIV..............................................................................
................ 75CAPITOLUL 1. INTRODUCERE
5
1. INTRODUCERESistemele Informaionale Geografice, prescurtat
SIG, sunt vzute de muli ca un caz special de sisteme informatice
generale. Informaia este derivat din interpretarea datelor care
sunt reprezentri simbolice ale caracteristicilor. Valorile
informaiilor depind de mai multe elemente, incluznd temporalitatea,
contextul n care sunt aplicate precum i costul de colectare,
stocare, prelucrare i prezentare. Din costul total de realizare a
unui sistem informaional geografic, culegerea datelor reprezint
aproximativ 70 %. Dispunnd de mijloace moderne de calcul, nu se mai
pune problema realizrii de documente cartografice analogice, ci
aceea de culegere a datelor n vederea realizrii unor baze de date
geografice complexe, cu ajutorul crora s se redea pe terminale
documente text i grafice, cu soluii ale problemelor pe care
utilizatorul trebuie s le rezolve. Datele folosite ntr-un sistem
informaional geografic pot proveni dintr-o mare varietate de surse,
att analogice ct i digitale: cataloage i tabele de
coordonate, hri tiprite sau originale de editare, msurtori n
teren, nregistrri fotogrammetrice i de teledetecie, baze de date
cartografice existente etc. Sursa primar pentru ncrcarea bazei de
date a unui SIG o constituie hrile topografice existente. Prin
urmare, principalul pas n generarea datelor unui SIG este procesul
de conversie analog-digital. Lucrarea de fa abordeaz mai multe
aspecte teoretice i practice privind dezvoltarea unor metode i
algoritmi pentru culegerea automat/semiautomat a datelor
cartografice i pentru validarea acestora. Pentru rezolvarea acestor
probleme, cercetrile autorului au fost orientate pe urmtoarele
direcii: - elaborarea unor metode i algoritmi pentru vectorizarea
automat; - elaborarea unor algoritmi pentru culegerea automat a
datelor reprezentate prin semne convenionale punctuale; -
elaborarea unor metode pentru testarea preciziei unei baze de date
geografice.CAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUIA SIG
6
2. STADIUL ACTUAL PRIVIND EVOLUIA SIGCeea ce reprezint astzi
domeniul SIG are o istorie destul de recent, ale crei nceputuri pot
fi localizate n jurul anului 1960, odat cu aplicarea tehnicii de
calcul n realizarea unor hri simple. Aceste hri puteau fi stocate i
modificate n calculator i vizualizate, fie prin afiare pe ecran,
fie prin imprimare pe hrtie. Conceptul de SIG apare pentru prima
dat pe continentul nord-american
(Canada i Statele Unite), n urm cu mai bine de 40 de ani. Primul
SIG este cel dezvoltat de canadieni n anul 1963, n cadrul unei
operaiuni de inventariere a resurselor naturale. Realizat la o scar
foarte mic i cunoscnd o continu perfecionare de-a lungul anilor,
Canada Geographic Information System (CGIS) se afl i astzi n
funciune. Dezvoltarea sa a adus numeroase contribuii conceptuale i
tehnice la evoluia general a sistemelor informaionale geografice: -
utilizarea scanrii materialelor cartografice analogice; -
vectorizarea imaginilor scanate; - structurarea datelor geografice
pe straturi tematice; - conceptul de tabel de atribute. Principala
problem pe care ncearc s o rezolve un SIG const n realizarea
automat a analizelor geografice, utiliznd n acest scop calculatorul
electronic. Un SIG poate furniza rspunsuri la ntrebrile referitoare
la: - localizare (ce se gsete la ... ?); - condiionare (unde se
poate gsi ... ?); - evoluie (ce s-a schimbat de la ... ?); -
simulare (ce s-ar ntmpla dac ... ?). Pe harta analogic, analizele
menionate mai sus nu pot fi fcute dect de ctre om, pe baza unei
imagini personale a spaiului geografic. Corectitudinea deciziilor
rezultate n urma unei analize geografice depinde att de calitatea
hrii disponibile, ct i de cunotinele i experiena acumulate, n
domeniul specific studiului efectuat de ctre persoana care face
acea analiz. 2.1 Evoluia Sistemelor Informaionale Geografice
Dezvoltarea SIG dup 1990 s-a bazat pe trei elemente principale
dezvoltarea tehnologiei, nevoile utilizatorilor i ideile
creative de dezvoltare de noi instrumente de analiz. Respectnd
evoluia istoric, o clasificare a sistemelor informaionale
geografice poate fi: - a) pachete SIG de "generaia nti": 1. fr
sisteme de fiiere atribut; 2. cu sisteme de fiiere "flat";CAPITOLUL
2. STADIUL ACTUAL PRIVIND EVOLUIA SIG
7
- b) pachete SIG de "generaia a doua": 1. sisteme duale; 2.
sisteme integrate; - c) pachete SIG de "generaia a treia": 1.
sisteme SGBDR extinse; 2. sisteme orientate obiect.Figura 2-1.
Evoluia Sistemelor Informaionale Geografice.
n urma unui studiu efectuat n anul 2001 de Daratech Inc. (firm
din SUA renumit n domeniul studiului de pia al produselor IT
inginereti) reiese c produsele ESRI i Intergraph sunt cele mai
populare sisteme informaionale geografice la ora actual. 2.2
Evoluia metodelor de culegere a datelor cartografice Calitatea cea
mai important a unui sistem informaional geografic este aceea c
poate combina i analiza diferite tipuri de date obinute dintr-o
multitudine de surse. Principalele surse de obinere a datelor
geografice sunt: msurtori geodezice, scanarea i vectorizarea
hrilor, fotograme aeriene, nregistrri de teledetecie, cataloage de
coordonate, importul de date de la alte programe sau sisteme, alte
surse. Msurtorile topografice se execut din cele mai vechi timpuri
i au
reprezentat principala surs de date pentru realizarea hrilor. n
anul 1669 s-aCAPITOLUL 2. STADIUL ACTUAL PRIVIND EVOLUIA SIG
8
executat prima triangulaie pentru realizarea hrii coastelor
Franei, la ordinul regelui Ludovic al XIV-lea. n anul 1985 a
devenit operaional sistemul GPS. Acest sistem a devenit i mai
popular dup deschiderea care a avut loc n anul 2000, cnd toi
utilizatorii au avut acces la msurtori de precizie, prin eliminarea
disponibilitii selective (SA). O dat cu apariia primelor sisteme
informaionale geografice comerciale la nceputul anilor 80, s-au
dezvoltat i au luat amploare noi metode de culegere a datelor:
digitizarea vectorial a hrilor i, odat cu dezvoltarea hardware-lui,
digitizarea raster. Programele de conversie raster-vector au
evoluat foarte mult n ultimul timp, o dat cu dezvoltarea
inteligenei artificiale, dar, cu toate acestea, nc nu s-a putut
realiza un sistem complet automat de culegere a datelor de pe hrile
scanate. Fotogrammetria ofer metode de culegere a datelor
geografice. A aprut nainte de anul 1900, dar s-a dezvoltat foarte
mult prin anii 60, odat cu dezvoltarea platformelor aeriene, a
camerelor fotogrammetrice i a aparatelor de fotoredresare i
stereorestituie. Teledetecia reprezint un ansamblu de tehnici care
au fost dezvoltate pentru cercetarea de la distan a pmntului, i
exploateaz faptul c toate obiectele i fenomenele pot fi analizate
dac se folosesc senzorii corespunztori
care nregistreaz radiaia electromagnetic reflectat sau emis.
Teledetecia s-a dezvoltat foarte mult, odat cu disponibilitatea
primelor imagini comerciale la nceputul anilor 80.Figura 2-2.
Evoluia metodelor de culegere a datelor geografice.CAPITOLUL 3.
METODE DE CULEGERE A DATELOR
9
3. METODE DE CULEGERE A DATELORDoi factori principali influeneaz
eficiena unui SIG, cantitatea datelor stocate n baza de date i
calitatea acestora. Lund ca unitate costul hardwareului, atunci
costul dezvoltrii programelor este 10, iar cel al culegerii
datelor, 100 [Guptill, 1988]. Aadar, o problem foarte important o
reprezint crearea bazelor de date geografice digitale, care
constituie baza oricrui SIG. 3.1 Tipuri de date cartografice Datele
cartografice reprezint totalitatea informaiilor ce descriu
semantic, sintactic i pragmatic geoimaginea cartografic (dar i
obiectele i fenomenele geosferei) [Niu, 1992]. Baza de date a unui
sistem informaional geografic este de fapt o harta digital, adic o
colecie de date geografice organizate ntr-o form care s fac posibil
prelucrarea lor de ctre calculatorul electronic. O entitate
geografic este definit de urmtoarele elemente [Goodchild, 1991]: -
poziia (unde se afl ?), exprimat prin coordonate. - atributele (ce
este.?), exprimate prin valori numerice, alfanumerice sau logice
(categorie de sol, denumire, nlime, etc.). - relaiile sunt
exprimate prin date numerice [Niu, 1995]. Relaiile dintre
elementele geosferei sunt naturale, economice, sociale etc. Dup
numrul
elementelor participante relaiile pot fi binare, unul la mai
muli, mai muli la unul i mai muli la mai muli. Alte tipuri de
relaii sunt cele geometrice, topologice, ierarhice etc. - timpul
(cnd a fost observat entitatea ?) este o component important a
datei geografice, avnd n vedere dinamica specific spaiului n care
trim. Exist dou modele principale sub care sunt stocate datele
geografice n baza de date a unui SIG: vectorial i raster. n modelul
vectorial (figura 3-1), se consider c orice entitate geografic
poate fi reprezentat ca punct, linie (arc) sau poligon (suprafa).
Entitile geometrice enumerate au ataate mai multe atribute definite
de utilizator, reprezentnd caracteristici ale fenomenelor sau
obiectelor reprezentate. n modelul raster (figura 3-2) este
suprapus o reea regulat pe spaiul datelor continue i este
determinat o medie a celei de a 3-a dimensiuni (densitatea optic,
reflectana spectral, cota, temperatura etc.) pentru suprafaa
fiecrei celule (pixel). Aceast valoare se atribuie centrului
celulei i se consider constant pe ntreaga sa suprafa.CAPITOLUL 3.
METODE DE CULEGERE A DATELOR
10 Figura 3-1. Reprezentarea vectorial a unei imagini. Figura
3-2. Reprezentarea raster a unei imagini.
3.2 Structuri de date n SIG Natura datelor spaiale determin o
mulime de modele teoretice, fiecare dintre ele putnd fi mai mult
sau mai puin adecvat descrierii unei clase de
fenomene. De pild, sunt abordate mai multe ci pentru modelarea
variaiilor n altitudine a suprafeei topografice. Ele difer din
punct de vedere al eficientei, n funcie de gradul de accidentare al
terenului. Odat ce a fost ales un model teoretic, este necesar
gsirea unei metode eficiente de reprezentare numeric. 3.2.1
Structuri de date de nivel inferior Structurile de date de nivel
inferior reprezint implementarea conceptelor geometrice i urmresc
eficiena, att la stocarea informaiilor ct i la regsire. Aceste
structuri stau la baza realizrii unor structuri complexe de nivel
nalt. Proiectarea eficienta a unei structuri de date presupune
separarea structurii abstracte de implementarea fizic. Structura
abstract a datelor se definete ca o mulime compus din elementele
care trebuie stocate, operaiile care trebuie aplicate asupra lor,
precum i posibilele condiionri.CAPITOLUL 3. METODE DE CULEGERE A
DATELOR
11
a) Secveniale. Aceast structur de date este suficient scopurilor
grafice, dar se dovedete insuficient pentru cea mai mare parte a
operaiilor nongeometrice i pentru toate operaiile geometrice
complexe. Aplicaii n cartografie: digitizarea vectorial a
elementelor hrii, schimbul datelor cartografice ntre sisteme n
format standardizat. b) Secvenial indexate: legarea articolelor
este explicit prin specificarea adresei elementului urmtor. c)
Liste dublu nlnuite: fiecare articol conine pe lng informaia util i
adresa articolului precedent i a articolului urmtor. Acest tip de
liste permite
parcurgerea facil n ambele sensuri, regsirea elementelor dup
anumite criterii fcndu-se uor. d) Liste circular nlnuite: ultimul
articol din list conine adresa primului articol. Acest tip de
structur poate fi folosit pentru stocarea elementelor poligonale.
e) Structura raster grosier: domeniul de definiie al bazei de date
se mparte n submulimi (ferestre). Aceasta are avantajul accesului
uor la elementele dintr-o submulime. Se creeaz liste corespunztoare
subdomeniilor definite. n lista fiecrui subdomeniu se trec adresele
elementelor (fenomenelor) care trec prin subdomeniul respectiv. f)
Structura topologic: spaiul hrii este egal cu spaiul topologic.
ntre elementele unui graf planar topologic (noduri, arce,
poligoane) se pot stabili relaiile de frontier i cofrontier.
Structura evideniaz proprietile grafurilor topologice [Niu, 2002].
3.2.2 Structuri de date de nivel nalt n literatura de specialitate,
structura de date de nivel nalt mai este ntlnit sub denumirea de
modelul datelor spaiale. Organizarea datelor spaiale are ca scop
optimizarea i eficientizarea operaiilor geometrice i este dependent
de experiena observatorului. Modelul datelor spaiale formalizeaz
conceptul uman de percepere a spaiului, deoarece calculatoarele
sunt sisteme formale care utilizeaz simboluri n concordan cu nite
reguli stricte. a) Structura TIN se bazeaz pe elemente
triunghiulare, cu vrfurile n
punctele culese, caracteristicile terenului putnd fi incluse cu
uurin. n consecin, structurile TIN pot reflecta n mod adecvat
densitatea variabil a punctelor. Relaiile topologice trebuie
calculate sau nregistrate n mod explicit. b) Structuri relaionale.
Conceptele acestei metode de gestiune a datelor au fost stabilite
iniial de Codd, ca mijloc de descriere a datelor doar pe baza
structurii lor naturale i de asigurare a independenei programelor
de gestiune.CAPITOLUL 3. METODE DE CULEGERE A DATELOR
12
n comparaie cu metodele anterioare, sistemele relaionale se
caracterizeaz prin simplitate, datele fiind reprezentate n tabele.
c) Structuri de date orientate pe obiecte. Un obiect poate fi
definit c o entitate care are o stare reprezentat de valorile
variabilelor locale (variabile instan) i un set de operaii sau
metode (metode instan) care opereaz asupra obiectului [Somerville,
1989]. Obiectele individuale aparin unei clase, care definete un
tip de obiect. Clasele pot avea variabile care descriu
caracteristici ale clasei respective, privit c ntreg. Fiecare clas
are o superclas din care poate moteni att variabile instan ct i
metode instan. 3.3 Surse de date Datele folosite ntr-un sistem
informaional geografic provin dintr-o mare varietate de surse, att
analogice ct i digitale, dintre care se amintesc: - cataloage i
tabele de coordonate; - fiiere, liste de date rezultate din
prelucrri; - baze de date cartografice existente; - hri topografice
i speciale tiprite sau originale de editare ale
acestora; - jurnale i carnete electronice de teren; - nregistrri
fotogrammetrice i de teledetecie analogice i digitale; - determinri
cu receptoare GPS. Principalele metode de obinere a datelor
cartografice sunt: a) Introducerea de la tastatur cu un editor de
texte sau cu un program aplicativ. Este o metod greoaie, care
necesit un volum mare de munc. b) Importul de date de la alte
programe i sisteme. Este necesar ca informaiile s fie stocate n
formate standardizate i exist necesitatea unor programe de
conversie dintr-un format n altul. Sistemele de poziionare global
(GPS) sunt o sursa important de date. c) Digitizarea vectorial a
fotogramelor sau ortofotogramelor la un aparat fotogrammetric.
Permite obinerea unui volum mare de date ntr-un timp scurt cu
costuri minime. d) Digitizarea vectorial a hrilor existente.
Folosete ca suport hrile tiprite sau originalele acestor hri cu
elemente separate pe culori. Aceast metod folosete digitizoare
vectoriale interfaate cu procesoare. Practic se redeseneaz harta
dat. e) Digitizarea raster a fotogramelor sau ortofotogramelor.
Folosete ca suport nregistrrile digitale de teledetecie sau date
fotogrammetrice raster obinute prin scanarea fotogramelor. Necesit
un nou hardware i programe complexe de conversie raster -
vector.CAPITOLUL 3. METODE DE CULEGERE A DATELOR
13 f) Digitizarea raster a hrilor existente. Este metoda cea
mai
utilizat pentru
culegerea datelor cartografice. Suportul l reprezint imaginea
scanat a originalului hrii. Pentru obinerea datelor prin aceast
metod este necesar un nou hardware (scanner cartografic,
calculatoare puternice), sisteme de gestiune a datelor, programe de
conversie raster - vector. Metodele de culegere a datelor se
clasific, dup Fritsch, n: - metode primare (culegerea datelor se
face direct n teren); - metode secundare (culegerea din surse
analogice i digitale existente). Metodele primare de achiziie sunt
de obicei mai precise i mai actuale dect metodele secundare, dar
sunt mai scumpe din punct de vedere economic. Metodele primare de
culegere a datelor de poziie sunt: - msurtori cu aparate clasice
(teodolit, staie total); - determinri cu receptoare GPS; -
exploatare fotogrammetric; - exploatarea nregistrrilor de
teledetecie. Metodele secundare de culegere a datelor de poziie
sunt: - digitizarea materialelor cartografice; - importul unor baze
de date digitale deja existente. Evoluia sistemelor hardware i
software destinate culegerii de date a fost deosebit de
spectaculoas n anii '80. Dei nu s-a ajuns la un sistem integrat, n
ntregime automatizat, avantajele folosirii datelor oferite de
fotogrammetria digital i de teledetecie nu pot fi neglijate. Totui
sursa primar pentru ncrcarea bazei de date a unui SIG o constituie
hrile topografice existente. Prin urmare, principalul pas n
generarea datelor unui SIG este procesul de conversie
analog-digital [Alexei, 2004c]. Culegerea datelor cartografice
digitale se face cel mai simplu folosind ca
surs hrile tiprite sau originalele acestor hri cu elemente
separate pe culori. Cele mai simple originale sunt cele ce conin
elementele de relief i de sol. Curbele de nivel nu se intersecteaz
ntre ele i, ca atare, digitizarea acestora nu pune probleme
deosebite. Nici caracteristicile asociate fiecrei curbe de nivel nu
sunt numeroase, principala caracteristic fiind altitudinea sau
cota. Pe toate originalele separate pe culori se pot distinge
elemente cartografice punctuale, liniare, areale i inscripii [Niu,
1996]. 3.4 Evaluarea preciziei metodelor de digitizare n acest
studiu s-a fcut o comparaie din punct de vedere al eficienei i al
preciziei, ntre metoda de digitizare raster-vector manual i cea
automat. S-au comparat i rezultatele digitizrii automate obinute cu
modulul ArcScan din ArcMap i cu programul R2V Conversion Toolkit
produs de Algolab.CAPITOLUL 3. METODE DE CULEGERE A DATELOR
14
Ca date de intrare s-a folosit originalul de editare cu relieful
pentru o hart topografic cu scara 1: 50.000. Acest original a fost
scanat la rezoluia de 400 dpi n dou culori, rezultnd un fiier TIF
cu dimensiunea de 8.124 Mb. n etapa de preprocesare s-a corectat
geometric imaginea rezultat n urma scanrii, folosind modulul
Georeferencing din ArcMap. Rectificarea imaginii s-a fcut folosind
o transformare afin pe 4 puncte. n cazul imaginilor cartografice nu
este necesar aplicarea tuturor transformrilor radiometrice din
cazul fotogramei, deoarece imaginea cartografic conine puine culori
(de obicei 4
sau 8 culori). Pentru digitizarea raster-vector automat s-a
folosit modulul ArcScan din ArcMap. S-a considerat rezultatul
digitizrii automate cu acest program drept referin pentru comparaia
fcut. Un alt program ce permite digitizarea raster-vector automat
este R2V Conversion Toolkit. Acest program este simplu de folosit i
dedicat vectorizrii. Permite importul imaginilor raster
georefereniate n formate consacrate. Pentru determinarea preciziei
digitizrii s-a calculat factorul de deformare DF (vezi subcapitolul
6.3.1, Testarea preciziei de poziie) pentru digitizarea
raster-vector manual, i pentru cea automat realizat cu programul
R2V Conversion Toolkit. S-a considerat ca referin rezultatul
digitizrii automate efectuate cu ArcMap. Rezultatele studiului sunt
prezentate n tabelul urmtor.Tabelul 3-1. Comparaie ntre metodele de
digitizare.
Metoda de digitizare Timpul necesar digitizrii Factorul de
deformare DF Digitizare manual 12 ore 1.6245 Digitizare automat cu
R2V 38 secunde 2.5542 Digitizare automat cu ArcMap 24 secunde innd
seama de rezultatele obinute mai sus, se poate concluziona c cea
mai eficient metod de digitizare este cea automat realizat cu
ArcMap. Metoda raster-vector manual, chiar dac este mai precis dect
metoda automat efectuat cu R2V, este mare consumatoare de timp i
deci eficiena
acesteia este foarte mic, ambele ncadrndu-se n
tolerane.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER -
VECTOR
15
4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT
RASTER-VECTORAutomatizarea interpretrii unei hri n scopul
identificrii elementelor geografice i a relaiilor lor este o
misiune dificil ce merge dincolo de transformarea imaginilor raster
cartografice ntr-o reprezentare vectorial. Munca de interpretare a
hrilor, cum ar fi detectarea morfologiei terenului, selectarea
elementelor naturale i artificiale din mediul nconjurtor i
recunoaterea formelor, necesit procese de abstractizare i cunoatere
profund a domeniului. 4.1 Algoritmi de vectorizare Conversia raster
vector const n analiza unei imagini raster n vederea transformrii
acesteia dintr-o reprezentare matricial de pixeli ntr-o
reprezentare vectorial. Vectorizarea nu trebuie privit ca un ntreg,
deoarece aceasta presupune mai multe etape, att premergtoare
vectorizrii, ct i post vectorizare. Una din problemele principale
ale vectorizrii este aceea dac metodele s aib sau nu la baz un
algoritm de scheletizare. Se poate considera conversia raster
vector ca o aplicaie tipic pentru scheletizare. Totui, trebuie inut
cont de faptul c dei o imagine scheletizat este menit s reprezinte
fidel forma
binar analizat, aceasta nu asigur ntotdeauna cea mai bun
precizie pentru extremitile liniilor i pentru intersecii. innd
seama de aceste consideraii sau dezvoltat dou clase de algoritmi de
vectorizare: - algoritmi ntr-un singur pas algoritmi ce se aplic
direct imaginii primare; - algoritmi n doi pai algoritmi ce au ca
etap preliminar scheletizarea. 4.1.1 Algoritmi de vectorizare
ntr-un singur pas Algoritmii de vectorizare ntr-un singur pas au ca
date de intrare imaginea raster binar neprelucrat, iar ca rezultat
imaginea vectorial. Aceti algoritmi sunt mai compleci, deoarece
trebuie s pstreze caracteristicile topologice (pstrarea
interseciei, incluziunii etc.), dar nu depind de precizia unei
prelucrri preliminare (scheletizarea). Dintre algoritmii de
vectorizare ntr-un singur pas sunt prezentai n lucrare algoritmul
de vectorizare Pixeli rari SPV i algoritmul de vectorizare a
regiunilor nchise.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT
RASTER - VECTOR
16
4.1.2 Algoritmi de vectorizare n doi pai Algoritmii de
vectorizare n doi pai au ca date de intrare o imagine binar
scheletizat (grosimea oricrei linii din imagine este de un pixel).
Etapa premergtoare vectorizrii, scheletizarea, conduce la o imagine
care nu pierde din precizia de poziionare a elementelor. Pentru
algoritmii de scheletizare exist dou metode de baz: subierea
iterativ a imaginii originale pn cnd nu se mai poate ndeprta nici
un pixel
fr s se modifice proprietile topologice i morfologice ale
formei, i subierea prin calculul unor distane n dou treceri
succesive. n timp ce metodele de scheletizare sunt independente de
orice informaie a priori despre natura desenului, deseori este
necesar s se adauge cunotine contextuale ntr-un anumit stadiu al
procesului. n lucrare sunt prezentai n amnunt doi algoritmi de
vectorizare prin vecinti. 4.2 Prelucrri post - vectorizare n urma
procesului de vectorizare rezult o serie de vectori cu coordonatele
punctelor ce descriu ct mai fidel imaginea raster binar. Aceti
vectori, pentru a putea fi folosii ca date de intrare pentru un
SIG, trebuie s suporte dou tipuri de prelucrri - cele necesare
pentru eliminarea unor erori de vectorizare i prelucrri necesare
ajustrii formei vectorilor. Prelucrrile din prima categorie nu se
pot automatiza n totalitate, operatorul intervenind n luarea
deciziilor cu privire la eliminarea zgomotului, completarea unor
goluri de vectorizare etc. n a doua categorie de prelucrri se
nscriu: - aproximarea conturului presupune eliminarea surplusului
de puncte rezultat n urma procesului de vectorizare (de exemplu, un
segment de dreapt trebuie memorat doar prin punctele de capt); -
constrngeri impuse conturului (de exemplu, colurile unei case, n
general, formeaz unghiuri drepte). 4.3 Algoritm propus pentru
vectorizare
Algoritmul propus face parte din categoria algoritmilor ntrun
singur pas, dar se poate aplica cu succes i imaginilor
scheletizate, i poate fi folosit pentru vectorizare automat sau
interactiv [Alexei, 1997a]. n vectorizarea interactiv este nevoie
de intervenia operatorului pentru rezolvarea ambiguitilor care
apar. n vectorizarea automat, algoritmul parcurge ntreaga imagine
analiznd fiecare element liniar sau areal.CAPITOLUL 4. CONTRIBUII
PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR
17
Acest algoritm poate fi folosit pentru conversia raster-vector a
elementelor liniare sau areale din cadrul unei hri. Folosete ca
suport un fiier raster binar rezultat n urma scanrii originalelor
hrii cu elemente separate pe culori. Rezultatele cele mai bune se
obin pentru originalele de editare pentru hidrografie, vegetaie i
relief. 4.3.1 Vectorizarea elementelor liniare prin algoritmul
propus Prima etap presupune determinarea unui capt al elementului
liniar ce urmeaz a fi digitizat. Determinarea unui punct de capt se
poate face automat, prin parcurgerea imaginii de sus n jos i de la
stnga la dreapta, pn se identific un pixel de culoare neagr, sau
interactiv, prin determinarea aproximativ a coordonatelor punctului
de nceput cu ajutorul unui locator. Pentru gsirea unui punct de
start, se parcurge imaginea cu un pas p = 2r , unde r este raza de
analiz n jurul punctului curent, pn se gsete un grup de pixeli cu
valoarea 1 i se alege centrul de greutate al acestora (figura
4-1).Figura 4-1. Analiza unei imagini ne scheletizate.
Etapa a II-a const n urmrirea elementului liniar pe baza metodei
cercului. Aceast metod presupune analiza pixelilor aflai pe cercul
0 0 C(x ,y ,r), unde 0 0 x , y sunt coordonatele punctului curent.
Raza cercului de analiz se consider constant i se alege n funcie de
rezoluia de scanare a materialului cartografic i de densitatea de
informaii de pe acesta. O raz de analiz mare determin creterea
vitezei de analiz, dar poate conduce la pierderea unor informaii. O
valoare mic a razei permite analiza tuturor informaiilor, dar duce
la creterea timpului de analiz. Raza de analiz pentru elemente
liniare nu poate lua o valoare mai mic dect cea mai groas linie din
imaginea raster. Dup o explorare complet n jurul punctului curent 0
0 (x ,y ), pot exista mai multe situaii:CAPITOLUL 4. CONTRIBUII
PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR
18
- Se gsete doar un singur pixel setat pe 1 - n acest caz s-a
gsit un nou punct al elementului liniar, de coordonate (x, y) . n
continuare, punctul curent devine (x,y), 0 0 (x =x,y =y) i se
continu aplicarea metodei cercului (figura 4-2 a). - Se gsesc doi
sau mai muli pixeli setai pe 1 - n acest caz s-a determinat o
intersecie de elemente liniare. n aceast situaie, explorarea
traseului liniar poate continua pe o direcie dinainte stabilit sau
se poate opri i programul cere utilizatorului s indice direcia pe
care urmeaz s o exploreze (figura 4-2 b).
Coordonatele punctului de intersecie se memoreaz ntr-o list,
pentru a putea reveni n acest punct. - Nu se gsete nici un pixel
setat pe 1 - n acest caz s-a gsit punctul de sfrit al elementului
liniar, i se ncheie analiza (figura 4-2 c).Figura 4-2. Cazuri de
analiz.
n procesul de analiz pot aprea mai multe tipuri de ambiguiti.
Aceste probleme se pot rezolva prin modificarea razei de analiz. Se
pot ntlni urmtoarele cazuri: - Dac n urma analizei n jurul
punctului curent nu se mai gsete nici un pixel setat pe unu,
atunci, n mod eronat, algoritmul consider punctul curent ca punct
de capt. Pentru a gsi poziia exact a punctului de capt, raza de
analiz se micoreaz iterativ, pn cnd se gsete un nou pixel setat pe
1, pixel ce reprezint poziia exact a punctului de capt. n figura
4-3, n punctul curent, raza de analiz s-a micorat de la valoarea r
la valoarea 0 r pentru a gsi poziia exact.CAPITOLUL 4. CONTRIBUII
PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR
19 Figura 4-3. Determinarea exact a punctului de capt.
- Dac din punctul curent s-au gsit doi sau mai muli pixeli setai
pe unu, n mod normal punctul curent se consider nod (intersecia mai
multor drepte). Pentru determinarea exact a poziiei punctului de
intersecie se micoreaz raza de analiz pn la o valoare 0 r cnd se
gsete un singur pixel setat pe unu (figura 4-4). Acest pixel d
poziia exact a punctului de intersecie.Figura 4-4. Determinarea
exact a punctului de intersecie a mai multor drepte.
- Pentru determinarea exact a poziiei punctului de start, pentru
metoda interactiv, se micoreaz raza de analiz, iterativ, pn la o
valoare 0 r cnd nu se mai gsete nici un pixel setat pe unu (figura
4-5). Atunci, pixelul gsit la iteraia precedent determin poziia
exact a punctului de start.Figura 4-5. Determinarea exact a
punctului de start.
- n cazul n care din punctul curent se gsesc doi sau mai muli
pixeli setai pe unu, atunci trebuie verificat fiecare dintre acetia
dac aparine aceluiai element liniar. Acest lucru se poate face prin
analiza pixelilor de-a lungul segmentului deCAPITOLUL 4. CONTRIBUII
PRIVIND CONVERSIA AUTOMAT RASTER - VECTOR
20
dreapt determinat de punctul curent i punctul nou determinat.
Dac se gsesc pixeli setai pe zero, atunci punctul analizat nu
aparine aceluiai element liniar i, pentru a evita ambiguitatea, se
micoreaz raza pn la o valoare 0 r cnd se gsesc doar pixeli ce
aparin aceluiai element liniar (figura 4-6).Figura 4-6. Elemente
liniare foarte apropiate.
Algoritmul propus are capacitatea de a trece peste ntreruperile
din elementele liniare dac acestea sunt mai mici dect distana
dintre cele mai apropiate elemente. n caz contrar, pot aprea
ambiguiti care duc la intervenia operatorului (figura 4-7). Aceast
capacitate de a trece peste ntreruperi este util pentru
vectorizarea liniilor ntrerupte.Figura 4-7. Trecerea peste golurile
din elementele liniare.
4.3.2 Vectorizarea elementelor areale prin algoritmul propus
Prima etap presupune determinarea unui pixel de pe conturul
arealului ce
urmeaz a fi digitizat. Un pixel de pe contur are proprietatea c
nu toi pixelii vecini sunt setai pe 1. Etapa a II-a const n
urmrirea conturului elementului areal. Aceasta se desfoar la fel ca
n cazul vectorizrii elementelor liniare (situaia 1), cu deosebirea
c explorarea n jurul pixelului curent se face pn cnd se gsete
pixelul situat pe contur (figura 4-8). Urmrirea elementului areal
se termin cnd se ajunge n punctul iniial sau cnd se iese din cadrul
hrii.CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER -
VECTOR
21 Figura 4-8. Urmrirea conturului.
Algoritmul propus este uor de implementat i ofer vitez de
execuie bun. Un avantaj este faptul c nu necesit scheletizarea
prealabil a imaginii ce urmeaz a fi digitizat. n cazul imaginilor
nescheletizate, n urma procesului de explorare, se gsesc grupuri de
pixeli vecini de aceeai culoare. Pentru a determina coordonatele
axului elementului liniar se determin centrul de greutate al
acestui grup de pixeli. Procesul de vectorizare decurge ca n cazul
imaginilor scheletizate doar c se va lua n calcul centrul de
greutate al grupului de pixeli descoperit [Alexei, 2004b]. 4.4
Analiza performanelor algoritmilor de vectorizare n acest studiu
s-a fcut o comparaie ntre performanele urmtorilor algoritmi de
vectorizare: Pixeli rari SPV; algoritmul de vectorizare prin 8
vecinti; algoritmul de vectorizare prin metoda cercului. Pentru
aceasta s-au determinat indicii de performan propui de Liu Wenyin i
Dov Dori. Ca date
de intrare s-a folosit o imagine raster care reprezint o poriune
din originalul de editare cu relieful pentru o foaie de hart
topografic la scara 1: 50.000. Pentru a putea determina indicatorii
de performan ai algoritmilor de vectorizare s-a transformat
imaginea raster ntr-un grid, fiecrui pixel al imaginii
corespunzndu-i o celul a gridului. Aceast transformare ajut la
determinarea pixelilor gsii de algoritmi printr-o interogare
spaial.Tabelul 4-1. Valori caracteristice pentru algoritmii de
vectorizare analizai.
Algoritm Pixeli identificai Pixeli fals identificai Pixeli
neidentificai Pixeli negri n imaginea original ArcInfo 23321 80
20138 43459 SPV 1437 13 1636 3073 Prin vecinti 16676 4 26783 43459
Metoda cercului 21788 158 21671 4345922
CAPITOLUL 4. CONTRIBUII PRIVIND CONVERSIA AUTOMAT RASTER -
VECTOR
Dup cum se observ n tabelul 4-1, numrul de pixeli negri din
imaginea original este diferit, deoarece s-a analizat un numr
diferit de elemente liniare.Tabelul 4-2. Indicatorii de performan
ai algoritmilor de vectorizare analizai.
Algoritm Rata de detecie a pixelilorp
Rata de detecie fals a pixelilorp
D
F
Coeficientul de detecie rasterPRI
ArcInfo 0.536 0.0034 0.7663 SPV 0.468 0.0090 0.7295 Prin vecinti
0.384 0.0002 0.6919 Metoda cercului 0.501 0.0072 0.7469 Conform
rezultatelor din tabel, algoritmul de vectorizare prin vecinti are
rata de detecie fals a pixelilor cea mai mic, deoarece imaginea
original a suferit n prealabil o transformare morfologic de
erodare, grosimea fiecrui element liniar fiind de un pixel. Cu
algoritmul propus s-au obinut rezultate bune i acesta poate fi
folosit cu succes pentru vectorizarea interactiv sau automat a
curbelor de nivel i a hidrografiei. Rata de detecie fals a
pixelilor poate fi mbuntit prin micorarea razei de analiz, aceasta
ducnd la ndesirea punctelor detectate. Pentru a putea determina
aceti indici de performan ai algoritmilor de vectorizare s-a
realizat un program ce are ca date de intrare gridul corespunztor
imaginii raster ce urmeaz a fi vectorizat i imaginea vectorial
rezultat dup aplicarea fiecrui algoritm.CAPITOLUL 5. CONTRIBUII
PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE
CONVENIONALE PUNCTUALE
23
5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE
PRIN SEMNE CONVENIONALE PUNCTUALERecunoaterea formelor are ca
obiect descrierea i clasificarea
msurtorilor preluate din procese fizice sau mentale. Pentru a
putea descrie matematic o form dat, principalul aspect l constituie
acela de a extrage un set de entiti care caracterizeaz forma i
care, prin msurtori corespunztoare, se transform ntr-un set de
valori necesare pentru plasarea entitii necunoscute ntr-una din
cele M clase predefinite (M 2). Scopul final al aplicaiilor de
analiz de imagine este extragerea unor caracteristici importante
din imagine, care ajut calculatorul s neleag, s descrie sau s
interpreteze o scen. n ultimul timp s-au dezvoltat mai multe metode
pentru recunoaterea elementelor grafice, dar nici una dintre
acestea nu poate fi considerat perfect. Aceste metode pot fi
clasificate n: - metode ntr-un singur pas obiectele grafice sunt
recunoscute direct pe imaginea raster; - metode n doi pai mai nti
se convertete imaginea raster ntr-o imagine vectorial primar iar
apoi, cu ajutorul unor algoritmi ce lucreaz pe imaginea vectorial,
se face recunoaterea obiectelor grafice. n prezent, ambele clase de
algoritmi s-au dezvoltat foarte mult. 5.1 Segmentarea imaginii
Scopul segmentrii imaginii este de a mpri o scen n mai multe zone,
conform unor criterii [Creang, 1994]. Folosind metodele segmentrii
imaginilor, pot fi extrase din scene complexe diverse obiecte de
interes care pot fi apoi analizate.
Contrastul imaginii joac un rol important n segmentare. Una
dintre cele mai comune abordri pentru detectarea unor regiuni cu
contrast puternic este detectarea muchiei, adic identificarea unor
seturi de puncte care corespund celor mai pronunate variaii ale
nivelurilor de gri. O muchie reprezint limita dintre dou suprafee
cu valori ale nivelului de gri diferite. Segmentarea este o problem
deosebit de dificil i succesul (sau insuccesul) oricrui algoritm
depinde foarte mult de calitatea imaginii originale. Prin urmare,
se obinuiete ca segmentarea s se execute iterativ, rezultatele s
fie analizate i mbuntite prin supervizare de ctre experi
umani.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR
REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
24
5.2 Generarea descriptorilor formei pentru interpretarea automat
Coninutul cartografic este descris prin intermediul unui set de
caracteristici. Aceste caracteristici pot fi distinse pe baza
numrului de argumente pe care le pot lua. Un atribut este o
caracteristic ce descrie proprietatea unui obiect spaial i poate fi
reprezentat printro funcie unar. O relaie este o caracteristic ce
se menine ntre dou sau mai multe obiecte i poate fi reprezentat
printr-o funcie. Parametrii de form compun un fel de fi de
identitate a formei respective, pe baza creia aceast form poate fi
recunoscut n mod unic [Vertan, 1999]. n mod ideal, aceti parametri
trebuie s fie invariani la
translaie, rotaie i scalare. Tehnicile de recunoatere a formelor
sau de clasificare sunt precedate ntotdeauna de o etap de extragere
a parametrilor de form (sau a caracteristicilor formei). Forma unui
element liniar O este un atribut geometric i poate avea valorile
liniar sau curbiliniu. Elementul liniar O, exprimat prin n perechi
de coordonate ( , ) i i x y , este caracterizat de unghiurile de
inciden i w (figura 5-1):1 1 ii i ii
w arctgx x yy+ +
= (5.1) i i1 i dw w w + = (5.2) Atributul form, asociat
elementului liniar O, poate lua valoarea curbiliniu dac este
ndeplinit condiia max( )i c dw > (5.3) unde c - pragul
dat.Figura 5-1. Reprezentarea unghiurilor de inciden.CAPITOLUL 5.
CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN
SEMNE CONVENIONALE PUNCTUALE
25
Distana dintre dou elemente liniare paralele O i O reprezentate
de n, respectiv m perechi de coordonate, face parte din categoria
caracteristicilor geometrice. Algoritmul calculeaz mai nti minh d
ca distan minim dintre al hlea punct al lui O i orice punct al lui
O (figura 5-2). Atunci, distana dintre O i
O se calculeaz cu relaia:min 1 'h
n h OO
d d n =
=
(5.4)Figura 5-2. Calcularea distanei minime ntre dou elemente
liniare paralele.
Semntura formei este o funcie scalar de o variabil, asociat unei
forme plane i reprezint distana de la centrul de greutate al formei
la fiecare punct de pe contur. Aceast distan d() poate fi exprimat
n funcie de unghiul la centru , dintre punctul curent de pe contur
i axa orizontal de referin, sau n funcie de abscisa curbilinie .
Semntura formei este o reprezentare reversibil cunoscnd semntura se
poate reconstrui obiectul. Semnturile sunt caracteristici
invariante la translaie, deoarece se calculeaz fa de centrul de
greutate. Invariana la factorul de scar se poate obine prin
determinarea mediei coeficientului de scar dintre distana ( ) r d ,
corespunztoare formei de referin, i distana ( ) a d ,
corespunztoare formei de analizat. Invariana la rotaie se obine
efectund o permutare ciclic a semnturii.Figura 5-3. Form
convex.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR
REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
260
20 40 60 80 100 120 140 160 180 200 0 10 20 30 40 50 60 70 80 90
100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260
270 280 290 300 310 320 330 340 350
Figura 5-4. Semntura formei funcie de unghiul la centru.
Descriptorii Fourier caracterizeaz conturul unei forme. Cunoscnd
conturul, acesta se poate scrie sub form complex (figura 5-5)
u(n)=x(n)+iy(n) (5.5) unde: x(n) , y(n) reprezint coordonatele
punctului curent; n poziia pixelului de pe contur (n= 0,N1 unde N
reprezint numrul total de pixeli ce descriu conturul). Considernd c
funcia u(n) , ce descrie conturul, este o funcie continu i
periodic, atunci se poate calcula transformata Fourier discret 1D12
0
()1()N i nk N n
Ukune N =
= (5.6) unde U(k) reprezint setul descriptorilor Fourier.
Descriptorii Fourier sunt caracteristici de form regenerative
[Gavriloaia, 2002]. Numrul descriptorilor necesari pentru
reconstrucia formei iniiale depinde de complexitatea acesteia i de
precizia dorit. Funcia u(n) care descrie conturul este12 0
()()N i nk N k =
unUke
= (5.7)CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A
DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
27
Descriptorii Fourier se determin apriori, pentru semnele
convenionale punctuale, tiind forma teoretic a acestora.Figura 5-5.
Reprezentarea n spaiul complex a unui contur.
Cunoscnd formula lui Euler i innd seama de relaia (5.5), atunci
relaia (5.6) devine:
() ()1 0 1 0
Re ( ) 1 ( ) cos2 ( ) sin 2 Im ( ) 1 ( ) cos2 ( ) sin 2N n N
n
U N U N = =
k x n nk y n nk NN k y n nk x n nk NN
=+ =
(5.8) unde Re(U(k)) reprezint partea real iar Im(U(k)) partea
imaginar a numrului complex U(k) . Anumite transformri geometrice
elementare ale unui contur se reflect n
transformri simple ale descriptorilor Fourier corespondeni. O
sintez a acestor proprieti este prezentat n tabelul urmtor:Tabelul
5-1. Proprietile descriptorilor Fourier.
Transformare Conturul transformat Descriptorii Fourier
Identitate u'(n) =u(n) U'(k) =U(k) Translaie ( ) ( ) 0 u' n = u n +
u U'(0) =U(0) +c U'(k) =U(k) pentru k 0 Scalare u'(n) = u(n) U'(k)
= U(k) Modificarea punctului iniial 0 u'(n) =u(nn ) 2 '( ) ( )0
in k
NU
kUke
= Rotaie u'(n) =u(n) ei U'(k) =U(k) ei0
0
CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR
REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
28
Aceste proprieti ale descriptorilor Fourier pot fi folosite
pentru recunoaterea formelor unor obiecte cunoscute, indiferent de
mrimea i orientarea lor. 5.3 Recunoaterea semnelor convenionale
punctuale nzestrarea n avans a unui SIG cu toate cunotinele
necesare pentru diferitele domenii de aplicare este imposibil.
Soluia pentru aceast problem o reprezint lrgirea unui SIG cu
faciliti de nvare. Astfel, un utilizator, de fiecare dat cnd dorete
s interogheze o baz de date geografic n legtur cu unele obiecte sau
fenomene care nu sunt modelate n mod explicit, s poat s instruiasc
sistemul. Instruirea se bazeaz pe un set de exemple i
contraexemple. n general sunt dou clase de metode pentru
recunoaterea formelor, metode nesupervizate i metode supervizate. n
metodele nesupervizate nu exist seturi de date de antrenament i nu
se cunoate exact numrul de clase. n clasificarea supervizat, este
necesar un set de date pentru antrenament. Pe baza acestor date de
antrenament, se gsete o funcie de clasificare. Odat determinat
aceast funcie, se va folosi la clasificarea unor elemente ce nu au
fcut parte din setul iniial de antrenament. 5.3.1 Recunoaterea
automat a semnelor convenionale punctuale pe baza semnturii formei
Pentru recunoaterea automat a semnelor convenionale punctuale de pe
originalele de editare separate pe culori, pe baza semnturii
formei, este necesar s se realizeze n prealabil o baz de date ce
conine semntura pentru fiecare semn convenional punctual. Aceast
metod de recunoatere face parte din categoria metodelor
supervizate. Etapele necesare identificrii unei forme sunt: -
segmentarea imaginii; - determinarea conturului formei; - calculul
semnturii formei analizate; - compararea semnturii calculate cu
semnturile din baza de date; - determinarea coeficientului de
corelaie cu relaia (5.9); - forma analizat este similar celei din
baza de date dac se gsete un coeficient de corelaie maxim ct mai
apropiat de 1. Coeficientul de corelaie este1 22 11
( )( )
(,) ()()n i rnn ii
xxyy CXY xxyy= ==
=
(5.9)29CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A
DATELOR REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
unde: - x - semntura formei de analizat (vector); - x - valoarea
medie a vectorului x ; - y - semntura formei din baza de date; - y
- valoarea medie a vectorului y .Figura 5-6. Forme de analizat.
Semntura pentru fiecare form din figura 5-6 s-a determinat,
automat pe cale analitic, cu ajutorul unui program propriu realizat
n limbajul Delphi 7. Linia poligonal ce definete conturul s-a
intersectat analitic, succesiv, cu o dreapt. Am considerat pasul
unghiului de orientare de 5 . O valoare a pasului prea mic,
surprinde toate detaliile formei, dar genereaz o semntur influenat
ntr-o msur mai mare de zgomot, pe cnd o valoare mai mare determin o
semntur mai puin influenat de zgomot, dar nu surprinde toate
detaliile formei. Valoarea optim a pasului unghiului de orientare,
determinat
empiric, este cuprins ntre valorile de 1 i 5 .Figura 5-7.
Identificarea unei forme rotite i micorat.CAPITOLUL 5. CONTRIBUII
PRIVIND CULEGEREA AUTOMAT A DATELOR REPREZENTATE PRIN SEMNE
CONVENIONALE PUNCTUALE
30
n figura 5-7 este prezentat cazul general de identificare a unei
forme cu orientare i scar diferit de ale formei de referin. Pentru
a putea identifica forma de analizat, se determin coeficienii de
corelaie pentru translaii succesive ale formei de analizat de-a
lungul axei . Poziia pe axa n care se obine un coeficient de
corelaie maxim, mai mare dect un prag prestabilit, d orientarea
formei de analizat fa de cea de referin. 5.3.2 Recunoaterea automat
a semnelor convenionale punctuale pe baza descriptorilor Fourier
Aceast metod de recunoatere de forme face parte din categoria
metodelor supervizate, fiind necesar cunoaterea apriori a seturilor
de descriptori Fourier pentru semnele convenionale punctuale ce
urmeaz a fi identificate pe originalele de editare separate pe
culori. Dac se consider seturile de descriptori Fourier U1(k) i
U2(k) corespunztoare contururilor diferite u1(n) respectiv u2(n),
atunci forma acestor contururi este similar dac0 000
1212 000,,,000 N i unn
( , , , ) min ( ) ( ) 0 d u n u n u n n e u
=
=
(5.10) Un exemplu practic este cel prezentat n figura 5-8, n
care se face o recunoatere pe baza descriptorilor Fourier a
semnului convenional punctual Locuri de aterizare.Figura 5-8.
Analiza unui semn convenional punctual pe baza descriptorilor
Fourier.CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR
REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
31
n figura 5-8, semnul convenional punctual de referin este
reprezentat prin culoarea roie i pe baza descriptorilor si Fourier
se determin translaia, scara, rotaia i punctul de referin pentru
celelalte simboluri. Fie referin f i analizat f transformatele
Fourier ale simbolului punctual de referin, respectiv a celui de
analizat. Pentru determinarea translaiei se folosesc formulele Re(
) Re( ) Im( ) Im( )x analizat referin y analizat referin
dff dff = = (5.11) unde Re( f ) reprezint partea real a numrului
complex f , iar Im( f ) partea imaginar. Aplicnd formula (5.11)
pentru o imagine doar translatat, vectorii x d i
d au primul element translaia pe axa X, respectiv translaia pe
axa Y, iar restul elementelor 0. Pentru determinarea scrii ntre
imaginea de referin i imaginea de analizat se folosesc formulele
(5.12). Vectorii x scara i y scara au toate elementele egale cu
scara pe axa X, respectiv cu scara pe axa Y Re( ) Re( ) Im( ) Im(
)y analizat x referin analizat y referin
scara f f scara f f = = (5.12) Pentru determinarea unghiului de
rotaie dintre imaginea de referin i imaginea de analizat, se
folosete formula22
Re( )Re( ) Im( )Im( ) arccos Re( ) Im( ) ffff ff
analizat referin analizat referin referin referin
+ = + (5.13)
Fiecare element al vectorului , cu excepia primului element,
conine unghiul de rotaie exprimat n radiani. Indicele punctului de
start pentru forma de analizat se determin cu formula0
() i2 n lungime i
= (5.14) unde i este elementul i al vectorului dat de relaia
(5.13).32
CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR
REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
01 001 110 01 000 101 5.4 Algoritm propus pentru identificarea
semnelor convenionale punctuale Acest algoritm este o metod simpl
de recunoatere a formei semnelor convenionale punctuale cu
orientare normal, bazat pe corelaia dintre imaginea teoretic a
semnului convenional i imaginea practic rezultat n urma scanrii.
Fie f(x,y) imaginea teoretic a semnului convenional punctual i
g(x,y) imaginea obinut n urma procesului de scanare. Teoretic, ar
trebui s aib loc
relaia f AND g = f (5.15) Tabelul de adevr al funciei logice AND
este Relaia (5.15) are loc doar n cazul ideal, ns din cauza
erorilor de scanare i a calitii materialului cartografic, aceasta
devine: f AND g = f (5.16) unde f f . Pentru a determina dac
imaginile f i g sunt n corelaie, se aplic urmtorul algoritm: 1) Se
determin deosebirile dintre imaginea teoretic a semnului
convenional punctual i imaginea sa rezultat n urma procesului de
scanare printr-o operaie logic XOR (sau exclusiv) f XOR g = h
(5.17) unde h reprezint imaginea cu deosebirile ntre f i g. Tabelul
de adevr al funciei logice XOR este 2) innd seama de relaia (5.17),
se determin numrul de pixeli n plus (pP), respectiv cei lips (pM),
aplicnd relaiile1 2
h AND g h h AND f h = = (5.18) unde : - h1 reprezint imaginea cu
pixelii n plus; - h2 reprezint imaginea cu pixelii lips.33
CAPITOLUL 5. CONTRIBUII PRIVIND CULEGEREA AUTOMAT A DATELOR
REPREZENTATE PRIN SEMNE CONVENIONALE PUNCTUALE
Dac numrul pixelilor pP din imaginea h1, respectiv pM din
imaginea h2 este mai mic dect o valoare de prag , atunci imaginea g
este imaginea influenat de zgomot a semnului convenional punctual a
crei reprezentare
raster este imaginea f. Pragul se alege experimental, n funcie
de rezoluia la care a fost scanat imaginea i de mrimea zgomotului,
astfel nct s nu existe ambiguiti.Figura 5-9. Semne convenionale
punctuale.
Imaginea din figura 5-9 a fost analizat cu algoritmul propus,
toate semnele convenionale fiind recunoscute. Programul RecSCP care
implementeaz acest algoritm determin codul, respectiv punctul legat
al fiecrui semn convenional punctual identificat. Dup identificarea
semnului convenional punctual programul scrie n baza de date
cartografic coordonatele punctului legat corespunztor simbolului i
codul acestuia. Se poate determina i orientarea diferitelor semne
convenionale punctuale prin construcia unor imagini ideale ale
acestora, pentru diferite unghiuri de rotaie. Algoritmul de
recunoatere automat a formei semnelor convenionale punctuale este
uor de implementat, iar viteza de analiz pentru o clas de obiecte
este independent de gradul de ncrcare al imaginii [Alexei, 2004d].
Pentru a mri viteza, se poate adopta soluia de a se indica cu
ajutorul unui locator coordonatele aproximative ale elementului,
iar algoritmul gsete coordonatele precise i codul asociat. Este
necesar s se realizeze o baz de date care conine reprezentarea
matricial a semnelor convenionale punctuale, codul fiecrui semn i
descrierea acestuia. n baza de date sunt memorai i parametrii de
recunoatere pP,
respectiv pM, determinai experimental pentru fiecare semn
convenional punctual n parte. Baza de date cu simboluri permite
adugarea unor noi semne convenionale punctuale, precum i
actualizarea celor existente. De asemenea, este util stocarea
formei simbolurilor pentru diferite rezoluii i unghiuri de rotaie
(unde este cazul) pentru a mri viteza de analiz.CAPITOLUL 6. SURSE
DE ERORI N SIG
34
6. SURSE DE ERORI N SIGHarta este un model bidimensional, la
scar, a unei pri din suprafaa pmntului. Hrile reprezint mijloace
eficiente de prezentare (n general cu ajutorul unor simboluri) a
unei cantiti mari de informaii despre obiecte, fenomene i despre
relaiile dintre acestea. 6.1 Precizia hrilor Precizia hrilor a fost
analizat i definit n mod diferit. Precizia se refer la
corectitudinea relativ a poziiei obiectelor pe o hart fa de poziia
lor real pe suprafaa pmntului. Precizia absolut se refer la nivelul
de exactitate a poziiei obiectului. Precizia absolut este dat de
eroarea estimat pentru un singur punct, relativ la un sistem de
referin spaial (Krasovski, WGS84 etc.). Precizia relativ este dat
de eroarea estimat pentru o distan ntre dou puncte, sau precizia
unui punct n comparaie cu alt punct. Dac erorile a dou puncte nu
sunt corelate, eroarea relativ este eroarea medie ptratic a
erorilor absolute ale punctelor.
Precizia unei hri digitale nu depinde de scara de afiare. Ea
depinde de precizia datelor originale utilizate, de algoritmii de
prelucrare i de rezoluia la care este tiprit sau afiat harta. n
cazul digitizrii unei hri analogice, rezultatul digitizrii nu poate
fi mai precis dect sursele originale [Alexei, 2004a]. n alctuirea
hrilor digitale intervin patru tipuri de erori: - eroarea de
poziie; - eroarea atributelor (datelor tematice); - eroarea
conceptual; - eroarea de consisten. 6.1.1 Eroarea de poziionare
Eroarea de poziionare reprezint deplasarea unui obiect pe hart fa
de poziia sa real din teren. n instruciunile de realizare a hrilor
topografice se specific o precizie planimetric a detaliilor de 0,4
mm la scara hrii cu un nivel de ncredere (1 )=95% (probabilitatea
de 0,95). Aceast precizie pentru harta 1:25.000 reprezint 10 m n
teren. Pentru estimarea preciziei, se folosete eroarea medie
ptratic - relaia (6.1). Precizia se raporteaz ca o valoare n metri,
cu un nivel de ncredere deCAPITOLUL 6. SURSE DE ERORI N SIG
35
95%, ceea ce nseamn c 95% din elementele bazei de date au o
poziie ce respect precizia raportat.
( )21 n ic i
VV n
=
=
(6.1) unde: Vi - valorile msurate; Vc - valorile adevrate a lui
i V ; n - numrul de msurtori. 6.1.2 Eroarea atributelor (datelor
tematice) n timp ce poziia elementelor nu se modific n timp,
atributele se pot schimba frecvent. Precizia atributelor se
analizeaz n diferite moduri n funcie de natura datelor: - pentru
valori continue ale atributelor, precizia este exprimat ca eroare
de msurare (evaluarea preciziei se face prin metode asemntoare
determinrii preciziei de poziionare); - pentru valori discrete ale
atributelor, precizia este exprimat ca eroare de clasificare.
Evaluarea preciziei de clasificare este influenat de numrul de
clase definite n baza de date. 6.1.3 Eroarea conceptual Eroarea
conceptual se refer la erorile de omitere a informaiilor din baza
de date i este definit de gradul de generalizare i abstractizare
(omiterea selectiv). Cea mai generalizat baz de date poate fi
considerat complet dac conine toate obiectele descrise n
specificaii. Precizia conceptual d o informaie utilizatorului
despre volumul disponibil de date spaiale, temporale i tematice.
Eroarea conceptual este influenat de scar, generalizarea
elementelor bazei de date i regulile de selecie a elementelor i
fenomenelor care sunt stocate n baza de date. 6.1.4 Eroarea de
consisten
Eroarea de consisten se refer la contradiciile aparente dintr-o
baz de date geografic. Precizia de consisten reprezint o msur a
validitii interne aCAPITOLUL 6. SURSE DE ERORI N SIG
36
bazei de date. Se pot distinge mai multe tipuri de consisten a
bazei de date: - consistena spaial se refer la respectarea
regulilor topologice (de exemplu grania comun a dou poligoane
trebuie s coincid); - consistena temporal reprezint faptul c,
ntr-un punct, la un moment dat, nu poate exista dect un singur
eveniment; - consistena tematic (a atributelor) se refer la lipsa
contradiciilor din datele tematice (stocnd date despre numrul de
locuitori, suprafaa localitilor i densitatea populaiei, pot aprea
erori datorit redundanei informaiilor; redundana atributelor este o
cale pentru asigurarea consistenei bazei de date); - consistena
logic se refer att la aspecte topologice, ct i la validitatea
domeniului de definiie al datelor stocate n bazele de date. 6.2
Surse de erori Spre deosebire de geodezie, cartografie i
fotogrammetrie, pn n ultimii ani s-a acordat o importan mai mic
preciziei datelor SIG. Se tie c datele conin erori sistematice i
erori aleatoare, dar nu s-a accentuat asupra felului cum
procedurile i soluiile SIG in seama de aceste erori. O bun tratare
a acestei probleme permite alegerea celor mai bune surse de date,
alegerea celor
mai corecte metode de culegere a datelor i alegerea celor mai
corecte proceduri de prelucrare i de realizare a produselor finale.
n SIG sunt combinate mai multe tipuri de date din mai multe surse.
n funcie de sursele erorilor, acestea se clasific astfel: 1. erori
datorate surselor de date: - erori datorate aparatelor de culegere
a datelor; - erori datorate materialelor cartografice: vechimea
datelor; imprimarea (tiprirea); deformarea materialului
cartografic; scara hrii; tipul proieciei; generalizarea i
clasificarea cartografic; - erori datorate schimbrilor
fizico-geografice ale mediului; - erori datorate definirii
granielor; 2. erori datorate introducerii datelor: - erori datorate
digitizrii; - erori datorate scanrii;CAPITOLUL 6. SURSE DE ERORI N
SIG
37
- erori datorate operatorului; 3. erori datorate metodelor i
algoritmilor de prelucrare: - erori numerice; - erori date de
densitatea datelor; - erori datorate combinrii datelor; - erori
datorate interpretrii cartografice; - erori datorate conversiilor;
- erori de prelucrare propriu-zis (generarea topologiei,
georefereniere etc.). 6.3 Verificarea preciziei datelor spaiale
Toate sursele de date i metodele de introducere a datelor spaiale
prezint erori. Tipul, mrimea i implicaiile acestor erori inerente
ntr-o baz de date a unui sistem informaional determin precizia
datelor spaiale. Este imposibil s se elimine complet erorile
datelor spaiale, dar utilizatorii SIG pot reduce i
administra n mod eficient erorile, mbuntind astfel precizia
datelor. Identificarea i evaluarea erorilor nu sunt singurii
factori care determin precizia datelor. Precizia datelor include
toate procesele implicate n crearea, dezvoltarea, utilizarea i
actualizarea bazei de date spaiale. Verificarea preciziei datelor
spaiale este esenial pentru schimbul i integrarea datelor. Datele
geografice i non-geografice trebuie verificate n scopul asigurrii
preciziei impuse bazei de date a SIG. Msurtorile calitii datelor
verific precizia de poziie, a atributelor, conceptual i cea de
consisten. Testarea calitii datelor se poate face prin metode
manuale sau automate. Metodele de verificare manual includ imprimri
de control, msurtori n teren i teste statistice. Imprimarea de
control presupune trasarea datelor geografice la aceeai scar ca
materialul cartografic surs. Dup imprimarea hrii digitale, aceasta
se suprapune peste harta surs i se verific att poziia elementelor,
ct i inscripiile i simbolistica caracteristicilor. Dei aceast metod
este rapid i puin costisitoare, este de preferat verificarea prin
msurtori n teren. Metodele de verificare automat caut
incompatibilitile logice i valorile atributelor care nu respect
domeniul de definiie. Incompatibilitile logice se determin prin
verificarea topologiei (de exemplu, un strat de poligoane trebuie s
conin doar poligoane nchise). Pentru verificarea atributelor este
necesar s
se cunoasc modul de clasificare a acestora. Este greu de obinut
un consens din partea comunitii SIG pentru dezvoltarea de standarde
care s clasifice datele spaiale. Acest fapt depinde de necesitile
utilizatorului.CAPITOLUL 6. SURSE DE ERORI N SIG
38
Metodele automate se pot executa de ctre majoritatea pachetelor
de programe SIG (ArcInfo, MapInfo, AutoCAD Map etc.). Aceste metode
sunt rapide, dar rezultatele sunt mai puin exacte dect n cazul
metodelor manuale. Precizia datelor trebuie pstrat n toate stadiile
realizrii unei baze de date SIG, mai ales n timpul culegerii i
actualizrii. Orice tip de prelucrare asupra datelor afecteaz
precizia acestora. 6.3.1 Testarea preciziei de poziie Precizia de
poziie se testeaz prin compararea coordonatelor unor puncte de
control din baza de date cu coordonatele acelorai puncte extrase
din surse independente, de nalt precizie, cum ar fi: - hri la scri
mai mari; - msurtori n teren cu ajutorul receptoarelor GPS; -
nregistrri satelitare i fotogrammetrice. Minim 20 de puncte de
control trebuie testate, distribuia acestora acoperind zona de
interes. Testarea a 20 de puncte cu un nivel de ncredere de 95%
nseamn c doar un singur punct dintre acestea poate s aib precizia
mai slab dect specificaiile impuse. Punctele de control trebuie s
fie mai dense n vecintatea elementelor importante [Serediuc, 1997].
a) Precizia planimetric. Eroarea medie ptratic pe cele dou axe se
determin cu relaiile2
,, 1
()n date i control i i x
xx n
=
=
2 ,, 1
(6.2) ()n date i control i i y
yy n
=
=
(6.3) unde: - xdate,i , ydate,i - coordonatele punctelor de
control din baza de date; -xcontrol,i , ycontrol,i - coordonatele
punctelor de control din surse independente de precizie mare; - n -
numrul de puncte de control. Eroarea planimetric a unui punct Pi
este definit de relaiaCAPITOLUL 6. SURSE DE ERORI N SIG
39
( )2( )2xdate,ixcontrol,i +ydate,i ycontrol,i (6.4) Eroarea
medie ptratic n plan este dat de formula
(( ) ( ) )2 2 ,,,, 122
n date i control i date i control i i rxy
xxyy n
=
+ ==+
(6.5) Dac x y = atunci relaia (6.5) devine r= 2x2=
2y2=1.4142x=1.4142y (6.6) Relaiile (6.2)(6.6) sunt valabile dac se
consider c au fost eliminate erorile sistematice. Dac erorile au o
distribuie normal i componentele acestora pe cele dou axe de
coordonate sunt independente, atunci se poate folosi valoarea
2.4477 pentru calculul preciziei planimetrice cu un coeficient de
ncredere de 95% [Greenwalt, 1968] Pr 2.4477 2.4477 2.4477
1.4142r
eciziar x y
=== Preciziar=1.7308r (6.7) Dac x y i dac raportul min max are
valori ntre 0.6 i 1 (unde min este valoarea minim dintre x i y , i
max valoarea maxim) atunci eroarea planimetric cu un coeficient de
ncredere de 39.35% poate fi aproximat cu 0.5 x + y [Greenwalt,
1968]. Dac eroarea respect distribuia normal i componentele sale pe
cele dou axe sunt independente,
(
)
atunci precizia planimetric se calculeaz cu formula Pr eciziar
2.44770.5 x+ y (6.8) b) Precizia altimetric. Eroarea medie ptratic
pe axa z se determin cu relaia
(
)
( )2
,, 1 n date i control i i z
zz n
=
=
(6.9)40CAPITOLUL 6. SURSE DE ERORI N SIG
unde: - zdate,i - coordonata z a punctelor de control din baza
de date; - zcontrol,i - coordonata z punctelor de control din surse
independente cu precizie mare; - n - numrul de puncte de control.
Relaia (6.9) este valabil dac se consider c au fost eliminate
erorile sistematice. Dac eroarea altimetric respect distribuia
normal, factorul 1.9600 este folosit pentru calculul preciziei pe
vertical cu coeficientul de ncredere de 95% [Greenwalt, 1968]: Pr
eciziaz=1.9600z (6.10) Coeficientul de ncredere de 90% a fost
folosit n vechiul Standard de precizie pentru hri din SUA, actual
se folosete coeficientul de 95%. Coeficientul de ncredere de 50%
este utilizat n unele aplicaii militare. La noi
n ar se folosete standardul de precizie cu coeficientul de
ncredere de 95%. Indicatori de precizie pentru elemente liniare
Precizia geometric a unui element liniar poate fi descompus n dou
componente: - precizia de poziie a punctelor (n general se face o
analiz a preciziei pentru punctele de capt ale elementului liniar);
- fidelitatea formei (aceasta se analizeaz n raport cu elementul
liniar corespondent obinut din surse cu precizie ridicat). Factorul
fuzzy (FF). Se construiete un cerc de raz r n nodul de capt al
elementului de verificat i cercul de raz r corespondent n nodul de
capt al elementului de referin (vezi figura 6-1). Factorul fuzzy se
determin cu formula2 comun
FF S
r
= (6.11) unde:22
22 24
s comun s
S r R r R = (6.12) arccos 22 sR r
=
(6.13)CAPITOLUL 6. SURSE DE ERORI N SIG
41 Figura 6-1. Determinarea factorului FF.
innd seama de relaiile (6.12) i (6.13) relaia (6.11) devine2 2
2
1arccos 2 24 FF Rs Rs r Rs rr = (6.14) unde: s R - distana
dintre nodurile de capt corespondente; r raza cercului de analiz
(se poate considera precizia hrii).Figura 6-2. Determinarea
suprafeei comune.
Factorul FF poate lua valori ntre 0 i 1 (0 cazul cel mai
defavorabil, 1 punctele coincid). Factorul de deformare (DF). Acest
factor d o informaie despre gradul de fidelitate al formei
elementului liniar verificat. Se consider elementele B0BnCAPITOLUL
6. SURSE DE ERORI N SIG
42
i A0An de lungime 1. Fie i B un punct al elementului B0Bn i
corespondentul su Ai aparinnd elementului de referin A0An , astfel
nct00 00 ii nn
AA BB AA BB = unde i(0,n) (6.15) Ai1Ai AiAi+1 = respectiv Bi1Bi
BiBi+1 = (6.16)Figura 6-3. Factorul de deformare.
Factorul de deformare se calculeaz cu formula22 00 nn ii
11 xy DF nn==
= + ++
(6.17) Dac cele dou elemente liniare se suprapun, atunci
factorul de deformare este zero. Factorul de generalizare (GF) d o
informaie global despre forma elementului liniar. Factorul de
generalizare se calculeaz cu formula: ( ' ') () GF lungime A B
lungime AB = (6.18)CAPITOLUL 6. SURSE DE ERORI N SIG
43 Figura 6-4. Factorul de generalizare.
Factorul de deplasare (BF). Acest factor d o informaie despre
forma elementului liniar. Se calculeaz suma deplasrilor spre
dreapta i suma deplasrilor spre stnga (figura 6-5).Figura 6-5.
Factorul de deplasare.
Dac dSi = 0 i 0 dDi = nu exist deplasare. Dac 0 dSi = i 0 dDi
exist deplasare n dreapta. Dac 0 dSi i 0 dDi = exist deplasare n
stnga.
Dac 0 dSi i 0 dDi atuncii
i
S D
d BF d = (6.19) Msurarea preciziei de poziionare pentru un
element liniar (metoda buffer-ului). Metoda face o comparaie
automat a elementului de interes cu elementul corespondent din
surse de precizie nalt, estimnd procentul din lungimea total a
segmentului care respect precizia impus. Aceast metod are
urmtoarele avantaje: - are la baz metode statistice;CAPITOLUL 6.
SURSE DE ERORI N SIG
44
- este invariant la mrimea erorilor; - nu necesit gsirea unor
vertexuri corespondente ntre cele dou elemente. n figura 6-6 este
prezentat un exemplu de analiz pentru o poriune dintrun drum. Se
construiete un buffer de dimensiune x (precizia impus) n jurul
elementului liniar de referin i se determin lungimea elementului de
testat ce se afl n buffer printr-o simpl operaie de
intersecie.Figura 6-6. Verificarea preciziei de poziionare prin
metoda buffer-ului.
Fie AA elementul liniar de analizat i BB elementul liniar de
referin, atunci corectitudinea elementului AA este dat de formula
(6.20). QBB' - buffer-ul elementului liniar BB ( ') 100 ( ' ')% (
')
Corectitudinea AA lungimea AA QBB lungimea AA = (6.20) 6.3.2
Testarea preciziei atributelor O msur a preciziei de clasificare
este coeficientul Kappa (K) a lui Cohen [Niu, 2002]. Pentru o zon
dat, se construiete o matrice n x n elemente, unde n reprezint
numrul de clase ale SIG. Pentru completarea matricei se parcurg
urmtorii pai: - se alege un numr de detalii la ntmplare; - se
determin clasa din care fac parte conform bazei de date SIG; - se
determin clasa prin verificare la teren; - se completeaz matricea
R. Ideal, toate elementele din baza de date fiind clasificate
corect, se va completa doar diagonala principal a
matricei.CAPITOLUL 6. SURSE DE ERORI N SIG
45
O eroare de omitere apare atunci cnd un detaliu din teren este
nregistrat n baza de date incorect. Numrul de elemente aparinnd
clasei X nregistrate incorect se determin, folosind matricea R,
prin nsumarea elementelor coloanei corespunztoare clasei X, mai
puin elementul de pe diagonala principal. O eroare de nregistrare n
plus apare atunci cnd un element nregistrat n baza de date a SIG nu
are corespondent la teren. Numrul de elemente nregistrate n plus
pentru clasa Y se determin prin nsumarea elementelor de pe linia
corespunztoare clasei Y, mai puin elementul de pe diagonala
principal. Coeficientul Kappa se determin cu formula
() ()
dq K Nq = (6.21)
unde: - d reprezint suma elementelor de pe diagonala principal;
- N reprezint suma tuturor elementelor matricei; - q reprezint
valoarea scontat pentru fiecare element al diagonalei principale i
se calculeaz cu formula (6.22).i,j j,i jj i
rr q N =
(6.22)
unde r este un element al matricei R. Fie matricea R din tabelul
6-1 corespunztoare claselor din figura 6-7.Tabelul 6-1. Matricea R
corespunztoare claselor analizate.
Pdure Localiti Lacuri Total Eroarea de utilizare Pdure 6 2 1 9
6/9=67% Localiti 0 7 0 7 7/7=100% Lacuri 0 2 3 5 3/5=60% Total 6 11
4 21 Eroarea de producere 6/6=100% 7/11=64% 3/4=75% Precizia global
(pG) se calculeaz prin raportul dintre suma elementelor
clasificate corect (valorile elementelor diagonalei principale)
i numrul total de elemente (suma tuturor elementelor
matricei)CAPITOLUL 6. SURSE DE ERORI N SIG
46, ,
6 7 3 0.76 21ii i G ji ji
r p r ++ ===
(6.23) unde: rj,i - element al matricei R.Figura 6-7.
Clasificarea elementelor. Precizia de utilizare ( ) u p reprezint
probabilitatea ca un
element clasificat ntr-o categorie din baza de date a SIG s aib
corespondent la teren. Aceast precizie se calculeaz prin raportul
dintre valoarea elementului din diagonala principal a matricei R i
suma elementelor din coloana corespunztoare, ,i
ii u ij j
r p r =
(6.24)
Precizia de producere ( pp ) reprezint raportul dintre numrul de
elemente dintr-o clas clasificate corect i numrul total de elemente
din clasa respectiv, ,i
ii p ji j
r p r =
(6.25) Este de ateptat ca precizia atributelor s varieze n
cadrul unei hri n format digital, de aceea este util s se determine
o variaie spaial a probabilitii de clasificare, nu doar o statistic
sumar. 6.4 Propagarea i cumularea erorilor n SIG De obicei, un
sistem informaional geografic conine mai multe seturi de date care
sunt combinate, comparate i analizate. Este puin probabil ca
informaiile coninute n fiecare strat s aib aceeai
precizie.CAPITOLUL 6. SURSE DE ERORI N SIG
47
Fie f modelul matematic de combinare a dou seturi de date a i b.
Eroarea f a funciei f este afectat de erorile setului a, respectiv
b. Considernd c cele dou seturi de date sunt independente i
afectate doar de erori aleatoare, eroarea funciei f se calculeaz cu
formula22 22 fab
ff ab
= + (6.26) unde: f - eroarea standard a funciei f; a,b -
deviaiile standard ale seturilor de date a i b. Dac se consider f
=a+b sau f =ab, atunci relaia (6.26) devine22
f = a+b (6.27)
De aici rezult c precizia datelor combinate este mai mic dect
precizia fiecrui set n parte. 6.4.1 Propagarea erorilor Propagarea
apare atunci cnd o eroare duce la alt eroare. De exemplu, dac un
strat cu puncte de control conine un punct eronat (a fost cules de
pe o hart la scar mic) i acest strat este folosit la
georeferenierea altuia, atunci cel de-al doilea strat propag
eroarea din primul. O singur eroare poate conduce la alte erori i
se poate rspndi pn va afecta ntreaga baz de date a SIG 6.4.2
Cumularea erorilor Cumularea nseamn c erorile i imprecizia
informaiilor distorsioneaz soluia dat de un sistem informatic
geografic cnd informaiile sunt combinate selectiv n straturi noi.
Efectul cumulrii erorilor poate fi foarte greu de prevzut, acesta
putnd fi aditiv sau multiplicativ i depinde de modul de combinare a
informaiilor. Din acest motiv este necesar s se determine influena
cumulrii pentru diferite soluii date de SIG. De asemenea, este
foarte important s se determine efectul asupra datelor de poziie,
ct i asupra atributelor.
Un numr foarte mare de factori poate cauza erori. O parte dintre
aceste surse de erori poate avea un efect cumulativ: Toate aceste
erori prezentate pot avea un efect cumulativ i pot contribui ntr-un
mod negativ la rezultatul unei analize SIG.CAPITOLUL 7. STUDII I
CERCETRI EXPERIMENTALE
48
7. STUDII I CERCETRI EXPERIMENTALEPentru a demonstra
posibilitatea culegerii automate i semiautomate a datelor
cartografice, precum i pentru a arta beneficiile utilizrii
metodelor propuse, am realizat mai multe programe i le-am aplicat
pentru foaia de hart L-35-87-B la scara 1: 50.000. Culegerea
datelor cartografice prin metodele propuse s-a fcut att pentru
foaia de hart, ct i pentru originalele de editare separate pe
culori ale acesteia. Foaia de hart aleas pentru studiul de caz
cuprinde o zon muntoas din judeul Braov. Relieful din aceast zon
este destul de accidentat, cotele variind ntre 540 m i 1920 m.
Procesul tehnologic de culegere a datelor cartografice este
prezentat n figura 7-1.Figura 7-1. Procesul tehnologic de culegere
a datelor cartografice.
n cazul n care nu se dispune de originalele de editare separate
pe culori, dup scanarea hrii apar etape suplimentare necesare
separrii pe culori i preprocesrii. De calitatea separrii pe culori
a hrii scanate depinde calitateaCAPITOLUL 7. STUDII I CERCETRI
EXPERIMENTALE
49
vectorizrii automate i implicit volumul de munc necesar editrii
i corectrii datelor culese. n cazul n care nu se poate face o
separare corect pe culori, este
de preferat s se foloseasc o metod manual de culegere a datelor.
7.1 Testarea scanerului CONTEX Chameleon TX Se cunoate faptul c
nici scanerele cele mai performante nu sunt scutite de erori.
Pentru a obine o imagine raster ct mai puin afectat de erori
geometrice i radiometrice sunt necesare metode de testare i
calibrare a scanerului [Alexei, 1997b]. Pentru determinarea
preciziei de scanare s-a folosit o gril pe film de dimensiune 18 cm
x 15 cm, cu pasul de un centimetru. Coordonatele nodurilor grilei
au fost msurate la STECOMETRU cu o precizie de 0.001 mm. Grila a
fost scanat cu rezoluia optic maxim de 800 dpi, n dou culori,
rezultnd un fiier BMP de 7.573 Mb. Comparnd dimensiunea grilei
nainte de scanare cu dimensiunea grilei dup scanare se obine
deformarea introdus de scanner. Cumulnd erorile pe cele dou axe se
obine valoarea absolut a deformrii datorate scanrii. Se observ din
figura 7-2 c sunt zone mici unde deformarea depete valoarea de 0.1
mm. Deformarea medie este 0.053 mm la scara hrii (figura 7-3).
Aceast deformare medie, pentru harta la scara 1: 50.000, reprezint
2.65 m i este mult mai mic dect eroarea grafic.Figura 7-2. Eroarea
total rezultat n urma scanrii.CAPITOLUL 7. STUDII I CERCETRI
EXPERIMENTALE
50 Figura 7-3. Estimatorii statistici ai deformrii totale
rezultate n urma scanrii.
7.2 Rectificarea imaginii scanate Rectificarea este procesul de
transformare a datelor dintr-un sistem reea
n alt sistem reea utiliznd o transformare polinomial de grad n.
Deoarece pixelii din noua reea pot s nu se alinieze cu pixelii din
reeaua original, acetia trebuie s fie reeantionai. Rectificarea
este necesar n cazurile n care reeaua de pixeli a imaginii trebuie
modificat astfel nct s se adapteze la un sistem de proiecie
cartografic sau la o imagine de referin. Rectificarea se face n
urmtoarele cazuri: - comparaiile pixel cu pixel n aplicaii de
detectare a modificrilor; - dezvoltarea bazelor de date SIG; -
crearea unor fotohri; - suprapunerea unor date vectoriale peste
date raster; - compararea imaginilor aflate iniial la scri
diferite; - realizarea unor analize ce necesit locaii geografice
exacte; - determinri de distane, arii etc. pe hri raster. n timpul
rectificrii se poate pierde ceva din integritatea spectral a
datelor. O imagine nerectificat este mai corect din punct de vedere
spectral, comparativ cu o imagine rectificat. Georeferenierea se
refer la procesul de atribuire a coordonatelor sistemului geodezic
terestru datelor imagine. Datele imagine pot fi deja pe planul
dorit, nefiind ns raportate la sistemul de coordonate adecvat.
Georeferenierea, prin ea nsi, presupune schimbarea doar a
informaiilor privind coordonatele cartografice n fiierul de
imagine. Reeaua de pixeli nu se modific.CAPITOLUL 7. STUDII I
CERCETRI EXPERIMENTALE
51
Reeantionarea este procesul de extrapolare a valorilor datelor
pentru pixelii dintr-o reea nou obinut n urma procesului de
rectificare, de la valorile pixelilor surs. Cele mai folosite
metode de reeantionare sunt: - metoda celui mai apropiat vecin -
utilizeaz valoarea pixelului cel mai apropiat pentru a atribui
valoarea de ieire a pixelului; - interpolarea biliniar - se
folosete o fereastr 2 x 2 pixeli pentru a calcula valoarea de ieire
a pixelului (se folosete o funcie biliniar); - nfurata cubic -
utilizeaz valorile a 16 pixeli dintr-o fereastr 4 x 4 pentru a
calcula valoarea de ieire a pixelului cu o funcie cubic. Am
realizat programul software MapGEO (figura 7-4) pentru rectificarea
hrilor scanate. Programul a fost scris n limbajul Delphi 7.0 i
permite rectificarea imaginilor n format BMP cu 256 culori.Figura
7-4. Interfaa programului MapGEO.
Pentru rectificarea imaginilor scanate, programul MapGEO pune la
dispoziie transformrile conform, afin i biliniar. n cazul n care
numrul de puncte de control este mai mare dect numrul de puncte
necesar pentru determinarea coeficienilor transformrii, se
calculeaz eroarea medie ptratic n fiecare punct. Coordonatele
punctelor de control se pot introduce att de laCAPITOLUL 7. STUDII
I CERCETRI EXPERIMENTALE
52
tastatur, ct i prin identificare i punctare pe alte hri raster
sau vector ce sunt importate de program.
Grila scanat, folosit pentru testarea scanerului CONTEX
Chameleon TX, s-a rectificat pentru a determina deformrile
introduse de acest proces. Deformarea total dup rectificare este
prezentat n figura 7-5. Se observ c sunt puine locuri unde
deformarea depete 0.1 mm.Figura 7-5. Deformarea total dup
rectificare.
Deformarea maxim obinut dup scanarea i rectificarea grilei este
de 0.136 mm, media deformrilor fiind de 0.046 mm. De asemenea se
observ c numrul punctelor n care deformarea depete 0.1 mm este
foarte mic.Figura 7-6. Estimatorii statistici ai deformrii totale
dup rectificare.CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE
53
n urma procesului de rectificare, sunt zone n imagine unde
deformarea a crescut (figura 7-7). Se observ c deformarea s-a
micorat n marginile imaginii, n apropierea punctelor de control,
mrindu-se spre centru.Figura 7-7. Evoluia deformrilor dup
rectificare.
n figura 7-8 sunt prezentate deformrile dup scanare respectiv
dup rectificare. Se observ c, dup procesul de rectificare, nu mai
apar deformri mai mari de 0.15 mm.Figura 7-8. Deformrile dup
scanare respectiv dup rectificare.CAPITOLUL 7. STUDII I CERCETRI
EXPERIMENTALE
54
n tabelul 7-1 sunt prezentai indicatorii statistici ai
deformrilor rezultate n urma procesului de scanare, respectiv
rectificare. Se observ c eroarea maxim dup rectificare este mai mic
dect eroarea rezultat din scanare (0.136 mm comparativ cu 0.180
mm). De asemenea, valoarea medie a erorii s-a
micorat la 0.046 mm, comparativ cu 0.053 mm dup scanare.Tabelul
7-1. Indicatorii statistici ai deformrilor dup scanare respectiv
dup rectificare.
Deformri dup scanare [mm] Deformri dup rectificare Indicator
statistic [mm] x y Total x y Total Valoare maxim 0,1304 0,1247
0,1805 0,1093 0,1133 0,1361 Valoare medie 0,0265 0,0202 0,0536
0,0002 0,0000 0,0467 Deviaia standard 0,0446 0,0258 0,0299 0,0458
0,0283 0,0267 7.3 Culegerea datelor cartografice cu ajutorul
algoritmilor propui Pentru vectorizarea automat prin metoda
cercului am realizat programul Vect scris n Delphi 7.0 cu ajutorul
bibliotecii grafice MapObjects dezvoltat de ESRI. Aceast bibliotec
include funcii performante de vizualizare i gestiune a datelor
vector i raster. Programul folosete ca date de intrare un fiier
raster georefereniat n format BMP cu 256 culori. Rezultatul
vectorizrii este salvat ntr-un fiier n format ESRI Shape. Interfaa
programului de vectorizare este prezentat n figura 7-9.Figura 7-9.
Interfaa programului de vectorizare.CAPITOLUL 7. STUDII I CERCETRI
EXPERIMENTALE
55
Programul pune la dispoziie o fereastr de opiuni n care se pot
alege raza de analiz i modul de tratare a ntreruperilor dintr-un
element liniar. 7.3.1 Vectorizarea originalului de editare cu
relieful Originalul de editare cu relieful conine elemente liniare,
simboluri
punctuale, inscripii (valorile curbelor de nivel, nlimile
movilelor etc.) i rasterul de umplere a detaliilor ce reprezint
drumurile i localitile. Din aceast cauz apar erori de vectorizare.
Pentru a evita aceste probleme se poate cura imaginea raster de
surplusul de informaie naintea procesului de vectorizare sau se
poate adopta soluia editrii i corectrii post vectorizare.Figura
7-10. Vectorizarea prin dou metode a originalului de editare cu
relieful.
n figura 7-10 este prezentat o comparaie ntre rezultatul
vectorizrii prin metoda cercului, i, cu ajutorul programului
ArcInfo, a unei poriuni din originalul de editare cu relieful. Se
observ c rezultatele sunt comparabile. n cazul atingerii a dou
curbe de nivel apar erori de vectorizare, mai ales la digitizarea
hrii tiprite (figura 7-11). Deoarece culoarea de umplere pentru
elementele areale i liniare reprezentate prin 2 sau 3 linii
echidistante este aceeai cu cea a curbelor de nivel, aflndu-se
toate n acelai original de editare, apar erori de tipul celor din
figura 7-12. Cotele curbelor de nivel determin erori de vectorizare
de tipul celor din figura 7-13. Acest tip de erori poate fi evitat
printr-o editare preliminar a imaginii raster.CAPITOLUL 7. STUDII I
CERCETRI EXPERIMENTALE
56 Figura 7-11. Eroarea de vectorizare n cazul atingerii a dou
curbe de nivel. Figura 7-12. Eroarea de vectorizare datorit culorii
de umplere a localitilor. Figura 7-13. Eroarea de vectorizare a
curbelor de nivel datorit inscripiilor.
CAPITOLUL 7. STUDII I CERCETRI EXPERIMENTALE
57
Erorile de digitizare prezentate mai sus, rezultate n urma
procesului de vectorizare automat a originalulu