5.pielikums Valsts ieņēmumu dienesta rīkotā atklāta konkursa “Datu noliktavas sistēmas pilnveidošanas, uzturēšanas un garantijas nodrošināšana” nolikumam, iepirkuma identifikācijas Nr.FM VID 2014/033/ERAF Valsts ieņēmumu dienesta rīcībā esošās Datu noliktavas sistēmas apraksts Datu noliktavas sistēma — VID informācijas sistēma, kuras pamatuzdevums ir apkopot VID pieejamos datus no dažādiem datu avotiem integrētā informācijas glabātuvē, padarot tos pieejamus un piemērotus analīzei, tādējādi atbalstot efektīvu plānošanu un lēmumu pieņemšanu VID. DNS svarīgākie mērķi ir: aktuālās un vēsturiskās informācijas periodiska apkopošana no dažādiem, VID pieejamiem datu avotiem; liela apjoma datu glabāšana centralizētā, viegli pārvaldāmā DNS datubāzē; operatīva analītisko un statistikas datu apstrāde, dodot iespēju DNS reģistrētajiem lietotājiem izmantot gatavus standarta pārskatus, kā arī veidot pašiem savus pārskatus, izmantojot viņiem saprotamus biznesa jēdzienus; ārējiem lietotājiem paredzētās informācijas attēlošana; iekļauties VID esošajā IT infrastruktūrā, optimāli izmantojot pieejamos resursus; ērta pielāgojamība izmaiņām. Svarīgākie DNS ierobežojumi sistēmas arhitektūrai ir šādi: DNS dati tiek glabāti Sybase Adaptive Server IQ (Sybase IQ) 15.4 versijas datubāzē ar servera operētājsistēmu AIX. Tiek veikta pakāpeniska migrācija uz IBM PureData System for Analytics (Netezza) datubāzi; datu transformāciju procesi tiek izstrādāti ar DataStage 7.5.1.A versijas līdzekļiem vai SAP Data Services XI 3.2 līdzekļiem; dati tiek analizēti BO Desktop Intelligence un Web Intelligence dokumentos, izmantojot SAP BusinessObjects XI 3.1 programmatūras komponentes. DNS BO repozitorijā publicētie koplietošanas pārskati tiek glabāti Oracle Database 10g serverī. 1.1 Definīcijas un saīsinājumi Dokumentā lietotie apzīmējumi un saīsinājumi atšifrēti Tab.1. Tab. 1. Saīsinājums Skaidrojums AN Akcīzes nodoklis AP Akcīzes prece APARSK Akcīzes preču aprites risku informācijas analīzes sistēmas vide ASIS Audita atbalsta informācijas sistēma ASYCUDA++ (Automatized SYstem for CUstoms DAta) Muitas deklarāciju automatizētās apstrādes sistēma
21
Embed
Valsts ieņēmumu dienesta rīcībā esošās Datu noliktavas … · 2016-05-03 · 5.pielikums Valsts ieņēmumu dienesta rīkotā atklāta konkursa “Datu noliktavas sistēmas
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
5.pielikums
Valsts ieņēmumu dienesta rīkotā atklāta konkursa “Datu
noliktavas sistēmas pilnveidošanas, uzturēšanas un
garantijas nodrošināšana” nolikumam, iepirkuma
identifikācijas Nr.FM VID 2014/033/ERAF
Valsts ieņēmumu dienesta rīcībā esošās Datu noliktavas sistēmas
apraksts
Datu noliktavas sistēma — VID informācijas sistēma, kuras pamatuzdevums ir apkopot VID
pieejamos datus no dažādiem datu avotiem integrētā informācijas glabātuvē, padarot tos
pieejamus un piemērotus analīzei, tādējādi atbalstot efektīvu plānošanu un lēmumu
pieņemšanu VID.
DNS svarīgākie mērķi ir:
aktuālās un vēsturiskās informācijas periodiska apkopošana no dažādiem, VID
pieejamiem datu avotiem;
liela apjoma datu glabāšana centralizētā, viegli pārvaldāmā DNS datubāzē;
operatīva analītisko un statistikas datu apstrāde, dodot iespēju DNS reģistrētajiem
lietotājiem izmantot gatavus standarta pārskatus, kā arī veidot pašiem savus pārskatus,
izmantojot viņiem saprotamus biznesa jēdzienus;
ārējiem lietotājiem paredzētās informācijas attēlošana;
iekļauties VID esošajā IT infrastruktūrā, optimāli izmantojot pieejamos resursus;
ērta pielāgojamība izmaiņām.
Svarīgākie DNS ierobežojumi sistēmas arhitektūrai ir šādi:
DNS dati tiek glabāti Sybase Adaptive Server IQ (Sybase IQ) 15.4 versijas datubāzē
ar servera operētājsistēmu AIX. Tiek veikta pakāpeniska migrācija uz IBM PureData
System for Analytics (Netezza) datubāzi;
datu transformāciju procesi tiek izstrādāti ar DataStage 7.5.1.A versijas līdzekļiem vai
SAP Data Services XI 3.2 līdzekļiem;
dati tiek analizēti BO Desktop Intelligence un Web Intelligence dokumentos,
izmantojot SAP BusinessObjects XI 3.1 programmatūras komponentes.
DNS BO repozitorijā publicētie koplietošanas pārskati tiek glabāti Oracle Database
10g serverī.
1.1 Definīcijas un saīsinājumi
Dokumentā lietotie apzīmējumi un saīsinājumi atšifrēti Tab.1.
Tab. 1.
Saīsinājums Skaidrojums
AN Akcīzes nodoklis
AP Akcīzes prece
APARSK Akcīzes preču aprites risku informācijas analīzes sistēmas vide
ASIS Audita atbalsta informācijas sistēma
ASYCUDA++
(Automatized SYstem
for CUstoms DAta)
Muitas deklarāciju automatizētās apstrādes sistēma
2
Saīsinājums Skaidrojums
ĀLR Ārējo lietotāju reģistrs
BO SAP BusinessObjects Enterprise XI 3.1 pārskatu veidošanas un
analīzes programmatūra
CeDB NIS centralizētā datu bāze
CMIS Centrālā muitas informācijas sistēma
CSDD Valsts akciju sabiedrība „Ceļu satiksmes drošības direkcija”
CSP Centrālā statistikas pārvalde
DB Datubāze
DNS Datu noliktavas sistēma
DNSWS DNS Web servisu sistēma
DRN Dabas resursu nodoklis
EDS Elektroniskās deklarēšanas sistēma
EKS Eksporta kontroles sistēma
EM Ekonomikas Ministrija
EMCS
(Excise Movement
and Control System)
Akcīzes preču pārvietošanas un kontroles sistēma
ESKORT Datorizētā nodokļu maksātāju riska novērtēšanas sistēma
FP Fiziskā persona
FPRAS Fizisko personu riska analīzes sistēma
FTPS
File Transfer Protocol Secure - TCP/IP protokolu sistēmas aizsargāta
sastāvdaļa, kas ļauj tīkla lietotājiem apskatīt attālu datoru
direktorijus, nolasīt, pārsūtīt vai atjaunot to datnes, izmantojot SSL
datu šifrēšanu
IAS Informācijas apmaiņas sistēma
IIN (arī IeIeN) Iedzīvotāju ienākuma nodoklis
IS Informācijas sistēma
JP Juridiskā persona
KAC Klientu apkalpošanas centrs
KNAB Korupcijas novēršanas un apkarošanas birojs
LVM Akciju sabiedrība "Latvijas Valsts meži"
NIS Nodokļu informācijas sistēma
NLP EMCS nacionālā lietojumprogramma jeb galvenais modulis (GM)
NM Nodokļu maksātājs
NMDS Nodokļu maksātāju datu sistēma
NMR Nodokļu maksātāju reģistrs
NVA Nodarbinātības valsts aģentūra
PDB Publiskojamo datu bāze
PVN Pievienotās vērtības nodoklis
RD Rīgas dome
SDK
(Software
Development Kit)
Programmatūras izstrādes komplekts
3
Saīsinājums Skaidrojums
SQL
(Structured query
language)
Strukturētā vaicājumvaloda
UIN (arī UIeN) Uzņēmumu ienākuma nodoklis
UGFA Uzturlīdzekļu garantiju fonda administrācija
VAD Vienotais administratīvais dokuments
VADIS Valsts amatpersonu deklarāciju informācijas sistēma
VAS Valsts akciju sabiedrība
VID Valsts ieņēmumu dienests
VIDWS VID Web servisu sistēma
VMD Valsts meža dienests
VTUA Valsts tehniskās uzraudzības aģentūra
VVDZ Valsts vienotā datorizētā zemesgrāmata
WS Web servisu sistēma
1.2 DNS dekompozīcija
DNS sastāv no vairākām nozīmīgām sastāvdaļām, kuras kopā ar datu avotiem veido lēmumu
pieņemšanas atbalsta un informācijas apkopošanas un glabāšanas sistēmu (skat. Att. 1.).
4
Att. 1. DNS loģiskā arhitektūra
Zemāk ir aprakstītas DNS loģiskās arhitektūras sastāvdaļas, datu avotu un informācijas
lietotāju grupas.
Datu transformāciju procesi – DataStage un Data Services serveri veic datu
transformēšanu, izmantojot attiecīgo rīku iespējas.
Transformēšanas tehnoloģiskais process sastāv no trim daļām:
1. datu iegūšanas no VID datu avotiem;
2. datu sagatavošanas – datu pārveidošanas DNS datubāzei piemērotā formā, ņemot vērā
gala lietotāju izvirzītās prasības analizējamās informācijas noformēšanai, piemēram, visus
finanšu datus pārrēķināt latos, neesošu vērtību apzīmēt ar „Nezināms” u.tml.;
3. datu ielādes DNS datubāzē, kas atkarībā no situācijas tiek veikta vai nu sākotnējā jeb pilna
apjoma režīmā, vai arī periodiskā jeb izmaiņu režīmā.
DataStage serveris nodrošina 102 datu transformācijas procesus, Data Services serveris – 28
datu transformācijas procesus. Atsevišķi datu transformāciju procesi nodrošina citu VID IS
datu apmaiņu nepārnesot informāciju uz DNS.
DNS DB ir Sybase IQ datubāze, kurā ir apkopoti VID pieejamie dati iespējami zemākajā
detalizācijas līmenī.
BO analīzes sistēmas tiek izstrādātas ar BO lietojumprogrammu Universe Designer. Tajās
DNS lietotājiem saprotamos biznesa terminos tiek attēloti attiecīgo, analīzei paredzēto
BusinessObjects
DNS DB
DN
S W
eb
se
rvis
i
Da
tu t
ran
sfo
rmā
ciju
pro
ce
si
Analīzes
sistēmas
Pārskati
DNS lietotāji
Iekšējie lietotāji
Ārējie lietotāji
Asinhronā datu
apmaiņa
ASIS
EM
KNAB
NVA
Datu apmaiņa,
izmantojot
pieslēgumu DNS DB
Sinhronie VIDWS
datu pieprasījumi
VID iekšējie
datu avoti
CMIS
NIS
Citi iekšējie
datu avoti
VID ārējie datu
avoti
Faili
DB
ESKORT
APARSK
FPRAS
5
informācijas bloku dimensiju atribūti un fakti no DNS datubāzes, kas piedevām vēl tiek
sadalīti loģiskās grupās (klasēs), definējot dimensiju atribūtu hierarhijas un vērtību sarakstus,
kā arī norādot faktiem pielietojamās agregātfunkcijas.
BO pārskati – DNS BO repozitorijā publicētie koplietošanas pārskati, kas izstrādāti,
izmantojot kādu no BO pārskatu veidošanas un datu analīzes lietojumprogrammām,
respektīvi, Desktop Intelligence vai Web Intelligence.
DNS lietotāji– iekšējie un ārējie BO repozitorijā reģistrētie lietotāji, kas var piekļūt analīzes
sistēmām un koplietošanas pārskatiem viņiem definēto piekļuves tiesību un ierobežojumu
ietvaros.
DNS Web servisi – DNSWS saskarne asinhronas datu apmaiņas nodrošināšanai ar citām VID
IS vai ārējām organizācijām.
Asinhronā datu apmaiņa – izmantojot DNSWS saskarni, kas savienota ar VID Web servisu
sistēmu (VIDWS), tiek nodrošināta strukturētu (XML formāta) vai nestrukturētu (REP, PDF
vai XLS formāta) datu nodošana ASIS, kā arī šādām ārējām organizācijām: EM, KNAB un
NVA.
Datu apmaiņa, izmantojot pieslēgumu DNS DB – tiek izmantota VID FPRAS, APARSK
un ESKORT datu apmaiņā ar DNS DB, lietojot atbilstošus transformāciju procesus, kā arī
sinhronos VIDWS/NMDS datu pieprasījumos, lietojot DB procedūras.
VID iekšējie datu avoti ir aprakstīti Tab 2.
Tab. 2.
Iekšējais datu avots Iekšējā datu avota apraksts
NIS CeDB Nodokļu informācijas sistēmas centralizētā datubāze
CMIS DB Centrālās muitas informācijas sistēmas datubāze
CMIS arhīva DB Centrālās muitas informācijas sistēmas arhīva datubāze
VADIS DB Valsts amatpersonu deklarāciju informācijas sistēmas datubāze
ASYCUDA++ DB Muitas deklarāciju automatizētās apstrādes sistēmas datubāze
ASYCUDA++ arhīva
DB
Muitas deklarāciju automatizētās apstrādes sistēmas arhīva datubāze
ES DSS DB Eiropas Savienības datu sagatavošanas sistēmas datubāze
IAS DB Informācijas apmaiņas sistēmas datubāze
EMCS NLP DB Akcīzes preču pārvietošanas un kontroles sistēmas nacionālās
lietojumprogrammas datubāze
EDS DB Elektroniskās deklarēšanas sistēmas datubāze
APARSK DB Akcīzes preču aprites risku datubāze
ESKORT DB Datorizētās nodokļu maksātāju riska novērtēšanas sistēmas datubāze
DNS audita DB Datu noliktavas sistēmas audita datubāze
WILOG BO audita datubāze
EKS DB Eksporta kontroles sistēmas datubāze
ĀLR DB Ārējo lietotāju reģistra datubāze
HORIZON DB HORIZON datubāze
EMDAS DB Elektroniskajā muitas datu apstrādes sistēms datubāze
6
VID ārējie datu avoti ir aprakstīti Tab. 3.
Tab. 3.
Ārējais datu avots Ārējā datu avota apraksts
CSDD DB Ceļu satiksmes drošības direkcijas uzturētā
transportlīdzekļu un to vadītāju valsts reģistra datubāze
VTUA DB Valsts tehniskās uzraudzības aģentūras traktortehnikas
reģistra datubāze
RD būvniecības datu faili Rīgas domes būvniecības dati XML formāta failu veidā
VVDZ nekustamo īpašumu datu
faili
Tiesu administrācijas Valsts vienotās datorizētās
zemesgrāmatas nekustamo īpašumu dati CSV formāta failu
veidā
EM būvniecības datu faili Ekonomikas Ministrijas būvniecības datu MS Excel
formāta failu veidā
LVM mežizstrādes datu faili Akciju sabiedrības "Latvijas Valsts meži" mežizstrādes
datu MS Excel formāta faili
VMD mežizstrādes datu faili Valsts meža dienesta mežizstrādes datu DBF formāta faili
NVA izsniegto licenču un
personu bezdarba periodu datu
faili
Nodarbinātības valsts aģentūras datu bāze (ar VIDWS
starpniecību)
1.3 DNS programmatūra
VID darbinieki ar ikdienas darba procesa atbalstam paredzēto lietojumprogrammu palīdzību
ievada un modificē datus VID operacionālo sistēmu datubāzēs, proti, NIS CeDB, CMIS DB,
un VID atbalsta funkciju veikšanai paredzēto sistēmu datubāzēs, tas ir, ESKORT DB, FPRAS
DB un APARSK DB. Papildus VID regulāri saņem datus no citām organizācijām, ar kurām ir
noslēgti attiecīgi sadarbības līgumi vai starpresoru vienošanās, piemēram, VAS CSDD,
VVDZ, AS LVM, Rīgas pilsētas būvvalde u.c., kā arī tiek nodrošināta datu apmaiņa ar tādām
VID informācijas sistēmām kā ASIS, FPRAS, APARSK, ESKORT un VIDWS/NMDS. Visi
iepriekš minētie dati tiek iegūti no avotu sistēmām, sagatavoti un ielādēti DNS datubāzē,
izmantojot speciālus datu transformāciju rīkus: DataStage un Data Services. Ar BO rīka
Universe Designer palīdzību, balstoties uz DNS datubāzes fizisko struktūru, katram
analizējamās informācijas blokam tiek izstrādātas atbilstošas analīzes sistēmas. DNS lietotāji
ar BO lietojumprogrammām var apkopot, analizēt un noformēt analīzes sistēmās esošo
informāciju sev vēlamā pārskata veidā, nosūtīt to citiem DNS lietotājiem, kā arī publicēt BO
repozitorijā.
1.3.1 DNS datubāze
Centralizētā DNS datubāze nodrošina visaptverošu, integrētu skatījumu uz VID vērtīgiem
datiem, piemēram, IIN, UIN, DRN, AN u.c.
DNS DB modelis, atbilstoši informācijas analīzes sistēmu labākajai praksei, ir veidots kā
savstarpēji saskaņotu zvaigžņu un sniegpārslu shēmu kopums, ievērojot dimensionālās
modelēšanas principus, proti, skaitliskās vērtības (fakti, mēri) tiek glabātas faktu tabulās, bet
faktus raksturojošās vērtības (dimensijas) tiek grupētas atbilstoši tematikai dimensiju tabulās.
Informācija faktu tabulās tiek uzkrāta atbilstoši datu avotos pieejamajam zemākajam
detalizācijas līmenim, piemēram, par katru pirmdokumentu rindu vērtību, un dažādi
informācijas agregācijas līmeņi tiek iegūti pārskatu gatavošanas brīdī.
7
1.3.2 DNS datu transformāciju procesi
Datu transformāciju procesus var uzskatīt par vienu no svarīgākajām DNS tehniskajām
sastāvdaļām, kurā tiek veikta datu iegūšana no dažādām avotu sistēmām, integrētas,
nepretrunīgas informācijas sagatavošana un ielādēšana DNS datubāzē.
DNS datu transformāciju procesi ir organizēti kategorijās (DataStage gadījumā) vai projektos
(Data Services gadījumā), kur katra kategorija vai projekts nosacīti atbilst DNS informācijas
blokam un tajā iekļautajām analīzes sistēmām.
1.3.3 DNS BO analīzes sistēmas
DNS analīzes sistēma ir semantisks slānis starp DNS datubāzi un gala lietotāju, kas ļauj gala
lietotājam strādāt ar vajadzīgo informāciju, neiedziļinoties DNS datubāzes datu modeļos un
pārvaldības sistēmas niansēs, kā arī neizmantojot datu pieprasījumu veidošanai SQL valodu,
bet gan ierastus jēdzienus un saprotamu attiecīgā biznesa terminoloģiju. DNS ir sadalīta šādās
analīzes sistēmās. (skat. Tab.4).
Tab.4
Analīzes sistēmas
nosaukums Analīzes sistēmas apraksts
Akcīzes datu atbilstības
Analīzes sistēma paredzēta datu salīdzināšanai no nodokļu