Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
UNIVERSIDAD TCNICA FEDERICO SANTA MARA
APUNTES DE ORGANIZACIN Y MANEJO DE ARCHIVOS
TCNICO UNIVERSITARIO EN COMPUTACIN E INFORMTICA
PROFESOR: MANUEL SAN MARTIN QUIROZ - 2001 -
Organizacin y manejo de archivos
1 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
CONTENIDO.1. Archivos. 1.1. Informacin. 1.1.1. Informacin.
1.1.2. Aspectos de la informacin en la organizacin de archivos.
1.2. Estructura_de_los_registros 1.2.1. Longitud fija. Bloqueados,
Des - bloqueados. 1.2.2. Longitud variable. Bloqueados, Des -
bloqueados. 1.2.3. Tipos_de_registros. (Datos, Auxiliares (OVF,
Rtulos, Verificacin, Control, cheek point) 1.3. Campos. 1.3.1.
Tipos_de_datos o campos en un registro. 1.3.2. Caractersticas de
los campos (longitud, clase, alineacin, relleno). 1.4. Procesos con
Archivos. 1.4.1. Definiciones. 1.4.2. Por lotes, en lnea. 1.4.3.
Caracterizacin_y categorizacin de los archivos. 1.4.4.
Creacin_y_mantencin_de_archivos 1.4.4.1. Respaldos 1.4.5.
Conceptos_sobre_archivos Volatilidad, actividad, tamao. 1.4.6.
Tipos_de_archivos (Maestros, Referencias, transacciones, paso,
informes). 1.4.7. Procesos_con_archivos Clasificacin, Intercalacin,
actualizacin, etc. 1.5. Soportes de hardware para archivos.
ORGANIZACIONES. 2.1. Archivos secuenciales. 2.1.1. Organizacin
secuencial 2.1.2. Diferentes tipos de archivos secuenciales. 2.2.
Archivos secuencial_indexado 2.3. Archivos VSAM. 2.4. Archivos de
organizacin directa. 2.4.1. Organizacin directa. 2.4.2. relativa
2.4.3. Organizaciones de multi listas. 2.5. Otras organizaciones de
archivos. 2.6. Bases de datos. EJERCICIOS
2.
3.
Organizacin y manejo de archivos
2 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
INTRODUCCIN.Este apunte tiene el objetivo de servir de apoyo a
los alumnos de la asignatura de Organizacin y manejo de archivo.
Esta asignatura es, tal vez, la ms importante en esta carrera, ella
da el perfil exacto que esperamos tengan nuestros alumnos cuando se
desempeen como profesionales. Se trata de darles el conocimiento y
la prctica sobre los archivos. Aqu, no es importante el lenguaje de
programacin, este pasa a ser una herramienta. Lo importante es que
el alumno aprenda a solucionar los problemas que diariamente se le
presentarn en las organizaciones donde labore: Entregar el informe
que no consideraba el SIA. Disear y programar la solucin para
extirpar partes de un archivo para entregrselo a un cliente o un
proveedor. Conocer como realizar filtros rpidos en archivos que no
son bases de datos. Convertir archivos de un software a otro.
Agregar un nuevo campo a un archivo. Etc. Adems, por cierto de las
tareas habituales de plantear y desarrollar el diseo fsico de un
SIA. Es importante hacer notar que el modelamiento de datos
realizado en el diseo lgico no tiene una correspondencia uno a uno
con los archivos que se tendrn en el diseo fsico. Es all donde
nuestro alumno debe proveer las soluciones que hagan ms eficaz el
SIA. Para entender a cabalidad el tema de archivos, comenzar con
las definiciones bsicas: Campo: Registro: Archivo:
Organizacin y manejo de archivos
3 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
INFORMACION Definicin.-
Es todo el material "registrado" o comunicado que tiene cierta
significacin asociada con una representacin simblica.
En este punto tal vez sea importante aclarar la diferencia entre
informacin y datos. Informacin es cuando un conjunto de datos
aporta al receptor un nuevo conocimiento, en cambio los datos es
aquello que no aporta un nuevo conocimiento al receptor. Es muy
frecuente escuchar que la informacin es el recurso ms preciado de
la organizacin, esto no es solo un decir, es realmente as. Para los
profesionales de la informtica este hecho tiene una gran
significacin puesto que la captura, almacenamiento, mantencin,
actualizacin y acceso de esta informacin esta encargada a los
profesionales de la informtica, o sea, a ustedes. La informacin en
la organizacin es la base de la toma de decisiones. Esta informacin
aporta los datos y hechos que se transformarn en alternativas
posibles y entregar los elementos de juicio necesarios para
resolver el problema decisional estableciendo las mejores
alternativas y elijiendo una.DECISIN DECISIN ACCIN INFORMACIN
INFORMACIN
ACCIN
DATOS
Fuentes de informacin. Cualquier elemento de datos puede
participar en la generacin de partes mltiples de informacin. Es
importante su flexibilidad para que puedan ser agregados y sumados
de tal manera que pueda producirse informacin til para apoyar las
decisiones oportunamente. Tambin algunos elementos de datos
resultan de acciones tomadas por fuerzas o cuerpos externos a la
organizacin, como, accin de competidores, requerimientos legales,
etc. Los datos deben ser manejados de tal manera que sean correctos
y estn disponibles para producir informacin; los aspectos que deben
considerarse son: Medicin, Coleccin, Transcripcin, Validacin,
Organizacin, Almacenamiento, Agregacin, Actualizacin, Recuperacin,
Proteccin. La informacin no es el nico elemento en la toma de
decisiones, tambin esta:
Organizacin y manejo de archivos
4 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
-
El objetivo (debe tenerse claro). Prediccin (para tener cierto
grado de seguridad en la decisin). Evaluacin. Se debe disponer de
procedimientos para calificar cada alternativa.
En cunto a la informacin: Esta debe proveer los antecedentes de:
Situacin actual. Situacin a alcanzar. Recursos para resolver el
problema (estadsticos, experiencia). El vehculo que permite el
transporte de la informacin de un lado a otro es la comunicacin
(==> Sistema de Informacin) La forma en que se lleva a cabo la
informacin en una organizacin constituye un sistema de informacin.
Objetivos del manejo de datos. Los datos deben representarse y
almacenarse en cierta forma para accesarlos posteriormente. Los
datos deben organizarse de manera adecuada para accesarlos
selectiva y eficientemente. Los datos deben procesarse y
presentarse de tal manera que puedan apoyar eficientemente al
usuario. Los datos deben protegerse y manejarse para que no pierdan
su valor. Porque es necesario organizar la informacin en archivos?
Caracterstica de toda informacin til es que sea fcil de accesarla y
recuperarla. Volumen alto y desordenada ==> bsqueda lenta y
difcil. Todos los archivos existen solo en funcin de la informacin
que contienen y de los usos que a esta se le d. Los usos de los
archivos definirn el tipo de organizacin que los archivos debern
tener. En un sistema computacional se usan muchos archivos y cada
uno de ellos cumplen una funcin muy especfica. Para el anlisis de
estos archivos, primero, hay que ocuparse de sus componentes
bsicos, estos son: Registros. Que contienen toda la informacin
concerniente a un individuo del archivo. Campos. Que son cada uno
de los atributos de un individuo (registro).
CONTENIDO ESTRUCTURAS DE LOS REGISTROS.Definiciones:
Organizacin y manejo de archivos
5 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Registro lgico:
Registro fsico:
Un registro es una coleccin finita y ordenada de elementos
(campos), posiblemente heterogneos, que se tratan como una unidad.
La creacin de un archivo en un dispositivo de almacenamiento
magntico (cinta, disco, etc.) se realiza mediante una secuencia de
operaciones de escritura (grabacin). Al conjunto de datos
transferidos en cada operacin de escritura/lectura se le llama
registro fsico.
Un registro, por lo general, contiene un campo (sub campo o
conjunto de ellos) que lo identifica, a esto se le denomina CLAVE.
Los registros son los elementos que contienen la informacin
concerniente a un individuo del archivo. En la mayor parte de los
lenguajes de programacin el acceso se produce a ellos (algunos
producen el acceso al campo). Un registro fsico o bloque es la
cantidad ms pequea de datos que pueden transferirse en una operacin
de entrada / salida entre la memoria principal y los dispositivos
perifricos o viceversa. Ejemplos de registros fsicos son una lnea
de impresin, un sector de un disco magntico. Un bloque puede
contener uno o mas registros lgicos.
Los registros se clasifican en: Registros de longitud fija.
Registros de longitud variable Los registros de longitud variables
pueden deberse a: Que existen campos de longitud variables en el
registro. La existencia o ausencia de campos en el registro.
Cualquiera sea la causa en un registro de longitud variable,
siempre encontraremos dos secciones: Seccin fija.(datos
identificadores e indicativos) Seccin opcional. FORMAS De secuencia
fijaSECCIN FIJA A B C D E F
De secuencia opcionalSECCIN FIJA * B * * * indica que falta. E
F
Si A, B, C,.. son de longitud variable ser necesario indicar el
fin de cada uno separndolo del siguiente.SECCIN FIJA A B C
Otra forma es indicar la longitud en forma explcita.SECCIN FIJA
SECCIN FIJA Lg.A A Lg.B B A Lg.C B C C Lg.A Lg.B Lg.C seccin de
control
Si los campos fueran de longitud fija, bastara indicar si
existen o no existen.
Organizacin y manejo de archivos
6 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
SECCIN FIJA
EX.
N.EX
EX.
A
C
Secuencia variable es necesario que cada campo o grupo de campos
tenga su propio identificador.SECCIN FIJA Lg.A A Lg.B B Lg.C C
Si adems cada campo es de longitud variable se debe indicar su
longitud o poner una marca de fin de campo.
CONTENIDO
Organizacin y manejo de archivos
7 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
TIPOS DE REGISTROS.Existen dos tipos de registros; de datos y
auxiliares. 1) Registros de datos. Son los registros que contienen
la informacin, con datos (campos) actualizables. 2) Registros
auxiliares. Son registros que sirven a propsitos especficos NO
relacionados con el SIA, sino con el proceso propio de los
archivos, o que ayudan al mejor proceso de estos. OVF o de cola.
Estos corresponden a registros que no tienen cabida en el rea donde
est la informacin de los archivos y por lo tanto, aunque contienen
informacin propia del archivo, deben ubicarse en otro lugar.
Ejemplo de estos registros son aquellos casos en que campos de
aparicin espordica en el archivo no se ponen en el rea primaria
sino que otro lugar. Es el caso de los campos memo del Dbase.
Vuelco o Cheek- point. Sirven para re iniciar procesos
interrumpidos, por ejemplo, ltimo registro listado. Rtulos o
labels. Contienen informacin bsica del archivo, como por ejemplo,
el nombre del archivo. Verificacin. Contiene informacin adicional
del archivo, como por ejemplo, cantidad de registros del archivo.
Control. Contiene informacin adicional del archivo, como por
ejemplo, usuarios autorizados a accesarlos. Estos tres ltimos tipos
de registros son bastantes tiles a la hora de mantener los
archivos, como tambin con propsitos de seguridad. Es importante
destacar que por mltiples motivos jamas nos preocupamos de definir
para nuestros procesos estos tipos de registros, sin embargo
deberamos hacerlo porque si los tenemos nos ahorrarn muchas hora de
trabajo cuando debamos mantener los archivos o frente a una
auditora del sistema. Cierto es que tener este tipo de registros
consume horas de desarrollo, pero es preferible invertirlas al
comienzo cuando recin se esta diseando y desarrollando el sistema.
Por ejemplo un registro que nos indique cuantos registros tiene el
archivo nos permitir de inmediato saber sobre la integridad de
dicho archivo, un registro que nos indique quien fue el ltimo
usuario en accesar el archivo nos servir para auditar el uso del
archivo, etc.
CONTENIDO
Organizacin y manejo de archivos
8 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
TIPOS DE DATOS O CAMPOS EN UN REGISTRO.A) IDENTIFICADORES. i)
Identificadores de registros. Campo cuya informacin permite
individualizar sin lugar a dudas un registro dentro de un archivo.
Explicitos o simples (un solo campo). Implicitos o compuestos (mas
de un campo que identifica el registro). Estos campos
identificadores reciben el nombre de CLAVE. As entonces una clave
la podemos definir como un campo, grupo de campos o sub campo que
permite identificar unvocamente un registro dentro del archivo. ii)
Identificadores de campo iii) Datos que se incluyen para indicar la
funcin de uno o varios campos Ejemplo.Identificador de campoNombre
/ cdigo E/S Cantidad Precio
B)
INDICATIVOS. Campos estticos con informacin adicional sobre el
ente representado por el registro y que no tienen mayor
trascendencia en el procesamiento normal de los registros. Ejemplo,
campo sexo. VARIABLES. Valor instantneo de un cierto dato que se
modifica frecuentemente Ejemplo. Stock, precio.
C)
CONTENIDO
CARACTERISTICAS DE LOS CAMPOS.Las caractersticas de los campos
son la longitud, clase o tipo, ajuste o alineamiento y relleno. a)
Longitud. Fija Variable. b) Clase o tipo. Numricos. Alfanumricos.
Binarios. Alfabticos. De fecha/hora. Lgicos o booleanos. c)
Alineacin o ajuste. Es como ordenarlos dentro de un campo. |xxx...|
alfanumricos se ajustan a la izquierda. |...xxx| numricos se
ajustan a la derecha. |..,...| numrico reales se ajustan segn la
coma decimal. |..xxx..| alfanumricos o numricos pueden tener este
ajuste central. NO es recomendable usarlo para los numrcios.
Organizacin y manejo de archivos
9 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
d)
Relleno. Numricos se rellenan con ceros. Alfanumricos se
rellenan con blancos.
CONTENIDO ARCHIVOS.Definiciones: a) Conjunto de registros lgicos
referidos a un mismo tipo de informacin. b) Conjunto de registros
lgicos referentes a entidades u objetos del mismo tipo.
Un archivo tiene nombre, contenido, direccin donde se guarda y
alguna informacin administrativa, por ejemplo, quien lo elabor y
cuan grande es. Dependiendo de la configuracin del sistema y del
tipo de aplicacin en que se utilice el archivo, todos los procesos
pueden realizarse en dos enfoques: Procesos por lotes (en batch).
Las distintas transacciones son acumulados y organizadas
constituyendo un archivo de transacciones, este archivo se procesa
contra el archivo maestro con una periodicidad determinada
Ventajas: El archivo de transacciones puede ser verificado,
clasificado y ordenado de manera que la eficiencia del proceso sea
mxima. El archivo maestro puede re organizarse totalmente durante
el proceso de actualizacin, manteniendo as un alta eficiencia de
los procesos que involucren este archivo. Permite aumentar el nivel
de seguridad de los archivos maestros, ya que estos no se
encuentran expuestos permanentemente a los usuarios. Desventaja: La
informacin no se encuentra actualizada en los archivos maestros.
Procesos en lnea (on line). Las transacciones se procesan en el
mismo momento que ellas ocurren, de tal manera que los archivos
maestros siempre se encuentran actualizados en su informacin.
CARACTERIZACION Y CATEGORIZACION DE ARCHIVOS.Soporte. Estos se
dividen en medios direccionables o de acceso directo y no
direccionables o de acceso serial. Entre los primeros se encuentran
las cintas, cartuchos, etc. Los tpicos de los segundos son los
discos duros, CDs, etc. Disposicin fsica de los registros. Es la
forma en que se ubican los registros en el medio de almacenamiento.
Estos pueden ser: Serial. Se ubica un registro a continuacin del
otro.
Organizacin y manejo de archivos
10 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
No serial.
Cada registro se ubica en una posicin especfica que no depende
necesariamente del registro anterior.
Disposicin lgica de los registros. Establece una relacin lgica
entre el orden lgico de los registros y la disposicin fsica de los
registros. Secuencial: ser aquella en que el orden lgico
corresponde con el orden fsico. Al azar: no existe ninguna relacin
entre el orden lgico y el orden fsico. Especfico: Secuencial
indexado, random, particionado, relativo. Acceso. Corresponde a la
forma en que se puede recuperar la informacin de un registro
determinado. Serial: para obtener la informacin de un determinado
registro ser necesario leer uno a uno los registros que lo preceden
fsicamente. Secuencial: Leer uno a uno los registros que lo
preceden lgicamente. Directo: Corresponde a una forma de acceso en
la cual es posible obtener la informacin de un registro determinado
sin acceder a examinar previamente otros registros. Bsqueda
binaria: Solo puede aplicarse a archivos que estn en medios de
almacenamiento que permitan acceso directo con disposicin fsica
serial y disposicin lgica secuencial. Procesamiento. Se refiere al
orden en que normalmente sern accesados los registros del archivo.
Serial: De acuerdo al orden fsico. Secuencial: De acuerdo al orden
lgico. Al azar. Son procesamiento en cualquier orden.
Direccionamiento. Es solo aplicable a los archivos almacenados de
acceso directo, con disposicin fsica no serial. Se refiere al mtodo
que permite determinar la posicin fsica de un registro especfico o
de un grupo especfico de registros en donde est el buscado o, dicho
de otro modo, se refiere al mtodo que permite determinar la posicin
fsica de un registro dentro del archivo. Existen mtodos: desde el
ndice, desde la clave, desde la posicin lgica y desde la posicin
relativa. Desde el ndice: Consiste en tener almacenado un
directorio en que se relacionan las claves de los registros con las
direcciones donde estn ubicados, siendo serial la bsqueda dentro de
este directorio. DIRECTORIOCLAVES DIRECCIN
Organizacin y manejo de archivos
11 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Desde la clave: Consiste en disponer un algoritmo que permite
transformar la identificacin lgica o clave del registro en la
posicin fsica que ocupa el registro (funcin hashing). Desde la
posicin relativa: consiste en determinar la posicin fsica de un
registro conociendo el nmero de orden del registro dentro del
archivo. El nmero de orden es la posicin relativa del registro
dentro del archivo. Para esto es necesario conocer la posicin del
primer registro y la cantidad de registros que se pueden almacenar
en una pista, un cilindro (en el caso de discos) y de esa forma
relativamente directa podemos llegar al registro que se est
buscando. En este caso los registros deben ser de longitud
fija.
CONTENIDO
CREACIN Y MANTENCIN DE ARCHIVOS.La creacin de archivos debemos
diferenciarla en cuanto al tiempo en que es efectuada, as, existen
tres formas de crear archivos: La primera es cuando no existe la
informacin guardada en medios magnticos, y esta debe ser ingresada
mediante digitacin o scaneo y posterior trasvasije al archivo en
cuestin. Esta forma se conoce con el nombre de CARGA del archivo.
Una variante importante de la forma anterior es cuando el sistema
recin empezar a registrar informacin, en este caso el archivo
empezar a poblarse bajo un rgimen de operacin normal. Una tercera
forma de creacin de archivos es cuando el sistema de informacin ya
exista, o cuando la informacin est en un software que no es el que
operar con el sistema (ej. planillas electrnicas, procesadores de
textos, archivos de lenguajes diferentes, etc.) en este caso se
hablar de CONVERSIN. Funciones de creacin o mantencin de archivos.
Carga. Grabacin en el dispositivo de los registros originales. La
reorganizacin es una variante importante de la carga.
Reorganizacin. Creacin de un nuevo archivo a partir del ya
existente. Este archivo puede construirse en un nuevo volumen o
bien usando un archivo de paso en el mismo volumen anterior.
Recuperacin de registros. Consiste en la lectura de registros
individuales del archivo, o bien, de grupos de registros en un
determinado orden. Actualizacin. Modificacin de parte o todo el
archivo. Para ello es necesario recuperar los registros que se
deseen actualizar procesndolos en la U. C. P. y re grabarlos en la
misma posicin en que se encontraban. Supresiones. Bajas o
eliminaciones. Cuando se desea eliminar un registro el mtodo
consiste en recuperarlo y marcarlo en alguna forma re escribindolo
despus en la misma posicin. Estos registro dados de baja no son
suprimidos fsicamente.
Organizacin y manejo de archivos
12 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
La mantencin de archivos est referida a los procesos inusuales
pero necesarios para mantenerlos vigentes. La mantencin de archivos
puede suceder por variadas causa, como se ver ms adelante.
Correctiva Cambios necesarios debidos a errores en el sistema.
Adaptativa Relacionado con cambios tecnlogicos y/o organizativos o
funcionales de los Sistemas de Informacin. Perfectiva Relacionado
con recomendaciones y nuevas posibilidades recibidas de los
usuarios y que mejoran la funcionalidad ya existente.
El trmino de mantencin tambin involucra la idea de mantener la
informacin a buen resguardo, en este caso se debera hablar de
seguridad o proteccin de los archivos y tambin de los respaldos de
los archivos. El tema de la seguridad de los archivos es hoy da un
tema crtico al que debe drsele la mxima importancia. El trmino de
seguridad se emplea para describir la proteccin contra la
destruccin de los sistemas y su contenido (por supuesto, los
archivos). No se tratar aqu, de algo obvio como es la seguridad de
los edificios o de la proteccin de informacin que debe tener cada
usuario (se imagina usted que pasara si el operador de un sistema,
por descuido, deja en una pantalla el informe del sueldo de los
ejecutivos de la organizacin o en un informe impreso las
cotizaciones de diferentes proveedores para un sistema estratgico).
Si se desea asegurar un SIA, es necesario lograr un modo de
operacin confiable y predecible, tambin es necesario proporcionar
un mecanismo de proteccin para lograr el control deseado de los
accesos de datos. Hoy da, con el nivel de comunicaciones existente,
deber asegurarse de que no se presentarn interferencias
destructivas ni de accesos no deseados a los archivos o tablas de
un sistema de informacin. As la seguridad de los archivos debe ser
resguardada externa e internamente a las organizaciones. Los tres
temas que deben abordarse en la seguridad son: Confiabilidad:
mejorar la probabilidad de que el sistema haga lo que se le indica.
La confiabilidad se logra cuando un sistema de computacin, tanto
hardware como software produce resultados correctos. Proteccin:
comprender, organizar y controlar el acceso a los datos de acuerdo
con derechos especficos. Integridad: conservar la seguridad en un
sistema en que se permite a mltiples usuarios el acceso al sistema
(y compartir los archivos o tablas). El tema de la proteccin de
datos tiene dos aspectos El primer aspecto, comnmente entendido es
que se desea negar el acceso a las personas que no tengan derecho a
ellos. A esto tambin se le denomina comnmente como proteccin de
privaca para datos personales y mantenimiento de seguridad para
datos gubernamentales o institucionales. El segundo aspecto de la
proteccin, igualmente importante, es que es necesario garantizar el
acceso a todos los datos importantes a las personas que ejercen
adecuadamente su privilegio de acceso. Esto significa que los
propietarios de bases de datos tambin tienen la responsabilidad de
proteger los datos que se les han confiado. Parte de esta
responsabilidad significa que debe existir una operacin confiable
de los computadores. El otro aspecto es que
Organizacin y manejo de archivos
13 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
los datos deben estar protegidos de riesgos, vandalismo o
alteracin. Ejemplos: Privaca personal. El operador del sistema de
remuneraciones, prepara los informes de sueldos del personal, pero
el no debe tener acceso a los datos de las entrevistas personales
de cuando estos fueron contratados, como por ejemplo los informes
psiquitricos. Componentes de los problemas de proteccin. Tres tipos
de elementos se combinan para formar el sistema que se utiliza para
analizar los mtodos de proteccin. 1.Los usuarios con acceso a los
archivos. 2.El tipo de acceso deseado. 3.Los elementos a los que se
realizar el acceso. Cada uno de estos elementos debe estar
adecuadamente identificado a fin de lograr el control del acceso a
los datos. Tambin es necesario considerar el entorno o frontera del
rea dentro de la cual es vlido el sistema de proteccin.
Definiciones. Entorno: Existe un rea con permetro bien definido,
conocido como el sistema de informacin. Usuarios o intrusos. Dentro
de esta rea puede haber individuos autenticados adecuadamente
identificados, individuos disfrazados de usuarios vlidos, e
intrusos. Alcance limitado. El sistema desconoce la identidad de
los individuos en el mundo exterior. Privilegios. Existen varios
privilegios de acceso a los datos, relacionados con la
identificacin de un individuo. La descripcin de estos privilegios
se mantiene como parte del sistema de la b de datos. Proteccin.
Todos los elementos dato estn protegidos hasta cierto punto
mientras se encuentran dentro del rea del sistema de informacin, y
perdern toda la proteccin que proporciona el sistema al sacarse del
rea. Confiabilidad. Un prerrequisito para lograr la proteccin del
SIA es un alto nivel de fiabilidad del sistema. Proteccin, privaca
y secreto. La proteccin de los datos requiere ejercer control sobre
la lectura, escritura y empleo de esa informacin. Muchos de los
mtodos que se analizarn no distinguen entre la proteccin de los
datos, el mantenimiento de la privaca y la seguridad del secreto.
El secreto se logra cuando no existe acceso a todos los datos sin
autorizacin. La privacia adecuada puede lograrse cuando los datos
que pueden obtenerse no pueden enlazarse a individuos especficos o
no pueden utilizarse para imputar hechos acerca de ellos.
Responsabilidad. No est claro quien, en sentido legal, es
responsable por las prdidas sufridas debido a la violacin de las
reglas de proteccin de la privaca. En muchas operaciones la
responsabilidad corresponde a la alta gerencia, aun cuando ciertas
reas especficas pueden delegarse al manejo de procesamiento de
datos. TIPOS DE ACCESO A LOS DATOS. Pueden formarse categoras de
acceso a los datos por tipo. Por lo comn, las distinciones se
realizan entre autorizacin para leer y autorizacin para escribir
datos.
Organizacin y manejo de archivos
14 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Si se desea un control ms exhaustivo se debern tomar en
consideracin los siguientes tipos de accesos. Lectura. Ejecucin
(sobre un programa que tenga acceso a los datos). Modificar.
Eliminar. Ampliar (o agregar datos al archivo). Mover o trasladar
(en el nuevo lugar el archivo puede ser copiado). Compartir.
Organizacin y manejo de archivos
15 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Respaldo: Copia de los archivos que se mantendrn en otro lugar
para ser ocupada en caso de error o cada del sistema. Este tema es
uno de los que siempre nos olvidamos hasta cuando ocurre algn
siniestro. Los archivos de respaldo son copias de los archivos
maestros que se guardan por razones de seguridad de los datos. En
efecto, si por algn motivo se destruye o altera el archivo
original, existen copias para reproducirlo. En la prctica el empleo
de volver a leer la entrada de una transaccin o la restauracin de
un archivo depende de la disponibilidad de una copia de respaldo de
una versin anterior del archivo. Los respaldos deben crearse por
copiado. Es posible generar peridicamente copias de respaldo y
conservar una serie de versiones anteriores. Cada copia de respaldo
deber estar identificada con tiempo, fecha y por la ltima
transaccin incluida. Las copias de respaldos deben generarse cuando
el sistema esta inactivo, ya que las actualizaciones durante el
copiado pueden provocar inconsistencia en la copia. Una buena
alternativa de respaldo es jugar con tres versiones de copias, como
se muestra en la figura.
Respaldo C Respaldo B Respaldo A Maestro
0
1
2
3
4
5
6
Tiempo (periodos)
As, si ocurre algn siniestro y debe subirse un respaldo, se
comenzar desde el ltimo realizado, si por algn motivo este no
estuviera correcto o no se pudiera subir se recurrir al anterior,
si tampoco con este resultara se pueden recurrir al respaldo mas
antiguo. Algunas medidas prcticas sobre las copias de respaldos:
1.Las copias deben ser guardadas en un rea distinta en donde se
encuentre el procesamiento de datos, ojal en edificios diferentes.
2.Los medios en los que se hacen las copias de respaldo y con los
que hacen deben ser de la mejor calidad. Es muy frecuente que a la
hora de un siniestro se intente subir un respaldo y el dispositivo
presente fallas. 3.Para realizar la copia de respaldo se debe
disponer de un tiempo de la mejor calidad, con dedicacin. Es muy
frecuente que al subir una copia de respaldo, esta est mal
realizada.
CONTENIDO
Organizacin y manejo de archivos
16 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
CONCEPTOS (medidas) SOBRE ARCHIVOS.Existen tres conceptos que
son determinantes en la organizacin de los archivos o en los
procesos a que deben ser expuestos. Estos conceptos son:
volatilidad, actividad y tamao. Esta caractersticas se aplican
sobre archivos en proceso. Volatilidad Se refiere al porcentaje de
incorporaciones y eliminaciones que sufre un archivo en cada
proceso. Respecto a la volatilidad se distinguen: Archivos estticos
con baja volatilidad. Archivos dinmicos con alta volatilidad.
Actividad Es la frecuencia con que es referenciado un archivo o un
grupo de registros. Magnitud de la actividad. Nmero de pasadas por
unidad de tiempo. Porcentaje de actividad. Es el porcentaje de
registros que son referenciados en cada ciclo operacional.
Distribucin de actividad. No todos los registros de un archivo son
referenciados con la misma frecuencia. As la distribucin de
actividad muestra cuales registros son mayormente referenciados y
cuales menos. Tamao Nmero de bytes o nmero de registros del
archivo. Aqu debe considerarse el tamao actual y el previsible para
el futuro.
CONTENIDO TIPOS DE ARCHIVOS.En un sistema computacional se usan
muchos archivos que pueden clasificarse por la funcin que desempean
. MAESTROS: (volver) Contienen la informacin correspondiente al
estado actual de un conjunto de item o elementos o entradas,
agrupados en registros. Procesos bsicos en este tipo de archivos:
Mantencin. En que se modifica un campo permanente. Actualizacin. Se
modifican campos actualizables. Respaldo. Dado que estos archivos
son los que contienen la informacin del SIA, deben ser guardados
con el mayor celo. Permanecen durante toda la vida til de un
sistema, siendo actualizados en cada ciclo operacional.
REFERENCIAS. Son similares a los maestros. Permanecen durante toda
la vida til del sistema, y son actualizados solo en forma
acasional. Son usados como consulta o referencia para obtener la
informacin que permita llevar a cabo la tarea principal del
proceso. MOVIMIENTOS o TRANSACCIONES.(volver) Los archivos de
transacciones reflejan los hechos acaecidos entre dos procesos
consecutivos en un sistema.
Organizacin y manejo de archivos
17 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Se crean especialmente para fines especficos siendo desechados
enseguida o siendo mantenidos como respaldo. Son generalmente
empleados como actualizadores para otros archivos (maestros) o para
obtener informes o archivos intermedios. El contenido de los
archivos de transacciones reflejan los hechos acaecidos entre dos
procesos consecutivos en un sistema. PASO. Se usan durante un
proceso como parte de el y luego se usa en otro proceso del mismo
ciclo de operacin sin que permanezca para el ciclo operacional
posterior. Ejemplo: Se desean obtener dos listados de alumnos: En
orden alfabtico. En orden de nmero de matrcula. Se tiene un archivo
maestro ordenado por nmero de matrcula y otro de movimiento
ordenado por nmero de matrcula. Transaccin 01 Actualizacin 01
Listado ordenado Nmero matrcula ALUMNOS RESULTADOS o INFORMES.
Corresponden a las respuestas del sistema computacional. Su
contenido es el resultado del proceso y son usados por personas por
lo tanto deben ser percibidos por medios visuales.
CONTENIDO PROCESOS EN QUE INTERVIENEN ARCHIVOS.Proceso
computacional: Es un procesamiento de datos efectuados por un
computador que tiene por finalidad obtener un resultado siguiendo
las especificaciones de un programa. Los procesos bsicos son:
CLASIFICACIN. Son aquellos procesos que tienen por objetivo ordenar
cierta cantidad de datos (registros) con un criterio establecido.
Este ordenamiento trata de ubicar los registros de acuerdo a una
secuencia lgica, normalmente la clasificacin se efecta sobre
archivos de organizacin secuencial y sirven a tres propsitos:
Preparar los datos para facilitar un pareamiento con otro archivo
que est ordenado de la misma forma. Para facilitar algn tipo de
bsqueda. Presentar resultados en forma clara. Como la clasificacin
es tan frecuente en todo SIA existen programas utilitarios que la
realizan.
Organizacin y manejo de archivos
18 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
CONCATENACIN. Tiene por objeto unir en un solo archivo dos ms
archivos iniciales de tal manera que queden ubicados uno a
continuacin de otro. INTERCALACIN. Tiene por objetivo permitirla
formacin de un archivo ordenado de acuerdo a un criterio, a partir
de dos mas archivos iniciales que pueden estar o no en secuencia
similar. PAREAMIENTO. Establece una correspondencia entre registros
de dos ms archivos. Las coincidencias o discrepancias encontradas
proporcionan una pauta para decidir de acuerdo a ciertas reglas si
los registros son o no correspondientes. EDICIN. Preparar los datos
para la visualizacin por parte de un usuario. Se utiliza
normalmente para preparar las impresiones o pantallas de consultas.
Pasos previos a una impresin o despliegue: Formateo de registros
para la salida. Intercalacin de espacios. Ordenamiento de temes.
Insercin de comas. Puntos decimales. Signos especiales. Inserciones
de ttulos y sub ttulos. ACTUALIZACIN. Es el proceso computacional
de mayor importancia en que intervienen archivos. Esta
actualizacin, normalmente, se realiza sobre los archivos maestros.
Estos procesos pueden ser en lnea o por lotes. Modificacin de
campos variables. Inserciones de registros. Eliminacin de
registros. MANTENCIN. Este proceso tambin es tomado como una forma
especial de actualizacin, solo que este se realiza espordicamente.
Modificacin de campos permanentes. Condensacin de registros o
campos. Expansin de registros o campos. Reorganizacin. CLCULO. Son
los procesos que graban archivos de paso que tienen en su
estructura campos de resultados de calculo, en preparacin de
informes. CONVERSIN. Son aquellos procesos cuya finalidad es copiar
un archivo de un medio de almacenamiento a otro, de un sistema
operativo a otro, de un computador a otro. Este proceso es
espordico pero de gran importancia, y como bsicamente se trata de
traspasos de SIAs deben tomarse todas las precauciones al hacerlo,
siendo una de estas, los respaldos de los archivos que deben
perdurar hasta que la nueva aplicacin este corriendo a
satisfaccin.
Organizacin y manejo de archivos
19 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
VALIDACIN. Tiene por objeto asegurar, dentro de lo posible, la
veracidad e integridad de un conjunto de datos. Adems permite
detectar errores y proveen una forma de corregirlos. Tiende a
asegurar la exactitud y consistencia, se pueden validar campos y
tambin se pueden validar campos contra otros archivos. Los errores
deberan indicarse a travs de listados. Todo proceso de validacin
debe permitir el feed back, es decir realimentar los registros
errneos a los que se les modifica, para que se vuelvan a chequear.
Estas validaciones se realizan hasta que no haya mas errores.
Chequeos comunes. Dgitos verificadores. Totales de cuadratura.
Secuencias de campos. Chequeos orientados a campos. Alfabticos, No
alfabticos, Numricos, No numricos, Alfa numricos, Blancos. Chequeos
orientados a contenido de campo Cadena de caracteres, Existencia de
cadenas de caracteres, Valores dentro de un cierto rango, Valor
bajo cierto lmite,Valor sobre un cierto lmite. Chequeos orientados
a conjuntos de registros. Antes deben hacerse los chequeos
orientados a campos. Verificar el cumplimiento de ciertas
relaciones lgicas o aritmticas entre 2 ms campos de un registro. a)
Implicacin. Si el contenido de A esta entre tales mrgenes, entonces
B est en cuales. b) Disjuncin. El contenido de A est en tal rango o
el contenido de B esta en tal otro. c) Conjuncin. El contenido de A
est en tal campo y el contenido de B en tal otro. D) Compuesto.
(entre los otros). Chequeos orientados a conjuntos de registros.
Cantidad de registros de cada tipo, cortes de control, etc. Error
de consistencia. Los que se detectan solo al confrontar con otro
archivo.
-
-
CONTENIDO
Organizacin y manejo de archivos
20 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
ORGANIZACIONES.Las organizaciones de los archivos se vern en las
prximas pginas, en ella aparecen los conceptos de cmo funciona cada
organizacin. Dado el avance de las tecnologas informticas muchas
cosas ya estn hechas y nosotros solo debemos ocuparlas, sin
embargo, es por todos conocido que muchos SIA han fracasado por el
desconocimiento de cmo funcionan las diferentes organizaciones
implementadas en ellos. Adems, y lo ms importante, es que en muchas
situaciones en el desarrollo o mantencin de un SIA deben emplearse
artificios en que deben simularse el funcionamiento de una
organizacin determinada. Por esto es importante conocer de que
trata cada organizacin y como funciona porque as podremos entregar
soluciones creativas y eficaces a los problemas informticos.
Clasificaciones de las organizaciones: Organizacin lgica:
Corresponde al orden en el cual los registros sern procesados por
los programas de aplicacin. Organizacin fsica. Corresponde a la
forma real en que los registros estn dispuestos sobre el soporte
fsico. En muchos casos la organizacin lgica de un archivo es
diferente de la organizacin fsica del mismo. Un archivo que tiene
una organizacin fsica determinada puede ser utilizado por programas
de aplicacin en mas de una forma de organizacin lgica.
Organizaciones elementales. Se dice que una organizacin es
elemental cuando la estructura lgica es una funcin simple de la
estructura fsica. Entre estas organizaciones estn: Secuencial
Directa. De lista. Organizaciones complejas. Se dice que una
organizacin es compleja cuando la estructura resultante es el
resultado de la asociacin de varias organizaciones elementales.
Ejemplos de organizaciones complejas son: Relativa. Secuencial
indexada. V.S.A.M.
CONTENIDO Organizacin secuencial.Es la organizacin ms comn, que
puede ser manejada por todos los lenguajes de programacin, adems es
soportada por todo tipo de dispositivo de almacenamiento. En este
caso la organizacin fsica corresponde con la organizacin lgica. El
acceso de los registros de una organizacin secuencial tiene
registros que son objeto de tratos especiales: El primer registro.
El siguiente (todos los que estn en medio). El ltimo registro.
Organizacin y manejo de archivos
21 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Estos tres tipos de registros son objeto de accesos especiales,
sobre todo el ltimo ya que es usual que en los procesos este sea
leido pero no procesado. Ventajas: Simple de usar. Ventajosa para
porcentajes de actividad alta (taza de utilizacin alta). Alta
densidad de informacin. Soportada por todos los medios de
almacenamiento. Desventajas. El proceso de actualizacin implica
leer y graba todo el archivo. Ineficaz en tazas de utilizacin
bajas. ARCHIVO SECUENCIAL. (ejemplo con clave compuesta)N.reg. 1 2
3 4 5 6 FAMILIA LB004 LC001 MN004 MN004 OP001 WW567 CODIGO 23456-71
45670-92 23234-98 32456-78 09222-67 09223-94 PRECIO 234357 012345
908970 456367 342345 324567 U_MEDIDA C/U CAJAS C/U PQTE PQTE CJTO
STOCK 00034 00600 12343 00023 00001 00009
CONTENIDO Organizacin secuencial indexada.Esta organizacin se
llama as porque tiene las dos caractersticas, para la bsqueda de un
registro determinado usa un ndice, pero este ndice entrega un
ubicacin en donde se encuentran muchos registros, as, en este lugar
se debe buscar secuencialmente el registro deseado. Se graba en
forma secuencial. Permite el acceso secuencial o random (directo).
El medio de almacenamiento limita el tipo de organizacin. Para este
tipo de organizacin el registro debe ser de longitud fija. Los
archivos secuenciales indexados poseen tres reas: rea primaria de
datos (prime area). rea de ndices (index area). rea de rebalse
(overflow area).
rea primaria. Es un rea dentro de la cual los registros de datos
son creados por primera vez o cuando se reorganiza. El archivo al
momento de crearse se crea secuencialmente, esto es grabando los
registros en el rea primaria en una secuencia dictada por el orden
de las claves de los registros. El proceso de grabacin comienza en
la segunda pista de un cilindro particular, cuando se termina el
cilindro se contina grabando en el cilindro
Organizacin y manejo de archivos
22 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
siguiente a partir tambin de la segunda pista, continuando as
hasta terminar con el archivo. rea de ndices. Esta rea es creada
por las rutinas del sistema operativo (Data management). Existen
varios niveles de ndices involucrados en estos ndices. El nivel de
ndices ms bajo es el track index el cual esta siempre grabado en la
primera pista de los cilindros, en el cual reside el archivo
secuencial indexado. Estos contienen 2 entradas para cada pista
primaria del cilindro, una entrada normal y una entrada de
overflow. La entrada normal esta compuesta del mayor valor de la
clave de los registros almacenados en la pista que identifica ese
ndice, y adems en la entrada normal estar registrada la direccin de
la pista primaria a la cual esa entrada est asociada. De la misma
forma como el track index describe el almacenamiento de registros
en las pistas de un cilindro, existir el cilinder index que indicar
como los registros estn distribuidos sobre una cierta cantidad de
cilindros. Existe un tercer nivel de ndices que es el master index
que es usado cuando los archivos son demasiado grandes. En caso de
existir el master index este ser la raz del ndice, por lo tanto
cualquier bsqueda comenzar en este ndice. rea de overflow. Sirve
para agregar o eliminar registros. Estas son pistas de los
cilindros, por lo tanto en cada cilindro se dejan una cierta
cantidad de pistas para manejar los registros de rebalse, a veces
tambin se deja un rea independiente del cilindro para el caso que
este se rebalse. En los ndices las entradas de overflow tendrn las
claves mas altas de cualquier registro que est en esta pista.
Representacin archivo secuencial indexado0944151 1 2 3
C
127362
C
1871691)
C
NDICE DE CILINDRO3
020028*
P
ndice de pistas en cilindro 1 (C 2 020028 P1 028761 P 028761
P2
094415
P
094415
P3
entrada normal
* entrada de overflow
Pista 1 Pista 2 Pista 3
001023 023612 089213
Datos Datos Datos
011120 024121 089225
Datos Datos Datos
020028 028761 094415
Datos Datos Datos
Ejemplo de bsqueda de registros, para claves: 1) 010215 de estar
est en cilindro 1. En ndice cilindro 1, de estar est pista 1. Se
busca secuencialmente en pista 1. 2) 011124 de estar est en
cilindro 1. En ndice cilindro 1, de estar est pista 1. Se busca
secuencialmente en pista 1. 3) 023612 de estar est en cilindro 1.
En ndice cilindro 1, de estar est pista 2. Se busca secuencialmente
en pista 2.
Fracaso.
Fracaso.
xito.
Procesamiento de archivos secuenciales indexados. La gran
ventaja de este tipo de organizacin es que el proceso puede ser
secuencial o puede ser directo.
Organizacin y manejo de archivos
23 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
En RMCOBOL. ... ENVIRONMENT DIVISION. INPUT-OUTPUT SECTION.
FILE-CONTROL. SELECT nombre-archivo ASSIGN TO DISK ORGANIZATION IS
INDEXED ACCESS MODE IS {SEQUENTIAL/RANDOM/DYNAMIC} RECORD KEY IS
nombre-clave. ... DATA DIVISION. FILE SECTION. FD nombre-archivo
... 01 registro. 02 nombre-clave PIC X. . .X.
CONTENIDO ORGANIZACIN RELATIVA. La organizacin relativa es una
organizacin simple y de acceso directo. El direccionamiento de un
registro cualquiera se hace en base al primer registro, as existir
un primer registro En COBOL Select nombre-interno assign to disk
Organization is relative Access mode is sequential / random /
dynamic Relative key is identificador. Working-storage section. 77
identificador pic 99999. Procedure division. Open input
nombre-interno. Open output nombre-interno. Open i-o nombre
interno, Rewrite nombre-registro invalid key sent-imperativa Read
nombre-archivo
Organizaciones de listas.
Organizacin y manejo de archivos
24 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Organizacin directa.El archivo de organizacin directa no es un
desarrollo de las organizaciones anteriores, sino que intenta
explotar la capacidad proporcionada por las unidades de disco o
dispositivos similares, de lograr acceso a cualquier bloque de
direccin conocida, para lograr el direccionamiento directo se
utiliza una llave del registro para localizarlo en el archivo. La
distribucin de los registros del archivo en el soporte fsico se
efecta en funcin de algn atributo de los registros de entrada. A la
llave se le aplica una funcin que la transforma en una direccin.
Bucket es el espacio fsico de igual direccin que puede contener ms
de un registro. Propiedades archivos directos. 1.En los archivos
directos el acceso a los registros es rpido especialmente para
factores de carga bajos y pocos registros en overflow. (la aparicin
de registros de overflow atentan contra del tiempo de bsqueda).
2.Dado que una cierta parte del archivo permanece sin uso (parar
prevenir excesivo uso de registros de overflow) la utilizacin de
espacio es pobre comparada con la utilizacin de espacio de otras
organizaciones. 3.El rendimiento (PERFORMANCE) obtenido usando un
archivo directo es muy dependiente del algoritmo de transformacin
usado hashing). 4.los registros de un archivo directo pueden ser
accesados en forma randomica o serial, pero nunca secuencial a
menos que se mantenga una lista separada ordenada por claves, es
decir una lista ordenada en otro archivo. Ventajas. Esta
organizacin es muy til para los procesos en lnea, para archivos que
no son muy voltiles.
Tcnicas de resolucin de colisiones. En un archivo directo la
unidad mnima direccionable es el bucket. Al establecer un tamao del
bucket se espera una cierta cantidad de sinnimos. Cuando hay ms
registros sinnimos que los del bucket dado entonces algn mtodo debe
ser usado para manejar estos registros de overflow. Open
addressing. Cuando un registro va a un bucket que no esta completo
este se ubica en la siguiente posicin disponible en el bucket, este
ser su bucket primario; si un registro no esta en el bucket
primario este podra estar en el bucket de overflow. Una bsqueda
sucesiva es hecha de los registros en los bucket restantes del
archivo, esta bsqueda termina al encontrar el registro o un
registro en blanco, o si la bsqueda vuelve al registro original.
Encadenamiento. i) Los registros de overflow pueden ser encadenados
desde un rea primaria a un rea separada de overflow, una buena
estrategia podra ser dejar los ltimos bucket de un rea para
overflow. ii) Encadenamiento con lista. Con este mtodo los
registros de overflow son ubicados usando punteros desde un bucket
a otro. Cuando una clave es mapeada a un bucket,
Organizacin y manejo de archivos
25 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
una bsqueda comienza a travs de una cadena de bucket hasta que
el registro requerido o una posicin vaca es encontrada.
Organizaciones VSAM (Virtual Sequential Access Method).Anunciado
por la IBM en el ao 1972 para el IBM 370. En este tipo de
organizacin est implcito el concepto de memoria virtual, siendo
manejada esta en conjunto con la memoria principal. As en la
memoria principal esta solo la parte de los programas que se estn
ejecutando, dejando el resto en los dispositivos perifricos para
cargarlo solo cuando se les necesita. Un sistema de memoria virtual
efecta un maping dinmico desde un espacio de direccin virtual a un
espacio de direccin de la memoria principal. El manejo de esta
memoria virtual puede ser paginacin, paginacin con demanda de
pgina, segmentacin, segmentacin paginada. Objetivos fundamentales
de la organizacin VSAM. Mayor seguridad de los datos. Reunificacin
de los mtodos de acceso en un todo coherente. Explotacin racional
de la memoria virtual. Archivos independientes de los tipos de
dispositivos. Independencia frente a los sistemas. Mejora en los
rendimientos frente a las organizaciones ISAM. Ayuda en la puesta
en marcha. Posibilidades suplementarias de tratamiento. No todos
los sistemas computacionales permiten usar archivos VSAM ya que
este requiere de un software especial. Algunos de los sistemas que
los usan son el DOS/VS, DS/VS de IBM. Ventajas de los archivos
VSAM. Eficiencia en manejo de archivos porque hace uso del espacio
libre distribuido en todo el archivo. Los archivos VSAM en el caso
de un deleteo de registros comprimirn los registros aprovechando
los espacios de tal manera que quedan en forma contigua para que se
pueden ocupar cuando se necesiten. Simplicidad de uso. VSAM permite
distintos tipos de acceso; secuencial, directo, por clave, por
nmero de registro (orden) mediante instrucciones similares. Bloqueo
automtico, totalmente transparente para el programador. Control
centralizado ya que VSAM maneja un MASTER CATALOG (directorio) que
contiene todos los antecedentes acerca de los archivos y espacio de
almacenamiento. Adems existen reas restringidas a ciertos
usuarios.USER CATALOG 1 USER CATALOG 2 ARCH. VSAM 1 ARCH. VSAM
2
-
Lo que significa un catalogo por usuario y lgicamente permitir
una mayor y mejor proteccin de la informacin. Portabilidad de
archivos ya que los archivos pueden ser llevados de un lugar a
otro.
Organizacin y manejo de archivos
26 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
VSAM obtiene los registros de un archivo mediante el
desplazamiento de un registro a partir del comienzo del archivo
(direccionamiento relativo).
MASTER CATALOG
USER CATALOG
USER CATALOG USER CATALOG
Archivos VSAM
archivos NO VSAM
Archivos VSAM
archivos NO VSAM
VSAM requiere de un software que se llama ACCESS METHOD SERVICE
(AMS) que es el que crea los archivos VSAM, adems de permitir
conversiones entre archivos secuenciales, o secuenciales indexados
a VSAM. ESTRUCTURAS DE LOS ARCHIVOS VSAM. Los archivos VSAM tienen
varias caractersticas orientadas a mejorar el desempeo en trminos
de tiempo de ejecucin. El tamao del nodo de rbol esta definido como
una pgina de memoria virtual, de esta manera se maximiza el tamao
que el hardware puede manejar eficientemente, reduciendo as el
nmero de nodos que requiere el rbol y por ende el numero de accesos
a los dispositivos perifricos. La ventaja de organizacin de rbol es
que esta no requiere ser reorganizada peridicamente.
NDICE DE RBOL
NODOS DE DATOS
Existen 3 tipos de archivos VSAM los KSDS, ESDS y RRDS. KSDS
(key sequenced data set secuencial indexado). Se puede crear
registros de formato variable y fijo. Son exclusin de la clave
cualquier campo puede ser modificado.27 de 36
Organizacin y manejo de archivos
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Los registros de longitud variable puede ser acortados o
expandidos. Los registros son cargados en registros ordenados
definidos por el contenido de un campo clave de cada registro y el
acceso a los registros de este archivo puede ser en forma directa
(va la clave) o en forma secuencial (va el orden lgico de la clave)
o incluso va el RBA (Relative Byte Address). Caractersticas.
Ordenados secuencialmente por clave. Acceso por medio de Indices.
Clave de longitud fija. Crear modificar eliminar. Puede reservar un
espacio libre para adicionar registros. Un archivo VSAM, KSDS esta
compuesto de reas contiguas de largo fijo de un medio de
almacenamiento DASD (Direct Access Storage Device) llamados Control
Internal (CI). Un CI (siendo un rea de almacenamiento) corresponde
a la unidad de informacin que es transferida desde o hacia el
almacenamiento externo o memoria por medio de las posibilidades de
acceso de VSAM. Los registros en un CI pueden ser de largo fijo o
variable y un CI tiene la siguiente estructura. CIREG.1 REG.2
REG.3
...
REG.N
Espacio libre
INFO DE CONTROL
La INFO DE CONTROL es la longitud de registro cuando se trate de
registros de longitud variable. La reunin de los DATA RECORD con su
respectivo INFO de CONTROL es la STORED RECORD. El espacio libre en
un archivo KSDS puede estar distribuido de 2 maneras. Espacio libre
al final de cada CI. CI completo libres. VSAM considera los CI como
si estuvieran contiguos y trata un archivo como si este estuviera
almacenado en memoria virtual partiendo de la direccin 0
(cero).ARCHIVO
CA 1
CA 2
CA 3
...CI 3
CA n
CI 1
CI 2
Reg. 1
Reg. 2
......
Reg. n
INFO DE CONTROL
Un conjunto de CI pueden ser agrupados lgicamente para formar un
CONTROL- AREA. Un conjunto de ndices es creado para cada CA y adems
un conjunto particular contiene punteros a los CI que dependen de
los CA. Los ndices para un CA forman un SSE (Sequenced Set
Elements) y el conjunto de SSE forma un sequence set. Tambin se
pueden construir ndices para un nivel superior y eso se llama un
INDEX SET que va a contener un registro para cada SSE.
Organizacin y manejo de archivos
28 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Los archivos VSAM KSDS pueden ser procesados en 3 formas.
Sequential. Skip sequemtial. Directo.95 200 310 3
SET INDEX
30
73
95
112
170
200
240
273
310
12
30
FS
50
65
73
87
95
FS
SEQUENCE SET
CI
5
CI
23 18 30
CI FS
12 FS
FS
CA (Control Area)
Sequential. En este caso el proceso accesa los registros de
acuerdo a la secuencia de clave del archivo. Se puede especificar
en VSAM una clave especfica o genrica con la 1ra. sentencia de
Inputoutput que aparezca en el programa lo que provocar que el
procesamiento secuencial comenzar desde una clave especifica o
desde la 1 ra. clave genrica. clave especfica -- cdigo. clave
genrica -- apellido. Skip sequential. Involucra el acceso en orden
de un sub conjunto de registros del archivo. Asumamos que tenemos
un sub conjunto ordenado de la claves, para procesar estos
registros cuyas claves estn ordenadas en VSAM es posible usar los
link horizontales entre SSE en el sequenced set. Directo. Este
acceso se logra por el recorrido del rbol de ndices. El CI
apropiado es recuperado y el registro deseado es accesado en
memoria virtual. Administracin de datos. Deleteo. El espacio
ocupado por el registro es recuperado y agregado al espacio libre
del CI (se hace un reformateo).
Organizacin y manejo de archivos
29 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
Esto acarrea por supuesto una actualizacin de ndices. Insercin.
Si no hay espacio, entonces se usa un CI adicional, llamado CI
split El nuevo registro es puesto en el lugar que corresponde por
movimiento de los otros registros. Para cuando no quedan ms CI
libres y se debe insertar un nuevo registro existe un overflow de
CA. ESDS (Entry Sequenced Data Set). A diferencia de los archivos
KSDS los ESDS no tienen ndices asociados es decir no se puede
accesar en forma directa, sino que la nica forma de acceso es va la
RBA. Caractersticas. Acceso secuencial. No hay espacios libres
reservados. Adicin de registros siempre al final fsico del archivo
de datos. Solamente permite actualizaciones. No permite eliminar
registros. Los registros que se crean son cargados consecutivamente
cuando un CA esta completo un nuevo CA es abierto. Un registro
puede ser modificado secuencialmente o selectivamente. El largo de
un registro puede ser modificado. RRDS (Relative Records Data Set).
Caractersticas. Solo puede ser soportado por el Assembler.
Organizacin para registros de longitud fija. Los registros son
cargados en casilleros (slots), un slot puede estar ocupado o
libre. Los registros pueden ser cargados secuencialmetne o
selectivamente. Las modificaciones son posibles. Las eliminaciones
son posibles y el slot correspondiente queda disponible. CONCLUSIN
archivos VSAM. Si bien es cierto que los archivos VSAM en la
actualidad se usan poco, es difcil que ellos pierdan vigencia, no
por su utilidad sino que por sus conceptos. El analista programador
pasar la mayor parte de su vida profesional creando archivos a los
que debe darles organizaciones especficas, estas organizaciones
debern responder a diferentes requerimientos como son los tiempos
de respuesta, almacenamiento, comunicaciones, etc. es all en donde
debe emplear todos los conceptos que se han mostrado de las
diferentes organizaciones para obtener el ms alto rendimiento de
los sistemas. Sus soluciones propuestas debern ser creativas,
amalgamando organizaciones de distinto tipo, debiendo evaluar si
deber sacrificar el llegar a un estado ptimo de normalizacin
produciendo una cierta redundancia, si es que el requerimiento as
lo exige.
CONTENIDO
Organizacin y manejo de archivos
30 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
1.-
Ejercicios.
Para los siguientes archivos: Archivo: Alumnos.dat Organizacin:
Secuencial indexada. Campos: Rut 9(8). Nombre x(25). Cdigo de
carrera 99. Direccin x(20). Ciudad x(10). Archivo: Carreras.dat
Organizacin: Secuencial. Campos: Cdigo de carrera 99. Nombre de
carrera x(15). El (los) programa (s) deber (n) permitir. Ingresar
y/o eliminar alumnos, modificar el campo direccin. Listar alumnos
por carreras, ordenados alfabticamente. Listar alumnos que vivan en
una ciudad. Listar alumnos de una carrera cualquiera, a partir: -De
un nombre. -De un RUT. Todos los listados pueden ser en orden
creciente o decreciente. Problema Defina la estructura de los
archivos y los procesos para obtener las salidas solicitadas. En
una empresa de envos de giros usted debe crear un sistema a partir
de los siguientes archivos: Archivo: CLIENTES.DAT Organizacin:
Campos: RUT cliente x(8) Razn social x(40) Forma de pago xx. (1 al
contado, 2 cta. cte., 3 con cheque a fecha, 4 SALIDAS.
2.-
Para los siguientes archivos:Archivo: PRODUCTOS.dat Organizacin:
Secuencial indexada. Campos: Cdigo producto x(6). Cdigo de familia
99. Cdigo prd. Alternativo x(6). Descripcin x(25). Stock 9(5)
comp-0. Fecha ltimo movimiento 9(8) (SSAAMMDD) Ubicacin x(10) ?????
Archivo: FAMILIAS.dat Organizacin: Relativa. Campos: Cdigo de
familia 99. Nombre familia x(20). Porcentaje de ventas 99V99. ltima
fecha de mantencin 9(8) (SSAAMMDD) ????? Archivo: MOVIMIENTOS.dat
Organizacin: Secuencial indexada. Campos: RUT cliente/proveedor
9(8). Nro. factura 9(7). Cdigo de producto x(6). Fecha de factura
9(8) (SSAAMMDD). Valor 9(8) comp-3. Cantidad 9(5) comp-0.
??????
Defina los campos faltantes, procesos, campos claves, archivos
(no maestros) y programas para satisfacer los siguientes
requerimientos.-
-
1 Validar que los productos registren la ltima compra o venta,
si no fuera as deber corregir el archivo de productos (procesar
contra archivos MOVIMIENTOS). 2 Pantalla de consulta con ltimas 5
compras realizadas para un producto solicitado.(rut prv., fecha,
valor, cantidad, etc.). 3 Listar inventario valorizado por nombre
de familia de productos.
Organizacin y manejo de archivos
31 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
4 Listar inventario valorizado en orden creciente de cdigo de
productos a una fecha determinada. 5 Pantalla de consulta de
productos, si tiene stock 0, mostrar productos alternativos. 6 Para
un proveedor mostrar una compra determinada (= proveedor, = nro,
factura). 7 Listar en orden decreciente por monto de compra, los 5
proveedores (de mayor monto de compra) a los que se les ha comprado
a partir de una fecha determinada. 8 Listar, en orden decreciente,
las ubicaciones con su valor de inventario. 9 Listar los productos
con mayor rotacin (los que ms se compran) a partir de una fecha
determinada. 10 Listar los Rut de clientes en orden decreciente de
compra a partir de una fecha determinada. 11 Defina un proceso que
verifique que los precios de venta de los productos son los que
corresponden. NOTAS: Puede haber familias que no tengan productos.
Puede haber productos que estn en el archivo COMPRAS y que no estn
en el archivo PRODUCTOS. Los valores de venta de cada producto estn
asociados a un porcentaje que depende de la familia de productos.
La valorizacin de inventario debe hacerse con el ltimo precio de
compra que exista. -
Para los siguientes archivos:Archivo: PRODUCTOS.dat Organizacin:
Secuencial indexada. Campos: Cdigo producto x(6). Cdigo de familia
99. Cdigo prd. Alternativo x(6). Descripcin x(25). Precio promedio
ponderado 9(8) comp-3. Stock 9(5) comp-0. Fecha ltimo movimiento
9(8) (SSAAMMDD) Ubicacin x(10) ????? Archivo: FAMILIAS.dat
Organizacin: Relativa. Campos: Cdigo de familia 99. Nombre familia
x(20). ????? Archivo: COMPRAS.dat Organizacin: Secuencial indexada.
Campos: RUT proveedor 9(8). Nro. factura 9(7). Cdigo de producto
x(6). Fecha de factura 9(8) (SSAAMMDD). Cantidad 9(5) comp-0. Valor
9(8) comp-3. ?????? Archivo: VENTAS.dat Organizacin: Secuencial
indexada. Campos: Nro. Factura 9(7) Cdigo producto x(6) Cantidad
9(5) Fecha de factura 9(8) (SSAAMMDD) ???????
Defina los campos faltantes, procesos, campos claves, archivos
(no maestros) y programas para satisfacer los siguientes
requerimientos.-
1 Validar que los productos registren la ltima compra, si no
fuera as deber corregir el archivo de productos (procesar contra
archivos VENTAS y COMPRAS). 2 Pantalla de consulta con ltimas 5
compras realizadas para un producto solicitado.(rutprv., fecha,
valor, cantidad, etc.).
-
-
3 Listar inventario valorizado por familia de productos. 4
Listar inventario valorizado en orden creciente de cdigo de
productos a una fecha determinada. 5 Pantalla de consulta de
productos, si tiene stock 0, mostrar productos alternativos. 6 Para
un proveedor mostrar una compra determinada (= proveedor, = nro,
factura). 7 Listar en orden decreciente por monto de compra, los 5
proveedores (de mayor monto de compra) a los que se les ha comprado
a partir de una fecha determinada.
Organizacin y manejo de archivos
32 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
8 Verificar que para los productos alternativos estos sean de la
misma familia que los originales. 9 Listar, en orden decreciente,
las ubicaciones con su valor de inventario. 10 Listar los productos
con mayor rotacin (los que ms se compran) a partir de una fecha
determinada. 11 Listar los productos que han generado mayor
ganancia a partir de una fecha determinada. NOTAS: Puede haber
familias que no tengan productos. Puede haber productos que estn en
el archivo COMPRAS y que no estn en el archivo PRODUCTOS. Los
valores de venta de cada producto estn asociados a un porcentaje
que depende de la familia de productos. -
CONTENIDO
TAREA 3, ORG. Y MANEJO DE ARCHIVOS. Fecha de entrega: 27 de
octubre.
Organizacin y manejo de archivos
33 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
En una empresa dedicada a la comercializacin se ha credo que la
importancia de los clientes es estratgica para el desarrollo y
crecimiento de la organizacin, es as como se le da una importancia
capital al registro de estos.Archivo: CLIENTES.dat. Organizacin:
Directa. (registro fsico de al menos 5 registros lgicos) Campos:
RUT 9(8) Fecha de incorporacin 9(8) (SSAAMMDD) comp-3. Direccin
X(35). Ciudad X(20). Telfono X( E-mail X(35). Estado civil X Fecha
de nacimiento 9(8) (SSAAMMDD) comp-3. ltimas 5 compras - Tipo de
documento - Nmero de documento. Tipo de cliente X (A, B, C).
Archivo: ITEMES.dat Organizacin: Eljala usted. Campos: Cdigo
Descripcin Unidad de medida Valor costo Stock por bodega (3)
Porcentaje venta por tipo cliente (ocurre 3)
9(10). X(40). XXXX. 9(6) comp-3. 9(5) comp-0. 99v99.
Archivo: VENTAS.dat Organizacin: Secuencial indexada. Campos:
Tipo documento (Boleta, Factura). X Nmero de documento 9(7) Fecha
de emisin 9(8) (SSAAMMDD) comp-3. Rut cliente Forma de pago
(Contado, cRdito, cTa.cte.) X Archivo: MOVIM.DAT Organizacin:
eljala usted. Campos: Tipo documento Nmero de documento Cantidad
Cdigo artculo Defina y los procesos y programas para: Actualizar
archivos maestros (clientes e itemes). Adems los clientes tambin
pueden ser incorporados en el momento de la venta. Para efectuar
ventas.
Organizacin y manejo de archivos
34 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
-
Para consultar un documento. Para mostrar una de las ltimas 5
ventas de un cliente. Eliminar clientes eligindolo directamente y
tambin en un proceso batch y transparente en que son eliminados
todos los clientes que no han comprado en los ltimos 6 meses.
Organizacin y manejo de archivos
35 de 36
Universidad Tcnica Federico Santa Mara
T.U. en Computacin e Informtica
BIBLIOGRAFA.1.2.3.4.Prez, Victor & Pino Jos, Curso de
computacin e informtica, Volumen IV, Ed. Universitaria, 1982. Owen
Hanson, Design of computer Data Files. 1982. Bravo C., Juan;
Desarrollo de sistemas de Informacin.,1988, Editorial
universitaria. Wiederhold, Gio; Diseo de Bases de Datos, 2da. Ed.,
McGraw Hill, 1986
Kort, Henry & Silberschatz, Abraham; Fundamentos de bases de
Datos; McGraw Hill; 2da. Ed; 1993 Joyanes, Luis & Zahonero,
Ignacio; Estructura de Datos;Mc Graw Hill; 1999 Loomis, Mary,
Estructura de datos y organizacin de archivos; 2da Ed; prentice
hall, 1991 Archivos de referencias cruzados. Es semejante al
archivo bsico pero est clasificado por otro argumento. Ej. N.cuenta
Nombre Saldo Fecha mov. Arch ref.cruzada. Nombre N.cuenta.
Organizacin y manejo de archivos
36 de 36