Encontro Nacional de Pesquisa em Ciência da Informação - XI ENANCIB 2010 GT 2: Organização e Representação do Conhecimento Comunicação Oral Análise dos princípios metodológicos adotados no Vocabulário Controlado da FINEP Joice Cleide Cardoso Ennes de Souza – UFF Tatiana de Almeida - FINEP RESUMO Analisa a produção do vocabulário controlado da Financiadora de Estudos e Projetos (FINEP) com o objetivo de relacionar os procedimentos metodológicos de análise dos termos contidos no vocabulário com a Linguística, mais precisamente, a Terminologia. Descreve os critérios estabelecidos para estruturar a forma do termo na construção deste vocabulário. Disserta sobre os conceitos de Linguagem Documentária, Sistema de Recuperação da Informação e Terminologia. Apresenta observações sobre uma breve análise lingüística realizada nos campos de preenchimento do formulário eletrônico de apresentação dos projetos à FINEP. Sugere uma metodologia de análise de projetos com base na Lingüística considerando os projetos como um tipo de gênero, com o intuito de explorar as características textuais do documento, agregar aos processos de análise e validação das definições e garantir que os termos utilizados na documentação e no sistema sejam os mais adequados, o que tornaria a recuperação muito mais rápida e fácil. Palavras-chave: Linguagem Documentária. Vocabulário Controlado. Sistema de Recuperação da Informação. Linguística. Terminologia. ABSTRACT
31
Embed
Análise dos princípios metodológicos adotados no Vocabulário Controlado da FINEP
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Encontro Nacional de Pesquisa em Ciência da Informação - XIENANCIB 2010
GT 2: Organização e Representação do Conhecimento
Comunicação Oral
Análise dos princípios metodológicos adotados noVocabulário Controlado da FINEP
Joice Cleide Cardoso Ennes de Souza – UFFTatiana de Almeida - FINEP
RESUMO
Analisa a produção do vocabulário controlado da Financiadorade Estudos e Projetos (FINEP) com o objetivo de relacionar osprocedimentos metodológicos de análise dos termos contidos novocabulário com a Linguística, mais precisamente, aTerminologia. Descreve os critérios estabelecidos paraestruturar a forma do termo na construção deste vocabulário.Disserta sobre os conceitos de Linguagem Documentária, Sistemade Recuperação da Informação e Terminologia. Apresentaobservações sobre uma breve análise lingüística realizada noscampos de preenchimento do formulário eletrônico deapresentação dos projetos à FINEP. Sugere uma metodologia deanálise de projetos com base na Lingüística considerando osprojetos como um tipo de gênero, com o intuito de explorar ascaracterísticas textuais do documento, agregar aos processosde análise e validação das definições e garantir que os termosutilizados na documentação e no sistema sejam os maisadequados, o que tornaria a recuperação muito mais rápida efácil.
Palavras-chave: Linguagem Documentária. VocabulárioControlado. Sistema de Recuperação da Informação. Linguística.Terminologia.
ABSTRACT
Production of the controlled vocabulary of Financiadora deEstudos e Projetos (FINEP) was examined in order to relate themethodological procedures for analysis of the terms containedin the vocabulary to Terminology theory. Criteria to structurethe verbal form in the construction of the vocabulary werepresented. Concepts of Documentary Language, InformationRetrieval System and Terminology were explained. Brieflinguistic analysis observations were considered in the fieldsfilling of electronic submission of projects to FINEP. Amethodology for project analysis based on Linguistics wassuggested, considering projects as a kind of genre andexploring textual document characteristics. Analyticalprocedures and validation were added to the definitions toensure that the terms used in documentation and the system arethe most appropriated.
Keywords: Documentary Language. Controlled Vocabulary. Information Retrieval System. Linguistics. Terminology.
2
1 INTRODUÇÃO
O volume informacional gerado nos dias atuais desafia os
profissionais de informação no que diz respeito ao
armazenamento e ao tratamento da informação. Como representar
o conteúdo de modo a permitir que os usuários tenham acesso?
Como possibilitar que essa informação seja utilizada pelo meio
corporativo, tornando o conhecimento tácito em conhecimento
explícito? A organização do conhecimento assume cada vez mais
um papel relevante nas tomadas de decisão pelas empresas.
Dentro desse contexto observamos a FINEP – Financiadora de
Pesquisas e Projetos, agência nacional de fomento de Ciência e
Tecnologia, vinculada ao MCT – Ministério de Ciência e
Tecnologia. Um dos objetivos da FINEP é incentivar a produção
de conhecimento científico no Brasil e para isso necessita de
uma infra-estrutura informacional que permita aos seus
técnicos aprovarem ou não os projetos submetidos ao
financiamento que estejam de acordo com política nacional de
Ciência e Tecnologia.
Um dos instrumentos usados na organização da informação da
FINEP é o vocabulário controlado com termos obtidos a partir
da análise dos projetos aprovados pela instituição.
Nesse trabalho objetivamos contextualizar a produção do
vocabulário controlado da FINEP, relacionando-o com a
Terminologia, de modo a permitir a apropriação de
procedimentos metodológicos na análise dos termos contidos no
vocabulário, conjuntamente com uma breve análise lingüística
dos projetos.
3
2 CONTEXTO INSTITUCIONAL: FINEP
A FINEP é uma empresa pública que tem como missão o
desenvolvimento econômico e social do Brasil por meio do
fomento à Ciência, Tecnologia e Inovação (C,T&I) em empresas,
universidades, institutos tecnológicos e outras instituições
públicas ou privadas. Procura atuar em toda a cadeia de
inovação, com foco em ações estratégicas, estruturantes e de
impacto para o desenvolvimento sustentável do Brasil. Foi
criada em 24 de julho de 1967 para institucionalizar o Fundo
de Financiamento de Estudos de Projetos e Programas, originado
em 1965. Posteriormente, a FINEP substituiu e ampliou o papel
até então exercido pelo Fundo de Desenvolvimento Técnico-
Científico (FUNTEC) do Banco Nacional de Desenvolvimento
Econômico e Social (BNDES) constituído em 1964 com a
finalidade de financiar a implantação de programas de pós-
graduação nas universidades brasileiras. (FINANCIADORA, 2010)
Estão associadas a financiamentos da FINEP iniciativas de
C,T&I de empresas em parceria com Instituições Científicas e
Tecnológicas (ICTs), que tiveram sucesso econômico, tendo
como exemplos: o desenvolvimento do avião Tucano da Empresa
Brasileira de Aeronáutica (Embraer); os projetos da Empresa
Brasileira de Pesquisa Agropecuária (Embrapa) e de
universidades; e projetos de pesquisa e de formação de
recursos humanos da Petrobras, em parceria com universidades,
que contribuíram para o domínio da tecnologia de exploração de
petróleo em águas profundas. (FINANCIADORA, 2010)
4
A base de atuação da FINEP está focada em diretrizes
estratégicas que norteiam a concessão de benefícios para os
usuários. Todas as propostas de financiamento passam por um
processo seletivo, no qual são avaliados três critérios
técnicos: o mérito intrínseco da proposta, avaliado segundo as
diretrizes estratégicas, os eixos operacionais e os critérios
de cada ação; o mérito relativo da proposta frente às outras -
isto acontece quando existem propostas competitivas; e a
sustentabilidade econômica e financeira do proponente.
(FINANCIADORA, 2010)
De forma geral, a operação da instituição está concentrada
em quatro diferentes tipos de programas: as chamadas públicas,
o fomento direto a empresas e instituições de pesquisa e
extensão, o atendimento à demanda espontânea e os estudos e
projetos de desenvolvimento tecnológico relacionados a
políticas governamentais.
Um dos tipos de financiamento é promovido através dos
Fundos Setoriais de Ciência e Tecnologia, que beneficiam
projetos de pesquisa e inovação. Os fundos setoriais são
divididos, respeitando áreas temáticas quanto aos
conhecimentos em C,T&I e consistem em bases de dados que
guardam as informações sobre os projetos de pesquisa no
sistema da FINEP. Os projetos contêm as informações
científicas e tecnológicas, já que seus relatores são
pesquisadores do setor que desejam financiamento para seus
estudos. Assim, os fundos setoriais armazenam as informações
dos projetos, conforme sua área temática, e encontram-se
5
guardados fisicamente no Setor de Arquivo. (FINANCIADORA,
2010)
As informações dos projetos permitem criar a inovação
desejada pelas organizações, e satisfazem os objetivos da
FINEP de expansão do conhecimento e geração de impactos
positivos no desenvolvimento socioeconômico brasileiro. Por
isso têm alto potencial para o desenvolvimento do setor de
C,T&I e do parque industrial brasileiro. Desta forma, as
informações científicas e tecnológicas fornecem condições para
obtenção de indicadores de desempenho, que podem ser
utilizados pelos gestores ao tomarem decisões, dentro de suas
organizações. Para isto, é imprescindível que a organização
saiba quais informações possui e tenha condições de encontrá-
las de forma satisfatória, ou seja, os recursos informacionais
devem ser capazes de fornecer informação adequada.
(FINANCIADORA, 2010)
Em maio de 2008, a FINEP iniciou a elaboração do seu Plano
de Gestão Estratégica (PGE) com o objetivo de definir sua
visão de futuro compartilhada, seu perfil de atuação e suas
diretrizes estratégicas. Foram constituídos sete Grupos
Temáticos, que produziram um conteúdo de apoio para a tomada
de decisão, sendo um destinado especificamente para Gestão do
Conhecimento, com a participação da Biblioteca e do Núcleo de
Documentação. Foram contribuições dos profissionais destes
setores para o PGE os resultados obtidos com a gestão da
informação proporcionada pelo desenvolvimento dos projetos de
construção do Vocabulário Controlado FINEP e do Portal da
Informação.
6
3 SISTEMAS DE RECUPERAÇÃO DA INFORMAÇÃO: BIBLIOTECA E NÚCLEO
DE DOCUMENTAÇÃO
Adotando o esquema elaborado por Lancaster (2004, p. 2),
sobre um sistema de recuperação da informação (SRI) e as
expressões usadas pelo autor, destacamos como produtor da base
de dados ou o contexto institucional, a FINEP e mais
especificamente a Biblioteca e o Núcleo de Documentação, os
setores que representam as informações contidas nos projetos
de modo que sejam recuperadas posteriormente. O acervo
arquivístico dos projetos é considerado como a população de
documentos do SRI e a população de usuários da base de dados é
representada pelos analistas e técnicos responsáveis pelas
ações de planejamento.
Um SRI pode ser definido como um conjunto de dados
padronizados, armazenados em meio eletrônico, utilizados para
identificar informação e fornecer sua localização. A meta de
um sistema de informação é permitir que um usuário recupere
documentos através de certas características específicas (por
autor, título conhecido, assunto ou qualquer combinação desses
elementos). Exemplificando, o usuário se dirige a um sistema
de recuperação da informação com uma consulta com base no que
necessita. O sistema então compara a consulta com
representações dos documentos do sistema. A tarefa do sistema
é retornar ao usuário o documento ou os documentos que mais
satisfaçam à necessidade do usuário. A intenção é que alguns
ou todos os documentos apresentados satisfarão, parcialmente
7
ou totalmente, a necessidade de informação do usuário (ELLIS
apud HARTER; HERT, 1997, p.16).
Segundo Araújo Júnior (2007, p.72), os sistemas de
recuperação da informação dizem respeito a um sistema de
operações interligadas para identificar, dentre um grande
conjunto de informações (base de dados, por exemplo), aquelas
que são de fato úteis, ou seja, que estão de acordo com a
demanda expressa pelo usuário. Para que a necessidade
informacional do usuário seja atendida, dois conceitos muito
importantes devem ser observados: revocação e relevância.Para qualquer leitor que procure a biblioteca embusca de informações haverá certos itens noacervo que serão relevantes. Entre eles serápossível estabelecer alguma ordem de precedência;uns serão definitivamente relevantes, outros terãoutilidade, porém menor, enquanto alguns terãoapenas uma relevância marginal. [...] Entretanto,temos de convir que quanto mais materialrevocarmos, menos probabilidade haverá de algumdos itens ser relevante. [...] Existe, portanto,uma relação inversa entre revocação – a quantidadede itens adicionais que encontramos ao ampliar apesquisa – e a relevância – a probabilidade deeles coincidirem com as exigências do leitor(FOSKETT, 1973, p.10-11).
Normalmente, o mais adequado é que se consiga um nível
mais alto de relevância, combinado com um nível mais baixo de
revocação, isso significa a recuperação de poucos itens, porém
contendo o tipo de informação que o usuário procura.
Entretanto, há situações em que o usuário busca uma alta
revocação “Tantas informações quanto forem possíveis, mesmo
que isso o obrigue a examinar uma porção de itens que acabarão
sendo de pouco ou nenhum valor para si” (FOSKETT, 1973, p.11).
8
Segundo Le Coadic (1996), a recuperação da informação
possui limitações associadas à necessidade de informação,
entendida como elemento-chave para a compreensão do motivo
pelo qual os usuários se envolvem com o processo de busca e
recuperação da informação. Sobre isso, Foskett (1996) diz que
as necessidades de informação acabam por gerar determinados
graus de imprecisão, ou seja, incapacidade de um sistema de
informação de recuperar documentos úteis frente à solicitação
do usuário, sobretudo se há negociação com o mesmo.
Foskett (1973, p. 11) também comenta que a relevância é um
fator subjetivo que depende do indivíduo, por exemplo, dois
usuários distintos podem estar procurando por um mesmo
assunto, mas formularam questões diferentes e assim recuperam
documentos diferenciados também.
Quanto à probabilidade de erro num sistema de recuperação
da informação, é importante lembrar que tanto os indexadores,
quanto os usuários são humanos, portanto, são passíveis de
errar. Por este motivo, o sistema deve permitir correções e os
indexadores devem utilizar padrões explicitados em uma
política de indexação que reduza, tanto quanto possível, a
probabilidade de erro. Os erros repercutirão sobre a
relevância, pois obteremos respostas erradas, também
prejudicarão a revocação, pois nos escaparão itens que
tínhamos de encontrar. É preciso, portanto, que nos
asseguremos de que o sistema utilizado não possui uma
tendência intrínseca a aumentar o erro humano (FOSKETT, 1973,
p. 12).
Para Campos
9
Todo movimento existente nos Sistemas deRecuperação da Informação tem por princípio geralpossibilitar a seu usuário o acesso àinformação/documentos. Nestes Sistemas, váriossão, atualmente, os instrumentos utilizados pararepresentar o conhecimento de uma dada área dosaber. Estes instrumentos são denominados, de umaforma geral, linguagens documentárias, como oTesauro e os esquemas de Classificação, para citarapenas os mais relevantes (CAMPOS, 2001, p.17).
Já Aitchinson e Gilchrist (1979) afirmam que além dos
parâmetros que devem ser estabelecidos para um sistema de
informação, outra preocupação importante é quanto ao tipo de
linguagem documentária adequada para cumprir sua função de
recuperar a informação de maneira mais eficiente. Esta
preocupação ressalta o relacionamento funcional existente
entre os sistemas de informação e as linguagens através das
quais os usuários recuperam informações relevantes e
pertinentes.
No presente trabalho, objetivamos estudar o vocabulário
controlado como instrumento utilizado para representar o
conhecimento gerado a partir dos documentos da FINEP.
4 LINGUAGEM DO SISTEMA: VOCABULÁRIO CONTROLADO
Nos dias atuais, o interesse pelas linguagens
documentárias é renovado devido ao volume de informação
produzido e sua disseminação rápida e ampla em virtude do meio
eletrônico. A recuperação e os instrumentos usados na
representação assumem aspectos importantes, pois estão
relacionados ao atendimento das necessidades dos usuários.
10
Segundo a literatura, com o término da II Guerra Mundial,
mais precisamente a partir da segunda metade do século XX com
a chamada "explosão informacional", as pesquisas científicas
ganharam mais espaço e com elas, também, os estudos sobre as
linguagens documentárias (CINTRA et al., 2002; LANCASTER,
1986).Linguagens documentárias são linguagensartificiais, controladas, criadas dentro dosobjetivos de uma organização/setor, a partir de umconjunto de documentos e domínio, para seremutilizadas na indexação e recuperação dainformação em um determinado sistema derecuperação da informação (SOUZA, 2007, p.18-19).
A linguagem documentária pode ser considerada um
instrumento de mediação entre a linguagem do sistema e a dos
usuários. Segundo Lara (2004, p.233) ela é um instrumento que
exerce a função de ponte entre estas duas linguagens. Essa
potencialidade da linguagem documentária decorre do fato de
que ela constitui em si mesma, um produto autônomo, um sistema
significante, ou seja, um meio organizado em torno de uma área
temática, que é uma das condições para possibilitar as
operações de representação e de acesso à informação.
Tálamo, Lara e Kobashi (1992, p.197) afirmam que as
linguagens documentárias são consideradas instrumentos de
controle da terminologia de uma determinada área do
conhecimento atuando em dois níveis: na representação da
informação obtida pela análise e síntese de textos; e na
formulação de equações de busca da informação. E ainda
acrescentam, “sendo assim, a questão fundamental que se
encontra entre as linguagens documentárias e os documentos,
11
diz respeito aos princípios que regulam a representação da
informação”.
As linguagens documentárias são definidas por Campos
(2001, p.17) como os "instrumentos utilizados para representar
o conhecimento de uma dada área do saber”. A linguagem
possibilita o acesso à informação, ou seja, oferece a
possibilidade concreta de ligar o usuário ao conhecimento
organizado em um dado sistema de informação.
Segundo Lancaster (1986, p. 146), este tipo de linguagem
existe para permitir que o indexador represente o assunto do
documento de modo consistente, aproximar o vocabulário usado
pelo indexador das expressões usadas pelo usuário e prover
significado, de maneira que o usuário formule estrategicamente
suas solicitações e obtenha um bom resultado.
Boccato (2005, p. 52) esclarece que as linguagens
documentárias tem como funções representar o conteúdo dos
documentos e mediar a recuperação da informação a partir da
representação das perguntas dos usuários.
Para Dodebei (2002, p.46) “a linguagem documentária
proporciona não só um controle das dispersões semânticas e
sintáticas da língua natural como delimita o domínio
conceitual do campo de estudo em questão”, sendo esta, por
exemplo, uma das vantagens das linguagens documentárias em
relação às linguagens naturais.
Enquanto à finalidade e coordenação, as linguagens
documentárias podem ser notacionais ou verbais e pré ou pós-
coordenadas. As notacionais utilizam símbolos (notações) que
auxiliam na organização e na localização física dos
12
documentos. Alguns exemplos mais conhecidos de linguagens
documentárias notacionais são: a Classificação Decimal de
Dewey (CDD) e a Classificação Decimal Universal (CDU). Já as
linguagens documentárias verbais também têm por função a
representação do assunto dos documentos, mas não sua
organização física. Como exemplos de linguagens documentárias
verbais podemos citar os cabeçalhos de assunto, vocabulários
controlados e tesauros.
As linguagens documentárias pré-coordenadas são aquelas em
que os cabeçalhos são combinados na entrada do sistema,
enquanto nas pós-coordenadas o relacionamento entre os termos
se dá no momento da recuperação da informação (LANCASTER,
1986).
O controle terminológico é um princípio fundamental no
processo de indexação e recuperação de informação em sistemas
informatizados, propiciando um acesso otimizado à base de
dados em meio eletrônico, organização de bibliotecas virtuais,
entre outros (BRASIL et al., 2002). A recuperação de
informações se refere ao encontro da informação desejada, para
que isso ocorra é necessário tratar as informações contidas no
documento, esteja ele codificado em qualquer suporte.
Hoje em dia quase todos os sistemas introduzem algum tipo
de controle sobre seus termos, ou seja, utilizam um
vocabulário controlado. Para Foskett (1973, p.40), uma das
razões para que haja este controle é que o decorrente uso de
diferentes palavras por diferentes autores para designar uma
mesma ideia (sinônimos) pode causar muitos problemas,
principalmente a diminuição da revocação.
13
O vocabulário controlado auxilia o tratamento da
informação, pois é uma lista de termos padronizados que tem
por função representar os assuntos dos documentos e
possibilitar a recuperação mais precisa do conteúdo. Neste
trabalho, o vocabulário controlado foi considerado uma
linguagem documentária por ter como objetivo permitir que o
indexador represente o assunto do documento de modo
consistente, aproximando o vocabulário usado pelo indexador
das expressões usadas pelo usuário, provendo significado, de
maneira que o usuário formule estrategicamente suas
solicitações e obtenha resultado seletivo. É um instrumento
que surge da necessidade de instituições de construir
linguagens próprias e específicas, a fim de promover maior
precisão e eficácia na comunicação entre os usuários e o
sistema de informações.
As principais funções de um vocabulário controlado são
representar e controlar a informação e o conhecimento e
recuperar documentos e informações com consistência. A
representação é estabelecida por meio de um conjunto de termos
chamados de “descritores”. O controle ou padronização do
vocabulário garante uma comunicação efetiva entre sistema de
informação e usuários, além de proporcionar uma recuperação
eficiente. Este controle é necessário porque a falta de
padronização léxica contribui para uma má localização ou
identificação da informação. O vocabulário funciona também
como uma ferramenta no processo de indexação dos documentos,
onde o indexador, após a leitura e a interpretação dos textos,
14
utiliza seus descritores para descrever adequadamente o
conteúdo dos documentos.
De acordo com Lancaster (2004), a indexação é composta
pelas etapas de análise e tradução dos conceitos de um
documento. Na análise seriam feitos o reconhecimento e
identificação de conceitos que compõem um documento, seguido
da seleção desses conceitos. A tradução é a etapa na qual é
feita a transposição do conceito para a linguagem documentária
utilizada pelo sistema (neste caso, o vocabulário controlado).
A recuperação consistente da informação, outra função
muito importante do vocabulário, gera confiança no sistema. Um
vocabulário bem elaborado deve refletir tanto os objetivos do
sistema de informação, quanto a linguagem dos usuários. Todos
os esforços devem ser para que ele se torne um sistema útil.
Para tanto é necessário que haja uma atualização periódica,
porque assim como as áreas do conhecimento ou a temáticas nele
representadas, o vocabulário é uma linguagem dinâmica.
Segundo Foskett (1973, p. 40) o vocabulário controlado
permite indexação de conceitos, estabelecendo uma descrição-
modelo para cada conceito, usando esta descrição sempre que
for conveniente, tenha garantia literária ou não. Além das
vantagens arroladas sobre os sistemas pós-coordenados, outras
questões merecem atenção: a seleção de termos e definição de
relações entre os termos.
Lancaster (1979, p. 191) arrola os principais requisitos
necessários em um vocabulário controlado em um sistema de
informação, cuja principal função é permitir ao usuário a
recuperação de documentos relevantes:
15
1. Ter garantia ("warrant") proveniente da literatura e dos
usuários atuais ou potenciais.
2. Ser específico o suficiente para permitir que um grande
número de usuários recupere a informação com um nível
aceitável de precisão.
3. Ser suficientemente pós-coordenado de modo a evitar
problemas com coordenações falsas e relações incorretas entre
termos.
4. Promover a consistência na indexação e busca através do
controle de sinônimos.
5. Reduzir a ambigüidade terminológica através da separação de
homógrafos e da definição de termos cujo significado não
esteja claro.
6. Dar assistência ao indexador e ao usuário na seleção dos
termos mais apropriados necessários a representar um assunto
em particular através da estrutura hierárquica ou referência-
cruzada.
O vocabulário controlado, sob a perspectiva da recuperação
da informação, é um instrumento de controle terminológico.
Para que seja possível a compatibilização das diversas
linguagens (do produtor do documento, do profissional da
informação e do usuário) é necessário que se estabeleçam
regras através de recursos e de relacionamentos entre os
descritores.
A organização interna de um vocabulário controlado revela
e reflete a concepção de mundo de um dado sistema, sua
organização, características do acervo e como a informação
será representada. Esse aspecto indica o potencial político de
16
um sistema de informação. A seguir, trataremos do vocabulário
controlado da FINEP elaborado para atender os objetivos
informacionais desta instituição.
4.1 Projeto Vocabulário Controlado da FINEP
Com a finalidade de contribuir com a gestão da informação
da FINEP, a Biblioteca e o Núcleo de Documentação desta
instituição vem empreendendo uma variedade de esforços na
melhoria dos seus serviços. Somente com a modernização de seus
serviços será possível se adequar às rápidas mudanças no
crescimento da importância do uso e da capacidade de
recuperação das informações. Nesse contexto foi elaborado o
projeto do “Vocabulário Controlado da FINEP – VCF”. O VCF visa
unificar a terminologia no tratamento da informação dos
acervos bibliográficos e de projetos a fim de estabelecer uma
linguagem de indexação padronizada entre sua base de dados e
seus usuários.
O Projeto do VCF teve início em 2006, tendo como objeto de
trabalho a terminologia utilizada na indexação do acervo
bibliográfico da Biblioteca FINEP. Os termos, já existentes na
base de dados, foram padronizados e estruturados através de
relacionamentos entre eles. No segundo semestre de 2007, o
foco voltou-se para a indexação das propostas de financiamento
aprovadas que compõem o acervo corrente do Arquivo Central da
empresa, dando início a um Projeto Piloto. Nesta fase foram
indexados os projetos do fundo setorial CT-Infra - aprovados
em 2006. O projeto piloto deu subsídios para o início da
17
elaboração dos princípios de indexação. Já em 2008 foram
indexados todos os projetos aprovados durante o ano de 2007,
trabalho este orientado pelos princípios de indexação
estabelecidos durante o projeto piloto.
Paralelamente ao processo de indexação, está sendo
realizado o processo de construção/atualização do VCF, a
partir da identificação, definição, classificação e
categorização dos novos descritores e do estabelecimento das
relações entre eles e os descritores já existentes no VCF.
O Vocabulário Controlado constituído é a base para
indexação das propostas de financiamento do Arquivo Central e
é atualizado no desenvolvimento do processo de representação
da informação. Devido ao amplo espectro dos assuntos
contemplados nos projetos, se faz necessário um constante
controle da indexação e da terminologia.
5 POPULAÇÃO DE DOCUMENTOS: PROJETOS FINEP
Os projetos da FINEP cumprem uma convenção interna pré-
estabelecida, onde é preciso atender as exigências dos Fundos
Setoriais de Ciência e Tecnologia ou Subvenções. Apresentam os
campos relacionados a seguir:
o Dados Gerais;
o Referência;
o Convênio/Contrato;
o Data de Assinatura;
o Prazo de Execução Física Financeira;
o Prazo de Prestação de Contas Final;
18
o Período de Realização;
o Fonte;
o Fundo;
o Mecanismo de financiamento/Protocolo;
o Título do Projeto;
o Objetivo;
o Sigla do Projeto:
o Setor da Economia;
o Área do Conhecimento;
o CNPJ Proponente:
o Proponente;
o Executor;
o UF Executor;
o Coordenador;
o Departamento
o Modalidade;
o Fase atual;
o Status;
o Técnicos;
o Técnicos Análise;
o Técnico Acompanhamento;
o Técnico de Crédito;
o Técnico Financeiro;
o Advogado;
o Fases;
o Formulário Eletrônico – FAP;
o Relatórios das fases;
o Rel. Pré-Qualificação;
19
o Rel. Avaliação de Mérito;
o Rel. Análise Conclusiva;
o Relação de Itens;
o Plano de Trabalho;
o Minuta de Decisão da Diretoria;
o Histórico das Atividades do Workflow;
o Histórico dos Cronogramas Aprovados;
o Histórico das Prestações de Contas;
o Informações Financeiras;
o Ação;
o Valores do Projeto;
o Valores Liberados.
Ao analisar os projetos a partir de uma perspectiva
lingüística, constatamos a aproximação entre Ciência da
Informação e Lingüística, já que ambas contemplam questões
relativas ao funcionamento da linguagem. Tal relacionamento é
observado principalmente na área de representação da
informação, uma vez que há o processo de construção do sentido
na análise documentária, na indexação e na elaboração de
linguagens documentárias.
Como etapa da análise documentária do processo de
indexação dos projetos, as características formais dos
projetos foram examinadas a partir da definição de Vilela e
Villaça (2001, p. 543) para texto utilitário - “esquema de
ação complexo normalizado socialmente” - entendemos que os
projetos da FINEP apresentam um conjunto de traços
predominantes representado por ser mais monológico, uma vez
20
que reflete a opinião da instituição; menos falado, por estar
registrado textualmente; e menos espontâneo, já que a
submissão prevê o cumprimento de exigências com vistas a ser
aprovado [+ monológico – falado – espontâneo].
Ao submeter os projetos às características relacionadas
por BIASI-RODRIGUES, B.; HEMAIS, B.; ARAÚJO, J.C, acreditamos
que os mesmos apresentam aspectos que os definem como gênero
textual, uma vez que assumem um papel específico no processo
comunicativo entre as pessoas jurídicas proponentes do
financiamento e a FINEP. Segundo os autores,
o gênero é identificado como uma classe de eventoscomunicativos realizados por meio da linguagemverbal, e esses eventos são constituídos dediscurso, participantes, funções do discurso eambiente onde se produz e se recebe o discurso(BIASI-RODRIGUES; HEMAIS; ARAÚJO, 2009, p.21).
Os projetos se caracterizam como textos descritivos,
havendo a preocupação de apresentar os objetivos da pesquisa,
etapas a serem cumpridas e relação de recursos financeiros e
humanos. Observamos que esse tipo de texto se baseia no
“poder representativo do léxico”, e no caso dos projetos é
decisivo para uma possível avaliação positiva pelos técnicos e
consultores.
Um aspecto interessante para análise dos textos dos
projetos é a questão da coesão e da coerência. A possibilidade
de estudar a questão da continuidade e articulação, seqüência
e interligação entre as partes do texto e sua influência na
interpretabilidade por parte do profissional de informação no
momento de representar a informação (ANTUNES, 2005).
21
No nosso entendimento, o fluxo representado pela submissão
dos projetos, até sua aprovação ou não, apresenta pontos
comuns com a definição de comunidade discursiva de Swales. O
autor concebe a definição de comunidade discursiva como
àquela:
relacionada à produção de textos como umaatividade social que se realiza de acordo comconvenções discursivas específicas e revela ocomportamento social e o conhecimento dos membrosdo grupo (SWALES apud BIASI-RODRIGUES; HEMAIS;ARAÚJO, 2009, p. 23).
Swales aponta seis características para definir uma
comunidade discursiva: objetivos em comum entre os usuários
dos gêneros, existência de comunicação entre os participantes
da comunidade, viabilidade de troca de informações, capacidade
de desenvolver gênero, gerar e compartilhar léxico (SWALES
Apud BIASI-RODRIGUES; HEMAIS; ARAÚJO, 2009, p. 24).
Na sua revisão do conceito de comunidade discursiva,
Swales introduz a idéia de “divergência, a falta de união e o
preconceito entre os membros” (SWALES Apud BIASI-RODRIGUES;
HEMAIS; ARAÚJO, 2009, p. 26), aspectos não observados
anteriormente. Tal revisão permitiu ampliar o conceito de
comunidade discursiva, incluindo as informações não
concordantes, que apesar da mensagem “negativa” não deixam de
ter um propósito comunicativo.
Como exposto anteriormente, o propósito principal dos
projetos é obter o financiamento para as pesquisas
apresentadas. Para tanto, o documento é analisado e avaliado
por técnicos e consultores ad hoc. Após a leitura de diferentes
22
projetos, observamos que a terminologia usada pelos
proponentes varia, seja devido aos objetivos políticos, aos
regionalismos, ou mesmo à especificidade das áreas do
conhecimento. Essa particularidade terminológica é sentida
pelo profissional de informação após a leitura e identificação
dos termos relevantes para a recuperação do conteúdo do
projeto, justificando a necessidade de um controle mediante a
adoção do vocabulário controlado.
6 TERMINOLOGIA
Fundamentada nos princípios da Lingüística, a Terminologia
segundo Krieger e Finatto (2004) é “um campo de estudos
teórico e aplicado dedicado aos termos técnico-científicos”,
consistindo em uma tentativa de evitar a polissemia e as
ambigüidades do léxico comum. Neste sentido, também segundo as
autoras, a Terminologia é uma face aplicada, sobretudo a
produção de glossários, dicionários técnico-científicos e
bancos de dados terminológicos, uma vez que objetiva a
precisão conceitual. No nosso entendimento, a Terminologia
reconhece o termo como unidade de conhecimento e unidade
lingüística, minimizando os possíveis ruídos em um processo
comunicativo.
Com a preocupação de padronizar o uso dos termos técnico-
científicos, Eugen Wüster (1898-1977) desenvolveu uma série de
estudos sobre os termos, sendo as bases da Terminologia
estabelecidas por ele. Por isso Wüster é considerado o
fundador da Terminologia moderna. Para o autor (WÜSTER apud
23
KRIEGER; FINATTO, 2004), a terminologia de uma área é, em sua
natureza, a expressão de um conhecimento científico,
logicamente estruturado.
Partindo para as aplicações terminológicas deste trabalho,
que é uma das facetas da Terminologia, nas palavras das
autoras:Essas aplicações podem ser compreendidas comotransposições da teoria em benefício de umaprática ou necessidade, quer sob a forma de umametodologia de análise, quer sob a forma decriação de um produto como, por exemplo, umglossário ou uma base de dados (KRIEGER; FINATTO,2004).
Neste caso, o presente trabalho contextualizou a
elaboração de um vocabulário controlado na área de Ciência,
Tecnologia e Inovação (C,T&I). Krieger e Finatto conceituam a
confecção deste tipo de produto como “a aplicação mais
evidente e reconhecida da Terminologia”. Com base neste
reconhecimento que pretendemos estabelecer a relação entre a
construção do Vocabulário Controlado da FINEP e a
Terminologia.
O processo de elaboração de um dicionário terminológico,
como poucos tem consciência, é longo, geralmente lento e
demanda um grande volume de pesquisa textual prévia.
Infelizmente, a maioria dos usuários não chega a perceber a
gama de fatores e de responsabilidades envolvidos nesse tipo
de trabalho (KRIEGER; FINATTO, 2004).
O planejamento do trabalho de elaboração do Vocabulário
Controlado FINEP - VCF vem sendo realizado com base em
diversos critérios pré-estabelecidos. Estes critérios
24
encontram-se registrados numa política de indexação e num
manual de procedimentos. Para que pudessem ser estabelecidas
estas regras, a equipe do VCF elaborou um “projeto piloto”,
como pode ser visto no histórico do projeto. Desta forma foi
possível vivenciar as rotinas de trabalho e assim tornar
possível a percepção antecipada de ajustes de tarefas e das
funções de cada um integrante da equipe. Foram estabelecidos
os seguintes critérios para a forma do termo:
a. Uso de singular e plural – as entradas devem ser no
singular, com exceção dos termos dicionarizados no plural ou
que, eventualmente, tenham sua compreensão prejudicada pela
forma singular.
b. Maiúscula e minúscula – os termos indexadores devem ter suas
entradas no sistema em caixa alta, sem exceção.
c. Sinônimos/quase-sinônimos – quando houver termos que
apresentem a mesma conotação – ou conotação muito próxima – o
procedimento é fazer relação de equivalência, priorizando o
uso da forma mais utilizada. Nos casos em que a sinonímia é
uma sigla, o preferido será a forma por extenso, mesmo que a
sigla seja mais conhecida, pois se prioriza a uniformidade.
d. Gêneros – quando houver entrada de termos que representem
profissões ou adjetivos pátrios, deve-se optar por:
Profissões: gênero masculino. Ex: Bibliotecário (e não
Bibliotecária); Advogado (e não Advogada), etc.
Adjetivos pátrios: de acordo com a palavra núcleo. Ex:
Indústria brasileira (e não indústria
brasileiro).
25
e. Termos homógrafos ou sem clareza de entendimento - usar
qualificadores para termos que não apresentem clareza de
entendimento. Ex: Raça (grupos). Quando uma área do
conhecimento tiver mesma grafia que um termo comum, deve
colocar qualificadores para diferenciá-los: um terá o
qualificador “área do conhecimento” e o outro terá um
qualificador que melhor traduza o conceito. Exemplo:
Administração (área do conhecimento) e Administração
(processo).
f. Exaustividade – a indexação deverá abranger todos os
assuntos contemplados no documento.
g. Especificidade – entrar no nível de especificidade do
projeto, se for geral, será geral, ex: Farmacologia. Se for
h. Ordem – os termos devem ter entrada na ordem direta.
Exemplo: Rio São Francisco e não São Francisco, Rio.
Entretanto, a forma indireta deverá ser considerada como
remissiva, ou seja, será o termo não autorizado.
i. Termos em língua estrangeira – usar o correspondente em
português quando estiver dicionarizado. No caso de não haver o
correspondente em português, utilizar o termo em língua
estrangeira.
j. Siglas – termos que também são conhecidos pelas suas siglas
deverão ter entrada pela forma extensa e a sigla será o termo
não-autorizado.
k. Termos indexadores – palavras ou grupo de palavras que
representam, sem ambiguidade, um conceito (ideia).
26
l. Área geográfica – devem ser indexados os locais os quais as
melhorias da infra-estrutura irão beneficiar. Exemplo:
Implantação de infra-estrutura para criação de um centro de
capacitação para trabalhadores rurais do Sertão Nordestino.
A adoção da Política de Indexação possibilitou traçar
diretrizes para que a indexação seja um processo facilitador
na recuperação informacional dando acessibilidade às
informações oriundas das coleções.
7 CONCLUSÃO
O vocabulário controlado tem se tornado um elemento
fundamental para auxiliar a gestão da informação na FINEP. A
construção desta ferramenta, além de ter proporcionado uma
recuperação muito mais precisa e eficiente dos documentos,
através da indexação, ainda facilitou o acesso ao banco de
dados institucional por conta das modificações e melhoramentos
sugeridos no decorrer do trabalho.
A possibilidade de adotarmos uma metodologia de análise
dos projetos com base na Lingüística – considerando os
projetos como um tipo de gênero, nos permitiria explorar as
características textuais do documento, agregando aos processos
de análise e validação das definições, de modo a garantir que
os termos utilizados na documentação e no sistema sejam os
27
mais adequados, o que torna a recuperação muito mais rápida e
fácil.
Segundo Vilela e Villaça (2001, p.542), “os textos
escritos são configurações objetivadas, que possuem uma
validade intersubjectiva”. Apesar de toda a objetividade
pretendida com os projetos, o indexador ao analisar as
informações contidas nos campos não consegue evitar seus
modelos mentais na produção de sentido. Esta subjetividade
pode ser minimizada com o uso do vocabulário controlado e da
política de indexação.
Uma das vantagens mais significativas que o projeto do
Vocabulário Controlado FINEP (VCF) trouxe para a gestão foi a
possibilidade de extração de mapeamentos, por exemplo, das
ações implementadas pela organização, instituições, áreas
geográficas, entre outros indicadores, mais beneficiados pelo
financiamento FINEP. Estes relatórios somente foram possíveis
após a indexação destes projetos. O VCF também auxilia na
interoperabilidade semântica (compartilhamento de informações
relevantes) – encontrando formas de associar aos documentos
informações que possibilitem resultados eficientes. Além
disso, provê um entendimento unificado de definições de termos
e unifica os indexadores, facilitando o processo de publicação
e compartilhamento das informações dos projetos da
instituição.
28
REFERÊNCIAS
AGUIAR, Andréa V.C.; DINIZ, Isabel C. dos S.; MEDEIROS, João B. Estudo de usuários em bibliotecas públicas e universitárias: em foco as dissertações defendidas no CMCI/UFPB. Informação & Sociedade, Campo Grande, v.12, n.2, 2002. Disponível em: <http://periodicos.ufpb.br/ojs2/index.php/ies/article/viewFile/146/140> . Acesso em 14 abr. 2010.
ANTUNES, I. Lutar com palavras: coesão e coerência. São Paulo:Parábola Editorial, 2005.
ARAÚJO JÚNIOR, Rogério Henrique de. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2007. 176 p
AITCHINSON, J.; GILCHRIST, A. Manual para construção de tesauros. Rio de Janeiro: Brasilart, 1979.
BIASI-RODRIGUES, B.; HEMAIS, B.; ARAÚJO, J.C. Análise de gêneros na abordagem de Swales: princípios teóricos e metodológicos. In: BIASI-RODRIGUES, B.; ARAÚJO, J.C.; SOUSA, S.C.T. Gêneros textuais e comunidades discursivas. Um diálogo com John Swales, Belo Horizonte: Autentica, 2009.
BOCCATO, Vera Regina Casari. Avaliação de linguagemdocumentária em fonoaudiologia na perspectiva do usuário:estudo de observação da recuperação da informação comprotocolo verbal. Marília, 2005. 239f. Dissertação (Mestrado).Ciência da Informação - Faculdade de Filosofia e Ciências,Universidade Estadual Paulista, 2005.
BRASIL, M. I., et al. Vocabulário sistematizado: a experiênciada Fundação Casa de Rui Barbosa. São Paulo: INTEGRAR:CONGRESSO INTERNACIONAL DE ARQUIVOS, BIBLIOTECAS, CENTROS DEDOCUMENTAÇÃO E MUSEUS, 2002, São Paulo. Textos... São Paulo:Imprensa Oficial do Estado, 2002. p.81-94.
CAMPOS, Maria Luiza de Almeida. Linguagem documentária: teorias que fundamentam Sua elaboração. Niterói: EdUFF, 2001.
CINTRA, Ana Maria et al. Para entender as linguagens documentárias. 2.ed.rev. e ampl. São Paulo: Polis, 2002. FOSKETT, A.C. A Abordagem Temática da Informação. São Paulo: Editora Polígono, 1973.
DODEBEI, Vera Lúcia Doyle. Tesauro: linguagem de representaçãoda memória documentária. Niterói: Intertexto; Rio de Janeiro: Interciência, 2002.
FINANCIADORA DE ESTUDOS E PROJETOS. O que é a FINEP? Disponível em: <http://www.finep.gov.br>. Acesso em: 15set. 2010.
FOSKETT, Antony Charles. A abordagem temática da informação. São Paulo: Polígono; Brasília: Ed. Universidade de Brasília, 1973.
______. The subject approach to information. 5. ed. London: Unipub, 1996.
HARTER, S.; HERT, C. Evaluation of Information Retrieval Systems: Approaches, Issues, and Methods. Annual Review of Information Science and Technology (ARIST), v.32, Medford: Martha, 1997
KRIEGER, M. da G.; FINATTO, M. J. B. Introdução à terminologia: teoria e prática. São Paulo: Contexto, 2004, 223p.
LANCASTER, F. W. Indexação e resumos: teoria e prática. 3. ed.Brasília: Briquet de Lemos, 2004. 452 p.
______. Information Retrieval Systems: Characteristics,Testing and Evaluation. 2. ed. New York: J. Wiley, 1979.
______. Vocabulary Control for Information Retrieval. Virginia: Information Resources Press, 1986
LARA, M. L. G. de. Linguagem documentária e terminologia. Transinformação, Campinas, v.16, n. 3, p. 233, set./dez. 2004.
LE CODIAC, Y.-F. A ciência da informação. Brasília: Briquet deLemos Livros, 1996.
SOUZA, Jóice Cleide Cardoso Ennes de. Avaliação de linguagem de indexação aplicada à informação jornalística: estudo de caso. Niterói, 2007. 156f. Dissertação (Mestrado) Ciência da Informação - Universidade Federal Fluminense. Instituto Brasileiro de Informação em Ciência e Tecnologia, 2007.
TALAMO, M. de F.G.M.; LARA, M. L. G.; KOBASHI, N. Y. Contribuições da Terminologia para a elaboração de tesauros. Ciência da Informação, v.21, n.3, p.197-199, set./dez. 1992.
VILELA, Mario; KOCH, Ingedore Villaça. Gramática do texto. In:____. Gramática da Língua Portuguesa. São Paulo: Almedina, 2001.