Top Banner
102 AnÆlise de dinmica de uso e de desem AnÆlise de dinmica de uso e de desem AnÆlise de dinmica de uso e de desem AnÆlise de dinmica de uso e de desem AnÆlise de dinmica de uso e de desempenho: penho: penho: penho: penho: o caso do o caso do o caso do o caso do o caso do web site web site web site web site web site da Embrapa Monitoramento da Embrapa Monitoramento da Embrapa Monitoramento da Embrapa Monitoramento da Embrapa Monitoramento por SatØlite por SatØlite por SatØlite por SatØlite por SatØlite * * Embrapa Monitoramento por SatØlite Av. Dr. Jœlio Soares de Arruda, 803, Parque Sªo Quirino, 13088-300, Campinas, SP, Brasil Fone: +55 19 3256-6030, Fax: +55 19 3254-1100 Ivo Pierozzi Jœnior Ivo Pierozzi Jœnior Ivo Pierozzi Jœnior Ivo Pierozzi Jœnior Ivo Pierozzi Jœnior Pesquisador em Arquitetura da Informaªo e chefe adjunto de P&D. E-mail: [email protected] Eliane Gonalves Gomes Eliane Gonalves Gomes Eliane Gonalves Gomes Eliane Gonalves Gomes Eliane Gonalves Gomes Pesquisadora em MØtodos Quantitativos em P&D. E-mail: [email protected] Maria de ClØofas Faggion Alencar Maria de ClØofas Faggion Alencar Maria de ClØofas Faggion Alencar Maria de ClØofas Faggion Alencar Maria de ClØofas Faggion Alencar BibliotecÆria e pesquisadora em CiŒncia da Informaªo. E-mail: [email protected] Carlos Alber Carlos Alber Carlos Alber Carlos Alber Carlos Alberto de Car o de Car o de Car o de Car o de Carvalho valho valho valho valho Analista de Sistemas e Web designer E-mail: [email protected] Resumo A Embrapa Monitoramento por SatØlite, hÆ mais de uma dØcada, utiliza a Internet como meio de difusªo de resultados de pesquisa e de interaªo com clientes, parceiros e usuÆrios. Com intuito de avaliar o uso do web site por esse pœblico e o desempenho do sistema de comunicaªo eletrnica envolvido, tem-se utilizado o programa Webalizer, que monitora e elabora estatsticas de entradas e sadas do sistema, com base na anÆlise de arquivos de log. Com os indicadores contabilizados pelo programa foi possvel avaliar aspectos sobre a origem dos acessos, as aıes executadas pelos usuÆrios e sobre aspectos do desempenho do sistema em termos de respostas enviadas s solicitaıes dos usuÆrios. Os resultados podem possibilitar a remodelagem do web site, de modo a melhorar a dinmica de interaªo instituiªo-usuÆrio e promover o desenvolvimento de uma abordagem prpria de anÆlise de logs. Palavras-chave Dinmica de uso de websites; Arquivos de log; Perfil de usuÆrio. Usage dynamics and performance analysis: the case study of Embrapa Satellite Monitoring web site Abstract The Embrapa Satellite Monitoring has used for more than one decade Internet as a dissemination mean of its research results and interaction with clients, partners and web site users. In order to evaluate the web site usage and performance of the e- communication system, a Webalizer software has been used to track and to calculate statistics based on web server log file analysis. The objective of the study is to analyse the data and evaluate the indicators related to the origin of requests (search string, country, time), actions performed by users (entry pages, agents) and system performance (error messages). It will help to remodel the web site design to improve the interaction dynamics and also develop a customised log file analyser. Keywords Website usage dynamics; Log files; Users profile. INTR INTR INTR INTR INTRODU˙ˆO ODU˙ˆO ODU˙ˆO ODU˙ˆO ODU˙ˆO A Internet tornou-se, inegavelmente, o mais inovador, democrÆtico e completo meio de comunicaªo atØ agora desenvolvido. Nos dias de hoje, praticamente nªo encontra mais barreiras de expansªo criativa e de abrangŒncia temÆtica. Seus limites estªo mais relacionados ao estÆgio atual de desenvolvimento das tecnologias eletrnicas ou infra-estrutura de telecomunicaıes, ainda precÆria em algumas partes do mundo. Surgida inicialmente no meio militar por meio da Arpanet e, posteriormente, difundida para o meio acadŒmico americano e para as instituiıes de ensino mundiais (Leiner et alii, 2000), atualmente a Internet jÆ foi incorporada por diversos setores e tipos de atividades humanas, tais como a educaªo, comØrcio, mdia, lazer, servios, relaıes interpessoais e outros. Nªo seria exagero considerar que se pode encontrar quase tudo na Internet: desde hora certa atØ psicoterapia on-line! Nesse ponto, destaca-se a importncia da representaªo na economia da informaªo, na qual a identificaªo e a avaliaªo sªo atividades importantes da utilizaªo de recursos na Internet. O trabalho informacional de desenvolvimento e sistematizaªo de representaıes das informaıes disponveis na Internet joga um papel decisivo, viabilizando processos de identificaªo, avaliaªo e uso, atuando como intermediÆria entre usuÆrios e suas necessidades de informaªo e recursos potencialmente importantes. (Marcondes, 2001) Como em todas as outras formas de relacionamento humano, a Internet desenvolve e adota linguagens e cdigos prprios, inerentes sua natureza multimdia. A interatividade Ø outra caracterstica singular da Internet, conferindo-lhe uma dinmica prpria e que a difere de outras formas de comunicaªo remota, com a possibilidade de contatos em tempo real reunindo, em um s veculo, imagens, sons e textos. Ci. Inf., Braslia, v. 32, n. 1, p. 102-114, jan./abr. 2003
13

Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

Mar 05, 2023

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

102

Análise de dinâmica de uso e de desemAnálise de dinâmica de uso e de desemAnálise de dinâmica de uso e de desemAnálise de dinâmica de uso e de desemAnálise de dinâmica de uso e de desempenho:penho:penho:penho:penho:o caso do o caso do o caso do o caso do o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento da Embrapa Monitoramento da Embrapa Monitoramento da Embrapa Monitoramento da Embrapa Monitoramento

por Satélitepor Satélitepor Satélitepor Satélitepor Satélite*****

* Embrapa Monitoramento por Satélite � Av. Dr. Júlio Soares deArruda, 803, Parque São Quirino, 13088-300, Campinas, SP, Brasil� Fone: +55 19 3256-6030, Fax: +55 19 3254-1100

Ivo Pierozzi JúniorIvo Pierozzi JúniorIvo Pierozzi JúniorIvo Pierozzi JúniorIvo Pierozzi JúniorPesquisador em Arquitetura da Informação e chefe adjunto de P&D.E-mail: [email protected]

Eliane Gonçalves GomesEliane Gonçalves GomesEliane Gonçalves GomesEliane Gonçalves GomesEliane Gonçalves GomesPesquisadora em Métodos Quantitativos em P&D.E-mail: [email protected]

Maria de Cléofas Faggion AlencarMaria de Cléofas Faggion AlencarMaria de Cléofas Faggion AlencarMaria de Cléofas Faggion AlencarMaria de Cléofas Faggion AlencarBibliotecária e pesquisadora em Ciência da Informação.E-mail: [email protected]

Carlos AlberCarlos AlberCarlos AlberCarlos AlberCarlos Alberttttto de Caro de Caro de Caro de Caro de CarvalhovalhovalhovalhovalhoAnalista de Sistemas e Web designerE-mail: [email protected]

ResumoA Embrapa Monitoramento por Satélite, há mais de uma década,utiliza a Internet como meio de difusão de resultados depesquisa e de interação com clientes, parceiros e usuários. Comintuito de avaliar o uso do web site por esse público e odesempenho do sistema de comunicação eletrônica envolvido,tem-se utilizado o programa Webalizer, que monitora e elaboraestatísticas de entradas e saídas do sistema, com base naanálise de arquivos de log. Com os indicadores contabilizadospelo programa foi possível avaliar aspectos sobre a origem dosacessos, as ações executadas pelos usuários e sobre aspectosdo desempenho do sistema em termos de respostas enviadas àssolicitações dos usuários. Os resultados podem possibilitar aremodelagem do web site, de modo a melhorar a dinâmica deinteração instituição-usuário e promover o desenvolvimento deuma abordagem própria de análise de logs.

Palavras-chave

Dinâmica de uso de websites; Arquivos de log; Perfil deusuário.

Usage dynamics and performance analysis: thecase study of Embrapa Satellite Monitoring websiteAbstractThe Embrapa Satellite Monitoring has used for more than onedecade Internet as a dissemination mean of its research resultsand interaction with clients, partners and web site users. Inorder to evaluate the web site usage and performance of the e-communication system, a Webalizer software has been used totrack and to calculate statistics based on web server log fileanalysis. The objective of the study is to analyse the data andevaluate the indicators related to the origin of requests (searchstring, country, time), actions performed by users (entry pages,agents) and system performance (error messages).It will help to remodel the web site design to improve theinteraction dynamics and also develop a customised log fileanalyser.

Keywords

Website usage dynamics; Log files; User�s profile.

INTRINTRINTRINTRINTRODUÇÃOODUÇÃOODUÇÃOODUÇÃOODUÇÃO

A Internet tornou-se, inegavelmente, o mais inovador,democrático e completo meio de comunicação até agoradesenvolvido. Nos dias de hoje, praticamente nãoencontra mais barreiras de expansão criativa e deabrangência temática. Seus limites estão maisrelacionados ao estágio atual de desenvolvimento dastecnologias eletrônicas ou à infra-estrutura detelecomunicações, ainda precária em algumas partes domundo.

Surgida inicialmente no meio militar por meio daArpanet e, posteriormente, difundida para o meioacadêmico americano e para as instituições de ensinomundiais (Leiner et alii, 2000), atualmente a Internet jáfoi incorporada por diversos setores e tipos de atividadeshumanas, tais como a educação, comércio, mídia, lazer,serviços, relações interpessoais e outros. Não seriaexagero considerar que se pode encontrar quase tudo naInternet: desde hora certa até psicoterapia on-line!

Nesse ponto, destaca-se a importância da representaçãona economia da informação, na qual a identificação e aavaliação são atividades importantes da utilização derecursos na Internet. �O trabalho informacional dedesenvolvimento e sistematização de representações dasinformações disponíveis na Internet joga um papeldecisivo, viabilizando processos de identificação,avaliação e uso, atuando como intermediária entreusuários e suas necessidades de informação e recursospotencialmente importantes.� (Marcondes, 2001)

Como em todas as outras formas de relacionamentohumano, a Internet desenvolve e adota linguagens ecódigos próprios, inerentes à sua natureza multimídia.A interatividade é outra característica singular da Internet,conferindo-lhe uma dinâmica própria e que a difere deoutras formas de comunicação remota, com apossibilidade de contatos em tempo real reunindo, emum só veículo, imagens, sons e textos.

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 2: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

103

A Embrapa Monitoramento por Satélite presta assessoriaa órgãos públicos e à iniciativa privada em problemas edesafios agropecuários e ambientais, por meio dapesquisa, adaptação, avaliação e disponibilização deconhecimentos e informações originados de aplicaçõesde geotecnologias. Desde 1991, tem utilizado a Internetnão apenas como um veículo passivo de difusão doconhecimento e das informações geradas por seusprojetos de pesquisa (Pierozzi Jr. et alii, 2000). Mas, alémdisso, tem investido na evolução tecnológica que envolveo setor, acompanhando sua rapidez e transformando seuweb site de mera vitrine de resultados para um canaldinâmico e ativo de contato com usuários, clientes eparceiros que solicitam produtos, serviços e ações demonitoramento por satélite.

Diante da importância da opinião, expectativas esatisfação desse público em relação ao conteúdo eformato das informações disponibilizadas, algumasiniciativas de avaliação do uso do web site foramimplementadas. Esses procedimentos visam aaprimoramentos na arquitetura da informação e na gestãodo conteúdo que, segundo Nakano (2002), englobadesenvolvimento, gerenciamento, manutenção eorganização das soluções de conteúdo da Web. Uma dasiniciativas foi o monitoramento dos acessos ao web sitepor web trackings, mecanismos de análise de arquivos delog. Essas ferramentas geram vários relatórios para análisee compreensão de variáveis relacionadas à dinâmica douso de web sites, podendo ser encontradas na Internet(Hjelm, 1999).

Nessa verdadeira babel de informações que é hoje aInternet, o estabelecimento e a manutenção de padrõesde qualidade constituem o diferencial para que seconsolidem os canais de comunicação entre asinstituições e seus usuários: ninguém melhor para avaliarum produto do que a pessoa que dele faz uso.

Os arquivos de log oferecem aos operadores de web sitesdetalhamento substancial dos visitantes, sendo,atualmente, bastante diversificados e qualitativamenteutilizados.

O presente trabalho apresenta e discute os resultados daanálise de três anos e meio de monitoramento do usodo web site da Embrapa Monitoramento por Satélite,visando a traçar um perfil de sua dinâmica e obterindicadores para ajustes e melhorias na concepção,disponibilização ou manutenção das informações. Paratal, foram usados dados sobre a dinâmica e origens douso, temporizados e caracterizados pelos strings e por

países, sobre as ações de uso, caracterizadas pelas páginasde entrada e pelos agentes, e sobre o desempenho doweb site, a partir dos códigos de erros.

ANÁLISE DE ARQUIVANÁLISE DE ARQUIVANÁLISE DE ARQUIVANÁLISE DE ARQUIVANÁLISE DE ARQUIVOS DE OS DE OS DE OS DE OS DE LLLLLOGOGOGOGOG

Arquivos de log são arquivos-texto gerados por um softwareque registra os eventos e a hora em que ocorrem emdeterminado sistema computacional (Yu & Apps, 2002).Um arquivo de log típico relata, em um formatopredefinido (Log Files, 2002), que ação foi executada,quando, onde, que informação é recuperada, em queformato e como. É possível ainda identificar o autor daação (computador que gerou a solicitação). A geração dearquivos de log é feita sem obstrução, de forma maisobjetiva do que uma coleta de dados por meio de outrasfontes. Se processados apropriadamente, podem sercalculadas estatísticas de uso, que fornecem dados úteispara estudos de usuários e gerenciamento da informação.

Peters (1993, 1998) destaca que essa técnica tem sidousada em estudos de recuperação da informação on-linepor duas décadas, para uso e gerenciamento deinformações eletrônicas em bibliotecas, e ganhou maiorpopularidade nos anos 90, com a grande difusão daInternet. Na literatura encontram-se diversas experiênciasreferentes ao uso e análise dos arquivos de log.

Catledge & Pitkow (1995) afirmam que a análise dosarquivos de log pelo lado do cliente incrementa oentendimento das estratégias de navegação do usuário,bem como oferece interface real dos dados de uso. Essespadrões de navegação podem ser browsing serendipistaou geral e busca baseada em análise empírica dos arquivosde log dos eventos do usuário. As caracterizações foramderivadas da pesquisa de hipertexto e são promissoraspara a área de interesse da web.

A análise de arquivos de log realizada por Lee & Heller(1997) refere-se ao uso e aos padrões de uso de visitantesde um sistema multimídia interativo, instalado no USHolocaust Memorial Museum. As análises dos resultadosreferem-se à duração da sessão, ao início das escolhasno menu, ao meio visto (um evento é uma série de filmeou fotos) e ao acesso ao arquivo de ajuda. Assim comopode ocorrer na avaliação de logs para a Web, esse estudosugere refinamentos do compromisso com o sistematécnico e com o conteúdo do sistema. Além disso, forneceguias para adequar o tempo de uso do sistema em umespaço público.

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite

Page 3: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

104

Bertot et alii (1997) apresentamdiversas técnicas de análise de arquivosde log e apontam questões associadasà interpretação e gestão dasinformações contidas nesses arquivos.Os autores destacam que, devido aocaráter novo da análise dos arquivosde log, há falta de consistência nosformatos dos arquivos e necessidadede desenvolver meios adicionais deanalisá-los. O objetivo seria minimizaralguns problemas, como avaliação datransferência de arquivos, contagemdupla de hits e errônea das páginas deacesso, separação dos agentes internose externos, entre outros.

A experiência do uso dos arquivos delog para entender o comportamentodo usuário no projeto SuperJournal(consórcio de 19 editores de jornaiseletrônicos) é relatada por Yu & Apps(2000). O objetivo dos autores residiuem dar diretrizes ao processamento dearquivos de log e possíveis análisesfocadas no usuário.

Murphy et alii (2001) discutem o casode análise de logs de um web site de umrestaurante. Os autores mostram comoessas análises podem ser usadas pararecuperar informações sobre os visitantes. São discutidasas potencialidades e limitações das análises para objetivosde comercialização de produtos ou serviços.

Os resumos apresentados pelos softwares de análise dearquivos de logs podem, muitas vezes, ocultar informaçõesimportantes e restringem os usuários e operadores a umaposição meramente de interpretação das estatísticasdisponibilizadas. Hochheiser & Scneiderman (2001)propõem visualizações interativas, que combinam asvariáveis analisadas em um espaço bidimensional. Osautores igualmente sugerem que um maior esforço depesquisa seja dedicado à questão do processamento eanálise dos arquivos de log.

Dias (2002) avalia o acesso a periódicos eletrônicosdisponibilizados na World Wide Web por meio de log deacesso a partir da ferramenta Webtrends Log Analyser. Sãoapresentados os problemas relacionados à utilização dedados de arquivos de log de acesso, como, por exemplo,a somatória de hits que determinado site recebeu ou, então,

o processo de contagem e identificação de sessões deusuários. O autor destaca que as análises com essesinstrumentos não podem ser consideradas totalmenteinúteis, pois podem auxiliar no melhoramento de formae de conteúdo apresentados ao internauta.

MAMAMAMAMATERIAL E MÉTTERIAL E MÉTTERIAL E MÉTTERIAL E MÉTTERIAL E MÉTODOSODOSODOSODOSODOS

Os dados para a avaliação do uso do web site da EmbrapaMonitoramento por Satélite foram os da série históricade relatórios gerados pelo Webalizer entre janeiro de 1999a julho de 2002. O Webalizer (The Webalizer, 2002) éum programa de uso livre (free software � GNU, 2002)de análise de log files, que gera estatísticas mensais, diáriase horárias de uso, categorizadas segundo indicadorescomo, por exemplo, número de visitas, país de origem,strings de busca e outros.

As definições desses indicadores foram propostas porBarrett (1997) e são representadas, em conjunto, nafigura 1, com a finalidade de garantir o entendimentodas análises dos resultados aqui apresentados.

FIGURA 1Conceituação de alguns componentes constitutivos do Conceituação de alguns componentes constitutivos do Conceituação de alguns componentes constitutivos do Conceituação de alguns componentes constitutivos do Conceituação de alguns componentes constitutivos do web siteweb siteweb siteweb siteweb site da da da da daEmbrapa Monitoramento por SatéliteEmbrapa Monitoramento por SatéliteEmbrapa Monitoramento por SatéliteEmbrapa Monitoramento por SatéliteEmbrapa Monitoramento por Satélite

Ivo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de Carvalho

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 4: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

105

Uma página é formada por várioscomponentes, cada qual sendo umarquivo. Esses arquivos são agregadospor meio de comandos da linguagemHTML. No exemplo da figura 1, apágina é composta pelos seguintesarquivos:

� INDEX.HTML: um arquivo quearmazena os elementos textuais e oscomandos HTML que irão agregar osdemais arquivos. A aparência de umarquivo HTML é apresentada nafigura 2;

� L O G O _ E M B R A P A . G I F ,F R E N T E _ E M B R A P A . J P G ,MAPA1.JPG, MAPA2.JPG, MAPA3.JPG: imagens queilustram a página.

A página da figura 1 é formada por seis arquivos: umarquivo do tipo HTML e cinco arquivos do tipo imagem.Ao ser requisitada por um browser ou agente, ela irá gerarseis hits.

Outras definições importantes (Eichmann & Wu, 1996;Baccala, 1997; The Web, 2002) são necessárias:

� web site: um conjunto de páginas interligadas e tratandodo mesmo tema;

� hipertexto: a ligação entre páginas. O hipertexto estápresente na sintaxe do HTML e permite a ligação entre aspáginas do web site ou de qualquer outro ponto da Internet;

� servidor: o computador que abriga fisicamente o website;

� cliente: computador que faz um pedido ao web site;

� no Webalizer, os termos servidores e clientes sãosinônimos;

� códigos de status (status code) � códigos de três dígitosque expressam o resultado de um pedido (request) dearquivo ao web site.

Códigos de sucesso:

� tipo 1xx: Informational � o pedido ocorreuperfeitamente e será dada continuidade ao processo;

� tipo 2xx: Success � o pedido ocorreu perfeitamente efoi enviado o arquivo ao solicitante;

FIGURA 2Exemplificação da estrutura inicial de um arquivo HTML do Exemplificação da estrutura inicial de um arquivo HTML do Exemplificação da estrutura inicial de um arquivo HTML do Exemplificação da estrutura inicial de um arquivo HTML do Exemplificação da estrutura inicial de um arquivo HTML do web siteweb siteweb siteweb siteweb siteda Embrapa Monitoramento por Satéliteda Embrapa Monitoramento por Satéliteda Embrapa Monitoramento por Satéliteda Embrapa Monitoramento por Satéliteda Embrapa Monitoramento por Satélite

� tipo 3xx: Redirection � mais ações, além do pedido,são necessárias para que o arquivo seja enviado aosolicitante.

Códigos de erro:

� tipo 4xx: Client Error � o pedido não foi feitocorretamente devido a algum erro de sintaxe, porexemplo, nome de arquivo errado ou inexistente;

� tipo 5xx: Server Error � o pedido não foi aceito devidoà falha do servidor que abriga o web site.

� Agentes: tecnicamente são conhecidos como user-agents.São programas utilizados por um ou mais usuários parafacilitar a busca e recuperação de informações na web.Os mais conhecidos agentes são os navegadores paraweb (web user-agents ou web browsers) como o NetscapeNavigator e Microsoft Internet Explorer. Existe, ainda, umaoutra classe de agentes, principalmente utilizada pormecanismos de busca como Yahoo e Google para alimentarsuas bases de dados, chamados de robôs (web robots);

� Robô: é um programa que vasculha automaticamentea estrutura de hipertexto da web procurando por umarquivo e continua buscando recursivamente todos osarquivos que são referenciados nessa estrutura. Os webbrowsers não são robôs porque eles dependem daintervenção humana para buscar informações. Os webrobots possuem nomes como web wanderers (errante), webcrawlers (rastejantes), spiders (aranhas), worms (vermes) ouants (formigas) por esses programas darem a impressãode estarem se movendo sozinhos através do hipertexto,como uma aranha caminhando na teia. De fato, elesnão fazem isso, apenas vão requisitando os arquivos

Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 5: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

106

conforme encontram-nos na estrutura dehipertexto. Uma divisão interessante de robôsé a do tipo mirroring ou off line browsing, querealizam a tarefa de transferir todos os arquivosencontrados na estrutura do hipertexto do website para um computador cliente. Esse tipo derobô faz uma cópia de um web site para que ousuário navegue no mesmo sem necessidade deestar conectado à Internet. Todos os tipos derobôs, mais intensamente os mirroring, causamum comportamento de �inflacionar� o númerode hits (por conseqüência, páginas), pois um robôapenas consegue requisitar o web site inteiro semque o fator humano tenha interferência;

� Arquivo de log: estrutura utilizada paraarmazenar uma série de informações a respeitodo arquivo que foi requisitado ao servidor e qualcliente ou usuário o requisitou. De formasimplificada, o processo de solicitação de umapágina em um web site é o representado na figura 3.O cliente ou usuário é um computador conectado àInternet. Ele efetua o pedido de uma página (1) aoservidor, que irá verificar no web site se aquele pedidopode ser atendido. Esse pedido pode ser um arquivo emparticular ou uma página formada por vários arquivos.Uma vez que o servidor identif icou os arquivosnecessários (2), registram-se no arquivo de log algumasinformações como data e hora em que o arquivo foisolicitado, qual cliente solicitou (seu endereço IP), quetipo de web browser ou agente foi utilizado, qual o tamanhodo arquivo solicitado, se o arquivo foi encontrado ou segerou um erro. Cada solicitação de arquivo para formara página (os chamados hits) é gravada em uma linha doarquivo de log (3). O servidor envia para o cliente osarquivos que compõem a página (4) e (5).

FIGURA 3Esquema de acesso a uma página em um Esquema de acesso a uma página em um Esquema de acesso a uma página em um Esquema de acesso a uma página em um Esquema de acesso a uma página em um web siteweb siteweb siteweb siteweb site

Quando da decisão de se utilizar uma ferramenta paraanálise de arquivos de log, a ferramenta Webalizer já seencontrava ativada no web site da EmbrapaMonitoramento por Satélite. Para manter a objetividade,homogeneidade e coerência das informações, essaferramenta não foi substituída. Além disso, dentre asferramentas existentes, o Webalizer permite maior acessoaos dados, quando comparado com outros pacotes quesumarizam e analisam as informações, deixando aousuário apenas a possibilidade de interpretação passiva.Entretanto, devido às suas particularidades, que limitama amplitude de conclusões possíveis sobre a dinâmicade uso do web site, detalhes específicos somente podemser obtidos com a análise direta dos arquivos de log.

Entre o conjunto de indicadores fornecidos peloWebalizer, usaram-se apenas aqueles cujas informaçõesforam úteis à avaliação do uso e do desempenho do website. Os indicadores escolhidos são mostrados a seguir, àmedida que os resultados desse trabalho também sãoapresentados e discutidos. Esses indicadores possibilitamavaliar aspectos sobre origem dos acessos, açõesexecutadas pelos usuários e desempenho do sistema emtermos de respostas enviadas às solicitações dos usuários.Esses resultados podem possibilitar a remodelagem doweb site, de modo a melhorar a dinâmica de interação epromover o desenvolvimento de uma abordagem própriade análise de logs.

Destaca-se que, para contextualizar a discussãoapresentada nesse trabalho, é necessário estabelecer umadefinição dos melhores critérios de caracterização dadinâmica de visitação de um web site. Adicionalmente,os dados não podem ser vistos de forma bruta, mas simsob a forma de valores estimados ou em ordens degrandeza, para não deixar escapar ao leitor as verdades ementiras sobre as estatísticas dos web trackings (Winett,2001).

RESULRESULRESULRESULRESULTTTTTADOS E DISCUSSÃOADOS E DISCUSSÃOADOS E DISCUSSÃOADOS E DISCUSSÃOADOS E DISCUSSÃO

O uso do web site da Embrapa Monitoramento por Satélitefoi analisado, no contexto desse trabalho, pela seguintecomposição de eventos, cujo conjunto determinou osobjetivos específicos do estudo:

Ivo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de Carvalho

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 6: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

107

� dinâmica e origens do uso: eventosrelacionados à dimensão tempo,expressa pelos acessos mensais, diáriose horários, assim como aos strings debusca e ao país de origem dos acessos;

� ações de uso: representadas pelaspáginas de entrada de maior acesso eagentes mais utilizados;

� desempenho do web site: inferidopelos códigos de status (sucessos e errosde acessos).

Dinâmica e origens do usoDinâmica e origens do usoDinâmica e origens do usoDinâmica e origens do usoDinâmica e origens do uso

Análise temporal

Analisando-se a dinâmica geral de usodo web site da Embrapa Monitoramentopor Satélite, durante o períodoconsiderado neste trabalho (figura 4),observa-se que nos primeiros dois anose meio o número de acessos manteve-se em patamar relativamente constante,situado próximo a 100 mil páginas acessadasmensalmente. Mesmo assim, uma leve tendência deaumento anual pode ser notada. Isso indica,possivelmente, a resposta dos usuários à própria evoluçãodo web site, que, no decorrer do período considerado, foiagregando cada vez mais conteúdo de interesse geral ouespecífico aos internautas. Além disso, o aumento semprecrescente da �informatização� de todos os setores dasociedade, impulsionado pelas facilidades eoportunidades atuais de aquisição de equipamentos emeios de conexão, oferecidas comercialmente, além daprópria popularização da Internet, podem igualmenteter contribuído para esse aumento progressivo.

Verificou-se que os acessos evoluíram de uma médiamensal de 71.732 páginas acessadas, em 1999, para586.296, em novembro de 2001, correspondendo a umaumento de acessos bastante distinto do padrão até entãoobservado. Nessa época, estavam sendo veiculadas, nopróprio web site e na imprensa em geral, as primeirasinformações sobre o Zoneamento Ecológico eEconômico do Estado do Maranhão e o lançamento dacoleção de CD ROMs �Brasil Visto do Espaço�, doistrabalhos de grande repercussão nacional e de interessegeral da sociedade. A partir daí, a tendência observadafoi de aumento muito expressivo de acessos, avalizandoo acerto de estratégia institucional adotada pela EmbrapaMonitoramento por Satélite, de difusão dos resultados

de suas pesquisas com a disponibilização de informaçõesna Internet, tendo-se detectado, prontamente, umaresposta positiva dos usuários.

O pico no número de páginas acessadas em julho de2002 é decorrente do lançamento da coleção de CDROMs �Brasil Visto do Espaço� e da disponibilizaçãodo site desse tema, www.cdbrasil.cnpm.embrapa.br.O assunto despertou enorme interesse no público emgeral e nele foi criado espaço para cadastramento dosinteressados em adquirir a coleção, além de detalhestécnicos sobre o desenvolvimento, resultados e modode utilização das informações. A coleção é um trabalhoinédito no Brasil, no qual imagens de satélite foramreunidas e tratadas digitalmente em forma de mosaicos,de forma que o produto representasse a superfícieterrestre conforme vista do espaço.

O web site do Zoneamento Ecológico e Econômico doEstado do Maranhão foi concebido para abrigar espaçosde interação com os internautas. Essa condição pode tercontribuído para o aumento dos acessos mencionadosanteriormente.

Outro aspecto observado no padrão temporal de uso éque, claramente, nos meses de dezembro a fevereiro eno mês de julho, os acessos são reduzidos praticamentepela metade. Esses meses correspondem ao período de

FIGURA 4Dinâmica temporal dos acessos às páginas do Dinâmica temporal dos acessos às páginas do Dinâmica temporal dos acessos às páginas do Dinâmica temporal dos acessos às páginas do Dinâmica temporal dos acessos às páginas do web site web site web site web site web site da Embrapada Embrapada Embrapada Embrapada EmbrapaMonitMonitMonitMonitMonitorororororamentamentamentamentamento por Satélito por Satélito por Satélito por Satélito por Satélite, entre, entre, entre, entre, entre 1e 1e 1e 1e 1999 e 2002999 e 2002999 e 2002999 e 2002999 e 2002

tota

l de

pági

nas

aces

sada

s

Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 7: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

108

férias escolares no Brasil. À primeiravista, isso pareceria indicar um usopredominantemente exercido pelosetor educacional. No entanto, vale apena levar em consideração que,acompanhando as férias escolares,outros setores da sociedade tambémdiminuem suas atividades nesses meses.Essa concentração de uso nos mesesde maior atividade escolar e do setorprodutivo em geral parece indicar queo usuário do web site não procura lazere concentra-se, mais especificamente,na busca de informações relacionadascom o perfil de atuação da EmbrapaMonitoramento por Satélite e assuntosafins.

A análise da dinâmica diária de usosapóia essa idéia. Verifica-se claramenteque os acessos concentram-se nos diase horários de expediente de trabalho,com nítidas reduções nos horários dealmoço e noturno (figura 5) e finaisde semana (figura 6).

Strings de busca

A entrada dos internautas ao web siteda Embrapa Monitoramento porSatélite pode ocorrer de maneiradireta, se foi utilizada a URLwww.cnpm.embrapa.br, ou indireta, seutilizados strings ou palavras-chavelançadas em um mecanismo de buscaou links a partir de outros sites para oda Embrapa Monitoramento porSatélite.

A tabela 1, a seguir, permite uma análisedos strings de busca registrados peloWebalizer, como início de acesso ao website. Nessa tabela, os valores referem-seao percentual de participação dos hitspara cada s t r ing no tota l de h i t s.A análise desses resultados mostra queos mecanismos de busca devem estarrespondendo bem às solicitações dosusuários, ao indicar o web site da Embrapa Monitoramentopor Satélite como referência para informações sobrequeimadas, pois esse tema, no contexto dos impactosambientais mundiais, tem despertado significativamente

a atenção nacional e internacional e tem merecidoespaço e tratamento (de forma e conteúdo) bastantedestacados no conjunto do web site da unidade(www.queimadas.cnpm.embrapa.br).

FIGURA 5Número médio de páginas do Número médio de páginas do Número médio de páginas do Número médio de páginas do Número médio de páginas do web site web site web site web site web site da Embrapa Monitoramentoda Embrapa Monitoramentoda Embrapa Monitoramentoda Embrapa Monitoramentoda Embrapa Monitoramentopor Satélitpor Satélitpor Satélitpor Satélitpor Satélite, acessadas entre, acessadas entre, acessadas entre, acessadas entre, acessadas entre 1e 1e 1e 1e 1999 e 2002, em três int999 e 2002, em três int999 e 2002, em três int999 e 2002, em três int999 e 2002, em três intererererervalos diáriosvalos diáriosvalos diáriosvalos diáriosvalos diáriosde horáriosde horáriosde horáriosde horáriosde horários

núm

ero

méd

io d

e pá

gina

s ac

essa

das

FIGURA 6PPPPPererererercentual de páginas do centual de páginas do centual de páginas do centual de páginas do centual de páginas do wwwwweb siteb siteb siteb siteb sit e e e e e da Embrda Embrda Embrda Embrda Embrapa Monitapa Monitapa Monitapa Monitapa Monitorororororamentamentamentamentamento poro poro poro poro porSatélitSatélitSatélitSatélitSatélite, acessadas entre, acessadas entre, acessadas entre, acessadas entre, acessadas entre 1e 1e 1e 1e 1999 e 2002, segundo os dias da semana999 e 2002, segundo os dias da semana999 e 2002, segundo os dias da semana999 e 2002, segundo os dias da semana999 e 2002, segundo os dias da semana

% d

e pá

gina

s ac

essa

das

segu

ndo

os d

ias

da s

eman

a

Ivo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de Carvalho

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 8: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

109

Indicações de coerência dosmecanismos de busca também sãoreveladas quando apontam o web site,respondendo aos strings �embrapa�e �satélite�. Entretanto, no que serefere ao string �morcego�, explica-se a sua significativa ocorrência pelaexistência no web site de páginasdestinadas à educação ambiental.Nessas páginas, discute-se o impactoambiental das atividades agrícolassobre a fauna silvestre. São aindaapresentadas informações referentesa vários animais. Esse conteúdoespecífico deve ser bastante acessadopor um público interessado em dadose ilustrações sobre animais silvestres.Isso explicaria também a existênciade outros strings relacionados à fauna,na lista apresentada.

Deve-se ainda ressaltar a ocorrência,quantitativamente significativa, dosstrings �mapa rodoviário� e �casas demadeira� que os coloca entre os dezstrings mais freqüentes. Em relaçãoao primeiro, alguma coerênciapoderia ainda ser apontada, portratar-se de uma expressão quecarrega um termo bastanterelacionado ao conteúdo abordadono web site: �mapa�. Essaconsideração, no entanto, não cabe ao segundo.Analisando-se as páginas componentes do web site(atualmente próximas de 30 mil!), observa-se que essasduas expressões são títulos de página Os mecanismos debusca, em geral, indexam as primeiras linhas do arquivoHTML das páginas disponibilizadas na Internet (Cendón,2001), caso dessas duas expressões, em particular, quefiguram como tags �<title></title>� (figura 2), nos seusrespectivos arquivos (Search Engine Watch, 2002).

Esse tipo de análise torna-se importante à medida quepode contribuir para que os idealizadores de web sites(web designers) usem de maneira estratégica o conteúdodas páginas, escolhendo palavras, expressões ouindicadores mais adequados para serem indexados.Conseqüentemente, pode-se ajustar o direcionamentodo acesso para públicos específicos ou generalizados,conforme o interesse da instituição e a finalidade doweb site. Esse tipo de ajuste é considerado também porMarcondes (2001). Cuidados em monitorar as entradasdos usuários no web site podem evitar situaçõescompletamente inusitadas e inadequadas, relacionadascom termos ambíguos, imprecisos e até mesmo nomespróprios homônimos.

TABELA 1StringsStringsStringsStringsStrings de busca mais utilizados como entrada para de busca mais utilizados como entrada para de busca mais utilizados como entrada para de busca mais utilizados como entrada para de busca mais utilizados como entrada para o o o o o web site web site web site web site web site da Embrapada Embrapada Embrapada Embrapada EmbrapaMonitMonitMonitMonitMonitorororororamentamentamentamentamento por Satélito por Satélito por Satélito por Satélito por Satélite, entre, entre, entre, entre, entre 1e 1e 1e 1e 1999 e 2002999 e 2002999 e 2002999 e 2002999 e 2002

Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 9: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

110

PPPPPaís de origem dos acessosaís de origem dos acessosaís de origem dos acessosaís de origem dos acessosaís de origem dos acessos

A figura 7 e a tabela 2 mostram algunspaíses de origem dos acessos ao website. Qualitativamente, o web site já foiacessado por internautas de 173 paísesdiferentes, o que reitera a idéia de queas informações disponibilizadas naInternet tornam-se de interessecosmopolita e amplamente disperso.

Do ponto de vista quantitativo, afigura 7 demonstra padrão bastantenítido, indicando a origem predo-minan-temente nacional dos acessos:mais de 60% do número total de hitsacessados no período desse estudo. Emseguida, observa-se quantidadeexpressiva de acessos cuja origem nãopôde ser determinada e que, como osacessos nacionais, no período doestudo, manteve-se sempre entre 20%e 30% do total de hits. Esse fato deve-se à má configuração de DNS (ComitêGestor, 2002) em que o endereço físicoIP do computador cliente não foitraduzido para um nome uniforme, ouseja, não foi definido o endereçoreverso (Práticas de Segurança, 2002).O endereço IP (por exemplo,200.136.111.23) está disponível e énecessário saber a que domíniopertence (país, comercial, educacionale outros). Caso o administrador decada rede não denomine cadacomputador a ela conectado, gera-se oerro do tipo �não resolvido�.

O país responsável pela quantidade deacessos mais significativa são osEstados Unidos, que ocupou o terceirolugar na lista, embora nuncaultrapassando 10% do número totald e h i t s a c e s s a d os. O conjuntorestante, abrangendo todos os outrospaíses detectados, nunca ultrapassou5% desse indicador.

Esse dado demonstra forte inserçãonacional do web site , indicandonecessários cuidados e atenção porparte dos seus idealizadores erealizadores, em termos de adequação

TABELA 2PPPPPererererercentual de parcentual de parcentual de parcentual de parcentual de participação de outrticipação de outrticipação de outrticipação de outrticipação de outros países de origem dos acessos aoos países de origem dos acessos aoos países de origem dos acessos aoos países de origem dos acessos aoos países de origem dos acessos aowwwwweb siteb siteb siteb siteb site e e e e da Embrda Embrda Embrda Embrda Embrapa Monitapa Monitapa Monitapa Monitapa Monitorororororamentamentamentamentamento por Satélito por Satélito por Satélito por Satélito por Satélite, entre, entre, entre, entre, entre 1e 1e 1e 1e 1999 e 2002999 e 2002999 e 2002999 e 2002999 e 2002

FIGURA 7PPPPPererererercentual de parcentual de parcentual de parcentual de parcentual de participação dos principais países de origem dos acessosticipação dos principais países de origem dos acessosticipação dos principais países de origem dos acessosticipação dos principais países de origem dos acessosticipação dos principais países de origem dos acessosao ao ao ao ao wwwwweb siteb siteb siteb siteb site e e e e da Embrda Embrda Embrda Embrda Embrapa Monitapa Monitapa Monitapa Monitapa Monitorororororamentamentamentamentamento por Satélito por Satélito por Satélito por Satélito por Satélite, entre, entre, entre, entre, entre 1e 1e 1e 1e 1999 e999 e999 e999 e999 e2 0 0 22 0 0 22 0 0 22 0 0 22 0 0 2

% n

o to

tal d

e hi

ts

Ivo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de Carvalho

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 10: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

111

da língua portuguesa, e menos prioridadepara veiculação de informação em outraslínguas, pelo menos a curto e médioprazos. Essa última consideração, emparticular, valida-se, uma vez que, mesmoapresentando uma parte significativa depáginas já traduzidas para o inglês, oacesso internacional ao web site ainda épraticamente inexpressivo (tabela 2).

Ações de usoAções de usoAções de usoAções de usoAções de uso

Indicações importantes para a gestão deconteúdo de um web site podem serobtidas pelo monitoramento das açõesque os usuários executam a partir domomento que o acessam. O itineráriopercorrido e os arquivos recuperadosremotamente podem fornecer indíciosou mesmo confirmar o grau de interessedespertado junto ao público por determinado conjuntode informações.

Desse modo, as informações podem ser organizadas edisponibilizadas com objetivos direcionados à capturada atenção do usuário pela sua importância imediata oumomentânea, ou, ao contrário, pelo seu caráter depertinência permanente (base de dados, por exemplo).

No entanto, as estatísticas organizadas pelo Webalizerpermitem uma análise limitada dessas ações. Entre assituações que puderam ser consideradas no contexto destetrabalho apresentam-se, a seguir, os dados referentes àspáginas de entrada ao web site e os agentes utilizados nosacessos.

Páginas de entradaPáginas de entradaPáginas de entradaPáginas de entradaPáginas de entrada

A tabela 3 apresenta as 10 páginas de entrada maisacessadas no período de tempo considerado nestetrabalho.

A análise desses dados demonstra que o conteúdo doweb site é explorado pelos usuários de forma bemvariada. A página inicial do web site da EmbrapaMonitoramento por Satélite (�cnpm� � URL: http://www.cnpm.embrapa.br/) e temas como o monitoramentoorbital das queimadas no Brasil (�qmd� � URL: http://www.queimadas.cnpm.embrapa.br/) têm suas páginasconstantemente acessadas, durante todos os meses doano.

Outros temas, como o estudo dos gafanhotos emMato Grosso (�gafa_mt� � URL: http://www.cnpm.embrapa.br/projetos/gafa_mt/index.html); ostrabalhos nos municípios de Jaguariúna, SP (�jaguar� �URL: http://www.cnpm.embrapa.br/projetos/jaguar/index.html) e em Machadinho d�Oeste, RO(�machadinho� � URL: http://www.cnpm.embrapa.br/projetos/machadinho/index.html); as páginas cominformações sobre satélites utilizados em pesquisaagroecológica (�satélite� � URL: http://www.cnpm.embrapa.br/vp/saibamais/index.html) e aspáginas com a versão digital do informativo daunidade �Via Satélite (�vs� � URL: http://www.cnpm.embrapa.br/vp/viasatelite/index.html)apresentam, de ano para ano, uma variação aleatórianos índices de acesso, provavelmente refletindo acessosde usuários interessados apenas momentaneamente nasinformações.

Por último, observam-se temas que geram claramenteimpacto no interesse público, pois, tão logodisponibilizados, passam a ser sistematicamenteacessados, como, por exemplo, o trabalho realizado noRio Demene, AM/RR (�demene�: URL: http://www.cnpm.embrapa.br/projetos/demene/index.html);os estudos sobre fauna em Campinas, SP (�fauna� � URL:ht t p : / / w w w . c n p m . e m b r a p a . b r / p r o j e t o s /fau na/index.html) e a coleção de CD ROMs �BrasilVisto do Espaço� (�cdbrasil� � URL: http://www.cdbrasil.cnpm.embrapa.br/), cuja importância nocontexto do web site já foi anteriormente mencionada.

TABELA 3Páginas de entrada, em ordem alfabética, e respectivo percentualPáginas de entrada, em ordem alfabética, e respectivo percentualPáginas de entrada, em ordem alfabética, e respectivo percentualPáginas de entrada, em ordem alfabética, e respectivo percentualPáginas de entrada, em ordem alfabética, e respectivo percentualanual de acessos ao anual de acessos ao anual de acessos ao anual de acessos ao anual de acessos ao web site web site web site web site web site da Embrapa Monitoramento por Saté-da Embrapa Monitoramento por Saté-da Embrapa Monitoramento por Saté-da Embrapa Monitoramento por Saté-da Embrapa Monitoramento por Saté-litlitlitlitlite, entre, entre, entre, entre, entre 1e 1e 1e 1e 1999 e 2002999 e 2002999 e 2002999 e 2002999 e 2002

Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 11: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

112

AgentesAgentesAgentesAgentesAgentes

Os agentes foram agrupados em quatrocategorias, a saber: indefinido, browser(Netscape, Internet Explorer etc.), robôs(crawlers, spiders, link checkers, proxys) emirroring (capturam o site para navegaçãooff line). A tabela 4 apresenta aparticipação percentual de cada grupode agentes utilizados para acesso, nototal de hits.

A análise da tabela 4 mostra que a quasetotalidade de usuários do web site utilizaagentes do tipo browser, o que implicaassumir um perfil majoritário deusuários que estão em busca deinformações específicas sobre os temasde atuação da Embrapa Monitoramentopor Satélite, os quais são transferidospara variadas sessões no web site. Essesresultados parecem indicar os usuáriosmais comuns: membros da comunidadeacadêmica (estudante, professor oupesquisador); funcionários deorganizações governamentais ounão -governamentais; empresários;representantes de organizações civis(cooperativas agrícolas, comissões egrupos de trabalhos relacionados àtemática de agricultura, agronegócio emeio ambiente). Esses usuários, muitoprovavelmente, utilizam os browsers maisconhecidos e disseminados no mercadopelas facilidades de aquisição,instalação e familiaridade de uso.

No caso dos agentes do tipo robôs,observa-se incremento de suaparticipação no total de hits acessados durante o ano de2000, o que pode ser explicado pelo aumento deinformações incorporadas ao web site durante esseano em par t icu lar, como , por e xe mplo , asinformações da campanha nac iona l sobrealternativas para prática de queimadas na agricultura(http://www.cnpm.embrapa.br/projetos/qmd/qmd_2000/index.htm) e da coleção �Brasil Visto doEspaço�.

O mais interessante, no entanto, é o aumento departicipação do tipo de agente mirroring, expressivamentecrescente, a partir do ano 2001. Esse fato é função da

TABELA 4PPPPPererererercentual de parcentual de parcentual de parcentual de parcentual de participação no tticipação no tticipação no tticipação no tticipação no toooootttttal de al de al de al de al de hitshitshitshitshits dos principais agent dos principais agent dos principais agent dos principais agent dos principais agentes dees dees dees dees deacesso aoacesso aoacesso aoacesso aoacesso ao web site web site web site web site web site da Embrapa Monitorada Embrapa Monitorada Embrapa Monitorada Embrapa Monitorada Embrapa Monitoramento por Satélite, entremento por Satélite, entremento por Satélite, entremento por Satélite, entremento por Satélite, entre11111999 e 2002999 e 2002999 e 2002999 e 2002999 e 2002

disponibilização dos dados do projeto �Brasil Visto doEspaço�, que despertou no público o interesse deobtenção das informações, estimulando-o a copiar etransferir a totalidade dos arquivos para suas própriasmáquinas. Isso permitiu ao usuário acesso mais barato erápido aos dados desse projeto, já que não houvenecessidade de se estar conectado à Internet durante oprocesso.

Desempenho do Desempenho do Desempenho do Desempenho do Desempenho do web siteweb siteweb siteweb siteweb site

A figura 8 representa a evolução temporal do desempenhodo web site, segundo os códigos de status.

FIGURA 8DesemDesemDesemDesemDesempenho do sispenho do sispenho do sispenho do sispenho do sis tttttema serema serema serema serema ser vidor do vidor do vidor do vidor do vidor do wwwwweb siteb siteb siteb siteb site e e e e da Embrda Embrda Embrda Embrda EmbrapaapaapaapaapaMonitMonitMonitMonitMonitorororororameameameameamen tn tn tn tn to p o r S a t é l i to p o r S a t é l i to p o r S a t é l i to p o r S a t é l i to p o r S a t é l i t e , en t re , en t re , en t re , en t re , en t re 1e 1e 1e 1e 19 9 9 e 2 0 0 2 , s9 9 9 e 2 0 0 2 , s9 9 9 e 2 0 0 2 , s9 9 9 e 2 0 0 2 , s9 9 9 e 2 0 0 2 , s egundo osegundo osegundo osegundo osegundo oscódigos de sucesso e errocódigos de sucesso e errocódigos de sucesso e errocódigos de sucesso e errocódigos de sucesso e erro

% n

o to

tal d

e hi

ts

Ivo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de Carvalho

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 12: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

113

O ponto que mais chama a atenção em relação aodesempenho do web site da Embrapa Monitoramento porSatélite é a constância do percentual de códigos desucesso durante o período considerado, que se mantémpraticamente sempre próxima de 100%; ao mesmotempo, os códigos de erro tipo 500 não apresentamregistros. O grande investimento e a constantepreocupação da unidade na atualização e manutençãoda infra-estrutura (hardware e software) e recursosoperacionais (humanos, mecanismos de segurançaincluídos) têm garantido a disponibilidade dasinformações ao acesso externo 24 horas por dia, setedias por semana (Pierozzi Jr. et alii, 2000).

O aumento observado em 2000, para o percentual decódigos de erro tipo 400, pode ser explicado pelatransformação ocorrida naquele ano no nome dainstituição e, conseqüentemente, das URLs das páginasdo web site. Em 2000, a Embrapa Monitoramento porSatélite transformou-se de �Núcleo de MonitoramentoAmbiental e de Recursos Naturais por Satélite�, sigla�NMA� � URL: www.nma.embrapa.br, para �CentroNacional de Pesquisa de Monitoramento por Satélite�,sigla �CNPM� � URL: www.cnpm.embrapa.br. Essamudança pode ter ocasionado sensível aumento dos errostipo 400 � erros de sintaxe � quando os usuários,habituados a acessar o web site com sintaxes contendo�NMA�, passaram a não ter respostas de sucesso noacesso, mesmo com o mecanismo automático de correçãoimplantado e operacional durante o ano todo, queredirecionava, para as novas URLs, os acessos originadoscom a utilização da URL antiga.

CONCLUSÕESCONCLUSÕESCONCLUSÕESCONCLUSÕESCONCLUSÕES

A análise dos dados reunidos e organizados pelo Webalizerpermitiu evidenciar algumas tendências e padrões nouso das informações disponibilizadas, via Internet, pelaEmbrapa Monitoramento por Satélite. Indicações sobrea funcionalidade do sistema e seu desempenho tambémpuderam ser inferidas.

Os resultados dessa análise podem gerar diretrizesgerenciais no que se refere à melhoria contínua do website (forma e conteúdo) e ao estabelecimento de um padrãode divulgação de informações.

Algumas conclusões emergem da análise anteriormenteapresentada. O Webalizer mostrou-se útil em relação aomonitoramento bruto da dinâmica de uso, uma vez queidentificou padrões temporais de utilização do web site,permitindo a caracterização dos períodos comincremento do número de acessos. Permitiu ainda acomprovação de ubiqüidade das informações e a

identificação de coerência entre o que está sendoprocurado pelo internauta e o que está disponível. Asdiscrepâncias observadas no processo de monitoramento(strings) também contribuem para o planejamento edesenvolvimento do web site.

Embora fosse importante obter-se o número exato depessoas que acessaram o site nesse período, isso só seriapossível com uma prática restritiva de autenticação deacesso por senha que é contrária à filosofia democráticada Internet, incorporada pela Embrapa Monitoramentopor Satélite. Resta a alternativa de utilizar instrumentosque fazem uma abordagem aproximativa do perfil dousuário, sem desconsiderar os cuidados de interpretaçãodos dados recuperados.

Em relação às ações de uso, percebe-se crescente presençade agentes mirroring, relacionada com o tipo deinformação que interessa ao internauta retirar do website para armazenamento e consulta off-line. Consonante,portanto, com o resultado da análise dos acessos daspáginas de entrada.

O desempenho do web site mostrou-se constante ao longodo período, oferecendo confiabilidade ao usuário no quetange à concepção da arquitetura da informação.

Essa análise abre uma perspectiva bastante rica naexploração e caracterização do perfil do usuário, exigindoo desenvolvimento de procedimentos customizados deanálise arquivos de log conforme interessespredeterminados, consolidando-se como uma das etapasdo processo de concepção, disponibilização e utilizaçãoda informação. Dessa maneira, algumas idéias seapresentam como cenários de exploração:

� separar seções do web site com a finalidade dedeterminar a distribuição de acessos;

� interceptar entradas mais acessadas e comparar como log;

� promover alteração da estrutura com base nas regrasde indexação nos mecanismos de busca e robôs;

� identificar, por meio da ocorrência dos agentes demirroring, oportunidades para download de seçõescompletas;

� desenvolver abordagem própria de análise de arquivosde log;

� adequar a apresentação das estatísticas de acesso aosdiferentes públicos.

Artigo aceito para publicação em 18-12-2002

Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do Análise de dinâmica de uso e de desempenho: o caso do web siteweb siteweb siteweb siteweb site da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite da Embrapa Monitoramento por Satélite

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003

Page 13: Análise de dinâmica de uso e de desempenho: o caso do web site da Embrapa Monitoramento por Satélite

114

R E F E R Ê N C I A SR E F E R Ê N C I A SR E F E R Ê N C I A SR E F E R Ê N C I A SR E F E R Ê N C I A S

BACCALA, B. Connected: an Internet encyclopedia. [S. l. : s. n.],1997. Disponível em: <http://www.freesoft.org/CIE/index.htm>.Acesso em: 25 set. 2002.

BARRETT, B. L. The Webalizer: a web server log file analysis tool. [S.l. : s. n.], 1997. Disponível em: <ftp://ftp.mrunix.net/pub/webalizer/README>. Acesso em: 15 jul. 2002.

BERTOT, J. C. et al. Web usage statistics: measurement issues andanalytical techniques. Government Information Quarterly, v. 14, n. 4, p.375-395, 1997.

CATLEDGE, L. D.; PITKOW, J. E. Characterizing browsing astrategies in the World Wide Web. Computers Networks and ISDNSystems, v. 27, p. 1065-1073, 2001.

CENDÓN, B. V. Ferramentas de busca na web. Ciência da Informação,Brasília, v. 30, n. 1, p. 39-49, jan./abr. 2001.

COMITÊ GESTOR DA INTERNET NO BRASIL. Disponível em:<http://www.cg.org.br/faq/basico-01.htm>. Acesso em: 25 set. 2002.

DIAS, G. A. Avaliação do acesso a periódicos eletrônicos na webpela análise do arquivo de log de acesso. Ciência da Informação, Brasília,v. 31, n. 1, p. 7-12, jan./abr. 2002.

EICHMANN, D.; WU, J. Sulla. A user agent for the web. [S. l. : s. n.],1996. Disponível em: <http://mingo.info-science.uio wa.edu/eichmann/www-s96/Overview.html>. Acesso em: 25 set. 2002.

GNUS� not UNIX!. Disponível em: <http://www.gnu.org>. Acessoem: 24 set. 2002.

HJELM, J. Log analysis tools. [S. l. : s. n.], 1999. Disponível em: <http://www.w3.org/WCA/loganalysis-tools.html>. Acesso em: 24 set. 2002.

HOCHHEISER, H.; SHNEIDERMAN, B. Using interactivevisualizations patterns of WWW log data to characterize access patternsand inform site design. Journal of the American Society for InformationScience and Technology, v. 52, n. 4, p. 331-343, 2001.

LEE, S.; HELLER, R. S. Use of keystroke log file to evaluate nainteractive computer system in a museum setting. Computers Education,v. 29, n. 2/3, p. 89-101, 1997.

LEINER, B. M. et al. Brief history of the Internet. [S. l. : s. n.], 2000.Disponível em: http://www.isoc.org/internet/history/brief.shtml.Acesso em: 24 set. 2002.

LOG files: apache http server. Disponível em: <http://httpd.apache.org/docs/logs.html>. Acesso em: 1 out. 2002.

MARCONDES, C. H. Representação e economia da informação.Ciência da informação, Brasília, v. 30, n. 1, p. 61-70, jan./abr. 2001.

MURPHY, J.; HOFACKER, C. H.; BENNETT, M. Website-generatedmarket-research data: tracing the tracks behind visitors. Cornell Hoteland Restaurant Administration Quarterly, p. 82-91, Feb. 2001.

NAKANO, R. Web content management: a collaborative approach. Boston: Addison-Wesley, 2002. 238 p.

PETERS, T. A . The history and development of transaction loganalysis. Library Hi Tech, v. 11. n. 2, p. 41-50, 1993.

______. Remotely familiar: using computarized monitoring to studyremote use. Library Trends, v. 47, p. 7-20, 1998.

PIEROZZI JÚNIOR., I.; CAPUTI, E.; FILARDI, A. L. A Internet comoveículo de comunicação, difusão de resultados e imagem instituicional na EmbrapaMonitoramento por Satélite: I. Infra-estrutura e funcionamento. Campinas :Embrapa Monitoramento por Satélite, 2000. 25 p.

PRÁTICAS de segurança para administradores de redes Internet.Disponível em: <http://www.nbso.nic.br/docs/seg-adm-redes.html>.Acesso em: 25 set. 2002.

SEARCH engine watch: tips about Internet search engines & searchengine submission. Disponível em <http://searchenginewatch.com>.Acesso em: 25 set. 2002.

THE WEB robots pages. Disponível em: <http://www.robotstxt.org/wc/robots.html>. Acesso em: 24 set. 2002.

THE WEBALIZER: what is your we server doing today? Disponívelem: <http://www.mrunix.net/webalizer/>. Acesso em: 24 set. 2002.

WINETT, B. Tracking your visitors. [S. l. : s. n.], 2001. Disponívelem: <http://hotwired.lycos.com/webmonkey/98/16/index2a.html>.Acesso em: 25 set. 2002.

YU, L.; APPS, A. Studying e-journal user behavior using log files: theexperience of superjournal. Library & Information Science Research, v.22, n. 3, p. 311-338, 2000.

Ivo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de CarvalhoIvo Pierozzi Júnior / Eliane Gonçalves Gomes / Maria de Cléofas Faggion Alencar / Carlos Alberto de Carvalho

Ci. Inf., Brasília, v. 32, n. 1, p. 102-114, jan./abr. 2003