AGROSOFT 97
I Congresso da SBI-Agro

 

Censo Agropecuário/96: Uma nova perspectiva em 
termos de disseminação de resultados

 

José Luiz Lopes
jlopes@di.ibge.gov.br
Av. Chile 500 - 12o andar
Rio de Janeiro - RJ
Telefone (021) 515-0548

Aluizio Pimentel Guedes
aluiziog@di.ibge.gov.br
Av. Chile 500 - 12o andar
Rio de Janeiro - RJ
Telefone (021) 515-0560

 

1. OBJETIVO

Uma nova política de disseminação de resultados do Censo Agropecuário é adotada pelo IBGE - Instituto Brasileiro de Geografia e Estatística. Este trabalho descreve o produto desenvolvido para atender a essa vontade do IBGE e a forma dos usuários interessados em dados estatísticos dos estabelecimentos agropecuários do Brasil terem acesso a essas informações.

 

2. METODOLOGIA

2.1. O sistema PEGASUS

O sistema de tabulação é composto por uma aplicação que opera em uma plataforma tipo PC, realizando as seguintes funções:

  1. Definição do dicionário e das variáveis auxiliares
  2. Definição do Plano de Divulgação
  3. Geração do programa de Tabulação
  4. Recuperação e agregação das matrizes
  5. Impressão das tabelas

Para o desenvolvimento deste aplicativo foram utilizadas as linguagens Visual Basic e Opus, além do banco de dados OpenBASE e da planilha Excel.

2.2. Definição do dicionário e das variáveis auxiliares:

A tarefa de definição é executada, tendo como base o dicionário de dados do IBGE, conhecido como Banco de Metadados. Este dicionário contém os metadados de todas as pesquisas realizadas, com as descrições dos arquivos, registros e campos. No Banco de Metadados, estão descritas as variáveis com os seus atributos, entre os quais a sua qualificação como quantitativa ou categórica, bem como as tabelas de códigos das variáveis categorizadas.

O usuário poderá definir novas variáveis a serem utilizadas nos processos de tabulação, processo este, que muitas vezes envolve a criação de variáveis não disponíveis no arquivo de microdados da pesquisa. Estas definições são armazenadas junto ao dicionário da pesquisa para uso posterior em outras tabulações.

Cada variável derivada tem um nome, um conjunto de categorias (se for variável categorizada) e um algoritmo de derivação. Este algoritmo é descrito na linguagem OPUS, que acompanha o Banco OpenBASE, que foi utilizado para o armazenamento do Censo Agropecuário de 1996. O Opus é bastante semelhante ao dBase e ao Clipper.

Uma rotina para o acesso aos questionários foi escrita, devendo este procedimento ser repetido para nova cada pesquisa a ser processada pelo PEGASUS.

2.3. Definição do Plano de Divulgação

Um plano de divulgação é dividido em Capítulos, Tabelas e Matrizes

2.3.1. Capítulo:

Um conjunto de tabelas forma um capítulo. O capítulo tem um filtro e uma lista de níveis geográficos que serão apurados para as tabelas do mesmo. A tabulação será feita para o menos destes níveis, sendo os demais gerados pela agregação das matrizes tabuladas. O filtro quando definido permite que seja especificada a seleção do conjunto de questionários a ser utilizado no processo de tabulação. O filtro tem a forma de uma expressão condicional.

2.3.2. Tabela:

A tabela é a unidade da apresentação dos resultados da tabulação. São definidas a lista de matrizes que irão compor a tabela, o seu título e formato (fixo ou variável). Uma tabela é fixa quando possui uma quantidade determinada de linhas. Já as tabelas variáveis são constituídas por blocos, que serão incorporados à tabela impressa de acordo com a avaliação de um filtro do bloco. Podemos entender uma tabela fixa como um caso de tabela variável com apenas um bloco. Uma tabela é dividida verticalmente em páginas. Uma tabela possui um forma de editoração chamada de moldura da tabela, que atende à norma de apresentação de planos tabulares do IBGE.

A definição da moldura compreende a especificação dos títulos da páginas, título da coluna indicadora, a orientação quanto ao número de ordem, a definição das linhas, colunas, notas de rodapé e o desenho do cabeçalho.

Para especificar as formas dos caracteres a serem impressos, podem ser criados vários estilos, que indicam uma altura de linha, uma fonte e o seu tamanho, e as condições de negrito e itálico. Vemos então que existe uma grande liberdade quanto ao desenho da tabela que facilmente poderá utilizar fontes proporcionais.

As linhas podem ser Subtítulos, Calculadas ou Básicas. Um subtítulo possui apenas texto, sem apresentar nenhum valor associado. Uma linha calculada tem seus valores obtidos a partir de outras linhas via uma função como a soma. Uma linha básica aponta para as matrizes tabuladas e corresponde um conjunto de categorias de variáveis categorizadas como por exemplo Masculino e Rural, para as variáveis Sexo e Situação. Uma linha tem um texto a ser apresentado como indicadora.

As colunas podem ser Calculadas ou Básicas. Uma coluna calculada tem seus valores obtidos a partir de outras colunas via uma função como a soma. Uma coluna básica aponta para as matrizes tabuladas e corresponde a uma variável quantitativa ou a um conjunto de categorias de variáveis categorizadas como por exemplo Maçã e Adubação , para as variáveis Produto da lavoura permanente e Prática agrícola. Cada coluna possui a sua largura.

O cabeçalho é construído com o auxílio de caixas que são facilmente dimensionadas e preenchidas.

As Notas de Rodapé são o rodapé das páginas da tabela, podendo ocorrer apenas na última ou em cada uma.

Existem textos dinâmicos (mudam conforme os dados resultantes da tabulação), que são usados nos títulos da tabelas, indicando a sua abrangência espacial (território), no cabeçalho fornecendo os nomes de produtos, etc. O texto da indicadora de uma tabela variável é também um exemplo de texto dinâmico. Estes textos são definidos na forma de uma função como NomeTerritorio, UnidadeMedida, NomeProduto, etc…

2.3.3. Matrizes

São os Cruzamentos Básicos a serem obtidos dos questionários. Existem dois tipos de matriz: o chamado cruzamento e o quantificado.

Um cruzamento possui linhas e colunas correspondentes a variáveis categorizadas. Cada célula é acumulada com um valor de uma variável quantitativa. Exemplo de um cruzamento é Estabelecimentos (variável quantitativa UM), por Condição do Produtor e Atividade econômica (variáveis categorizadas).

Um quantificado possui uma variável categorizada nas linhas e uma lista de variáveis quantitativas nas colunas. Exemplo de quantificado: Informantes, Quantidade e Valor da produção (lista de variáveis quantitativas) por Produto (variável categorizada).

Uma matriz pode possuir um filtro e também podem ser definidas até quatro outras variáveis categorizadas, que correspondem às páginas da matriz, elevando até o limite de 6 a sua dimensão.

2.4. Geração do programa de Tabulação

Uma vez definido o plano de divulgação será gerado um programa que irá efetuar o cálculo das matrizes. Este programa é gerado na linguagem Opus, podendo ser executado em outra plataforma diferente do PC aonde o plano foi definido. Este programa gerado irá ler os microdados e produzir as devidas matrizes. A leitura se dará apenas uma vez, e os valores das tabelas irão sendo calculados, conforme o especificado na definição, e gravados em um arquivo de matrizes.

A cada registro lido são calculadas todas as variáveis derivadas correspondentes ao tema do registro, e obedecendo aos filtros definidos, as matrizes vão sendo atualizadas. Quando ocorre a quebra da unidade territorial especificada em cada capítulo, as matrizes são gravadas no banco de matrizes. Notamos que tudo é feito (geração das variáveis derivadas e atualização das matrizes) em apenas uma leitura dos questionários que pedem corresponder a milhões de observações.

No arquivo de saída com as matrizes, são gravados os campos de controle, denominados de identificação e áreas. Os campos de controle servem para a identificação posterior da tabela, e os campos de área contem a identificação do território, e das variáveis correspondentes às páginas das matrizes.

2.5. Recuperação e agregação das matrizes

Uma vez tabulados os questionários, o banco com as matrizes é transferido para a estação de trabalho que irá processa-las e imprimi-las. É selecionada a máquina que executou a tabulação e a unidade territorial a ser transferida. Todas as matrizes são assim trazidas para serem processadas.

A tarefa de agregação irá somar matrizes referentes à mesma tabela, dando origem às matrizes de unidades territoriais de níveis superiores a tabulado com por exemplo Microrregião e Unidade da Federação.

2.6. Impressão das tabelas

Quando a tabela foi definida e uma série de matrizes foi associada a tabela, foi gerado um arquivo EXCEL contendo a moldura da tabela. Este arquivo é composto por várias planilhas, dentre as quais destacamos as correspondentes às matrizes da tabela, os blocos e ao cabeçalho.

As planilhas das matrizes são as áreas de leitura das mesmas, existindo uma para cada páginas de cada matriz.

As dos blocos apresentam as linhas dos mesmos e podem conter fórmulas operando os valores das células ou conter apontadores para as planilhas das matrizes.

A do cabeçalho irá dar origem a página impressa, contendo inicialmente apenas as linhas do cabeçalho. A cada unidade territorial constante da lista a ser impressa na tabela, são lidas as matrizes originais e os blocos devidos são copiados para a planilha do cabeçalho. Este procedimento é comandado da aplicação escrita com o Visual Basic e executado pelo EXCEL via OLE. Temos assim então a tabela pronta para ser impressa pelo EXCEL.

Notamos então que as tarefas de operação de linhas, colunas e células foram executadas por um software de planilha eletrônica, que foi o responsável também pela editoração da mesma.

 

3. RESULTADOS

Foram definidas mais de 100 tabelas para a divulgação do Censo Agropecuário 1996. Este trabalho foi realizado pelo pessoal da área responsável pelo Censo, de uma forma bastante simplificada.

Além da produção das tabelas impressas, o sistema gera também matrizes para serem incorporadas ao Sistema de Disseminação de Resultados do IBGE via Internet: O SIDRA. Foram definidas matrizes que apresentam dados bastante desagregados a nível de município.

A operação do sistema é executada com simplicidade, e os resultados impressos além de atender à divulgação, servem para facilitar também a aprovação da etapa de crítica de cada município, pois permite a rápida impressão de qualquer tabela a nível municipal.

 

4. BIOGRAFIA

José Luiz Lopes

Coordenador de Informática do Censo Agropecuário/96. É estatístico com pós graduação em Informática.

Aluízio Pimentel Guedes

Gerente do Projeto PEGASUS. É engenheiro com pós graduação em Informática. Ambos tem mais de 20 anos de experiência na área de informática.