AGROSOFT 97
I Congresso da SBI-Agro

 

Simplificação das análises de algumas técnicas especiais da experimentação agropecuária no MAPGEN e softwares correlatos


Daniel Furtado Ferreira

danielff@ufla.br

André Luiz Zambalde
zambalde@ufla.br
Universidade Federal de Lavras - UFLA
Caixa Postal 37 - 37200-000 - Lavras - MG
Tel. (035) 829-1371

 

Resumo

O presente trabalho tem por objetivo, promover a divulgação de um conjunto de rotinas (Mapgen, Toler, Rxy e Knott) visando a resolução de muitas das novas metodologias da experimentação agropecuária para as quais ainda não existam soluções computadorizadas, ou quando da sua existência, são deficientes. O programa Mapgen contém rotinas para várias técnicas de análise dialélica quando os materiais são avaliados em um ou vários ambientes. Assim, além de serem úteis para a seleção de genitores para a hibridação, fornecem informações sobre importantes parâmetros genéticos, como heterose, controle genético dos caracteres, capacidade de combinação dos materiais, bem como aos seus efeitos de interação com os ambientes.O módulo de álgebra de matrizes permite a estimação de parâmetros, principalmente quando se tem modelos especiais ou desbalanceados, em que os estimadores não podem ser facilmente expressos por fórmulas. Destaca-se os delineamentos em blocos aumentados, látices e os látices com tratamento comum por bloco. Finalmente, apresenta-se o Toler para análise de estabilidade fenotípica, o Rxy e Knott para aplicação de análises genéticas especiais e testes estatísticos.

Abstract

This paper have the purpose to divulge some routines (Mapgen, Toler, Rxy and Knott) to solve new methodologies in experimental designs, that no have computer solution or if they exist, they are deficient. The Mapgen software have routines to diallel analysis over on or several environments. It is useful for parental selection to hybridization, and provide information about genetics parameters and their interactions effects. The matrix algebra allow us to estimate parameters from special and unbalanced models, where the estimators can not be easily expressed by formula. We punctuate the augmented designs, lattice and lattice with common treatments in all blocks. Finally, Toler is presented to stability analysis, Rxy and Knott to special genetic analysis an statistical test.

Palavras-chave

Estatística, Experimentação, Agropecuária, Software, Genética

 

1. INTRODUÇÃO

Técnicas cada vez mais refinadas e precisas são exigidas para a obtenção de sucesso na experimentação agropecuária. Os princípios teóricos desenvolvido por inúmeros pesquisadores nacionais e internacionais são publicados regularmente nos periódicos científicos, com a finalidade de atender a estes objetivos. Entretanto, a grande maioria destas novas metodologias são em geral desconsideradas pelos pesquisadores das diferentes áreas, devido a dificuldades matemáticas e estatísticas para a sua implementação. O sucesso das pesquisas em todos os setores, mas principalmente no setor agropecuário, requer que técnicas cada vez mais refinadas de análises sejam utilizadas.

Sabendo da deficiência na utilização destas novas metodologias publicadas periodicamente, vários softwares destinados ao processamento de dados segundo vários modelos estatísticos, estão disponíveis, e auxiliam de forma considerável o pesquisador, por permitir a extração de informações valiosas de seus dados experimentais, de uma forma sistemática e isenta de erro. Os muitos aplicativos existentes e disponíveis são deficientes por não apresentarem as opções desejadas, principalmente na genética e na estatística experimental, ou por não trazerem a especificidade desejada e necessária, devido ao avanço alcançado pelo desenvolvimento das pesquisas no setor agropecuário.

Neste contexto, o presente trabalho tem por objetivo, promover a divulgação de um conjunto de rotinas (Mapgen, Toler, Rxy e Knott) desenvolvidas em linguagem Pascal (Turbo Pascal 5.5), visando a resolução de muitas das novas metodologias da experimentação agropecuária, divulgadas basicamente na década de 90, para as quais ainda não existam soluções computadorizadas, ou quando da sua existência, são deficientes.

 

2. DESCRIÇÃO GERAL

O programa Mapgen foi implementado em linguagem Pascal (Turbo Pascal 5.5), cujo esquema da sua tela principal destacando-se as suas rotinas principais encontra-se na Figura 1.

A primeira técnica a ser comentada, refere-se as análises dialélicas para múltiplos ambientes. O termo dialelo é usado para expressar um conjunto de híbridos resultante do acasalamento entre um grupo ou até mesmo dois grupos distintos de genitores (linhagens, variedades, clones, etc.). As suas análises tem a finalidade de proporcionar informações úteis para o melhoramento genético de plantas ou de animais no sentido de fornecer estimativas de parâmetros genéticos úteis para que o melhorista escolha os pais para iniciar o programa de melhoramento genético. Tem a finalidade também de proporcionar o entendimento da natureza e magnitude dos efeitos genéticos envolvidos no controle da expressão de uma característica de interesse econômico, para a qual se deseja obter ganhos. Um dos grandes problemas dos

Figura 1: Esquema representativo da tela principal do Programa Mapgen.

melhoristas, é o comportamento diferencial dos seus materiais genéticos frente as variações no ambiente (clima, localidade, tratos culturais, tecnologias utilizadas, incidências e controle de pragas e doenças, etc.). Esse comportamento é conhecido como interação genótipo por ambiente. O programa Mapgen contém rotinas para várias técnicas de análise dialélica quando os materiais são avaliados em um ou em vários ambientes. Assim além de serem úteis para a seleção de genitores para a hibridação, fornece informações úteis sobre importantes parâmetros genéticos, como heterose, controle genético dos caracteres, capacidade de combinação dos materiais, bem como aos seus efeitos de interação com os ambientes. O melhorista pode então tomar decisões de suma importância, para uma das principais etapas do programa de melhoramento, que é a fase inicial, bem como, determinara as estratégias de melhoramento (métodos de melhoramento) mais adequados a serem utilizados

O segundo procedimento, de grande valia para pesquisadores de diversas áreas, é o módulo de álgebra de matrizes, que permite a estimação de parâmetros, principalmente quando se tem modelos especiais ou desbalanceados, em que os estimadores não podem ser facilmente expressos por fórmulas. Este módulo usa a memória dinamicamente em tempo de execução, permitindo que matrizes de dimensões maiores possam ser utilizadas. Várias operações com matrizes e vetores estão disponíveis, destacando-se dentre elas a adição, subtração, transposição, inversão, fatorização de Cholesky, ortonormalização Gram-Schimidt para as colunas, operador Sweep. Destaca-se ainda a obtenção de autovalores e autovetores de matriz simétricas por dois distintos algoritmos, e também três tipos de inversas generalizadas (More Penrose, inversa reflexiva, g2, e inversa com operador pivotal de gauss), que podem ser utilizadas na resolução de sistemas de equações indeterminados e até mesmo inconsistentes, fornecendo a melhor solução aproximada. As rotinas de matrizes possuem dez memórias para as matrizes geradas e uma de trabalho, e permitem ainda que sejam gravadas em arquivos externos, possibilitando desta forma que não haja limite para a quantidade de matrizes, a não ser por limitação de espaço físico nos discos (winchester ou disquetes).

Diversos delineamentos estatísticos especiais estão disponíveis no programa. Destacam-se os delineamentos em blocos aumentados, látices e os látices com tratamento comum por bloco. Todos estes delineamentos podem ser grosseiramente analisados em alguns softwares existentes, através da teoria dos mínimos quadrados. Por serem delineamentos com estruturas especiais, requerem análises detalhadas de grande utilidade para o pesquisador. A área que mais se beneficia destes delineamentos experimentais é a genética, pois em geral são apropriados para análises em que um grande número de material deve ser utilizado (os três tipos) e ainda em casos em que sementes ou animais (materiais experimentais) inviabilizam a utilização de repetições (blocos aumentados). Estas situações são comuns na genética e melhoramento de plantas e animais.

Dentre outras, pode-se destacar ainda as análises de estabilidade fenotípica, utilizando como índice ambiental a média de um ou mais material testemunha. Estas análises são de extrema importância para o melhoramento, pois na sua fase final, o melhorista avalia o seus produtos (novas cultivares ou novas raças animais) e tem que decidir qual destes materiais devem ser lançados, para utilização dos agricultores e pecuaristas. Como já comentado, um dos principais fenômenos que ocorrem é a interação genótipo por ambiente, ou seja, o comportamento diferencial de alguns materiais frente as variações das condições ambientais. Por esta razão o melhorista deve procurar os materiais que possuam comportamento previsível para diferentes condições ambientais e que além de serem altamente produtivos, consigam ser responsivos a melhoria das condições ambientais (ambientes de alta tecnologia). As técnicas de análise de estabilidade, permitem aos mesmos inferir sobre este tipo de material genético. O Mapgen apresenta uma destas técnicas, a qual é livre de uma das principais críticas dentre as metodologias existentes: independência entre o índice ambiental e a performance média dos materiais genéticos para os quais se deseja inferir sobre a estabilidade fenotípica. Um outro software correlato é o Toler (Figura 4), o qual apresenta uma metodologia, desenvolvida em uma tese de PhD, nos EUA (1990), também isenta desta principal crítica. Este programa utiliza o método de estimação de parâmetros não lineares de Gauss-Newton modificado, o qual é iterativo, demandando muita memória e tempo.

Outros tópicos estão disponíveis no Mapgen, no entanto será destacado apenas as rotinas para estimação de componentes de médias e de variâncias. Estes tópicos fornecem suporte indispensáveis para os geneticistas quantitativos e para os melhoristas nas pesquisas de base e na determinação das estratégias de melhoramento mais adequadas. Com este mesmo intuito, outro software correlato, o Rxy (Figura 2), proporciona a estimação do coeficiente de parentesco de Malecot, entre indivíduos que possuam um pedigree conhecido.

Finalmente o software Knott (Figura 3), visa a aplicação de um teste de comparação múltipla entre médias de tratamentos, obtidas da análise de algum experimento. Este programa pode ser usado por pesquisadores de todas as áreas da ciência, e tem como principal vantagem a aplicação de teste que elimina a ambigüidade dos demais testes existentes na literatura (Tukey, Duncan, SNK, Gabriel, etc.), facilitando a interpretação e tornando os resultados mais transparentes. É um programa implementado de uma forma bem simples (sem muitos recursos computacionais), que no entanto visa uma maior clareza na apresentação dos resultados das pesquisas realizadas, bem como se constitui num conjunto de passo que não podem ser facilmente executados, devido a um número excessivo de cálculos e operações matemáticas exigidas, bem como da sua complexidade (Scott e Knott, 1974).

Figura 2: Esquema representativo da tela principal do Programa Rxy.

Figura 3: Esquema representativo da tela principal do Programa Knott.

Figura 4: Esquema representativo da tela principal do Programa Toler.

Cabe ressaltar a utilização de algoritmos recursivos, memória dinâmica em tempo de execução, ordenação com algoritmos de alta eficiência (quicksort), entre outros suportes computacionais, visando tornar o Mapgen e os demais softwares o mais eficiente possível. Uma segunda observação, refere-se ao fato de todos estes softwares possuírem um sistema de auxílio interno, acionado pela tecla F1 ou por opções do menu.

 

3. CONSIDERAÇÕES FINAIS

Os softwares Mapgen, Rxy, Toler e Knott foram desenvolvidos com a finalidade de atender aos pesquisadores das áreas de genética e estatística experimental. Foram implementados para ser utilizado na plataforma DOS, sendo compatível com microcomputadores da linha IBM PC. Para a utilização destes programas os pesquisadores não muito familiarizados com a informática e principalmente com os seus avanços, terão grandes facilidades devido ao fato de que em geral, estes softwares são auto explicativos além de possuírem um sistema de auxílio interno de fácil acesso e grandemente informativo.

Convém salientar que novas técnicas ou até mesmo técnicas disponíveis na literatura a mais tempo, como a elaboração de novos modelos ou de métodos de análises dos mesmos, que devido a escassez ou inexistência de softwares que as executem ou até mesmos no caso de sua existência da limitação dos resultados de seu "output" , justificou a elaboração e implementação destes programas. A importância dos mesmos para a comunidade cientifica, principalmente das ciências agrárias, tem sido justificada pela sua citação em dissertações e teses apresentadas em várias instituições e pela sua larga utilização por pesquisadores da área de genética de diversos centros de pesquisas.

 

4. BIBLIOGRAFIA

  • Scott, A.J.; Knott, M. (1974) A cluster analysis method for grouping means in the analysis of variance. Biometrics, 30, 507-512.
  • Toler, J.E. (1990) Patterns of genotypic performance over environmental arrays. Clemson university, Madison, USA, 154p., Phthesis.

 

5. BIOGRAFIA

  • Daniel Furtado Ferreira é Agrônomo pela UFLA (1990), Mestre pela UFLA (1993), e Doutor pela ESALQ/USP, em Genética e Melhoramento de Plantas (1996). É Professor em Estatística, Informática e Genética na UFLA, é supervisor de informática do Departamento de Ciências Exatas e é Coordenador de Pesquisa da Comissão Permanente de Vestibular.
  • André Luiz Zambalde é Engenheiro Eletricista (INATEL, 1984), Mestre em Eletrônica (EFEI, 1991) e Doutorando em Engenharia de Sistemas e Computação (COPPE/UFRJ, 1997). Professor da área de Informática na UFLA, pesquisador em Informática na Agropecuária e conselheiro da SBI-AGRO.