Na nova versão 0.11.0.9000, o pacote datazoom.amazonia
no R possibilita o usuário para baixar os dados da Produção Agrícola Municipal (PAM) do Instituto Brasileiro de Geografia e Estatística (IBGE).
A PAM é uma pesquisa anual de abrangência nacional realizada pelo IBGE que fornece informações sobre produtos agrícolas, como quantidade produzida, área plantada e colhida, quantidade média da produção e valor monetário de tal saída. Os produtos são divididos em terras agrícolas permanentes e temporárias, bem como pesquisas dedicadas aos quatro produtos que rendem colheitas múltiplas por ano (feijão, batata, amendoim e milho), que somam um levantamento total de 64 produtos agrícolas (31 de cultivo temporário e 33 de cultivo permanente). A produção, entretanto, só é incluída no conjunto de dados se a área plantada ocupar mais de 1 acre ou se a produção exceder uma tonelada.
A agricultura permanente é caracterizada por um ciclo de longa duração, cujas colheitas podem ser feitas várias vezes ao longo dos anos sem a necessidade de voltar a plantar as sementes. Já a agricultura temporária consiste em ciclos de curta e média duração, que após a colheita requerem o novo plantio das sementes.
Os dados também apresentam vários níveis de agregação, como abrangência nacional, por região, mesorregião e microrregião, além de estado e município.
Os dados disponibilizados têm periodicidade anual e estão disponíveis de 1974 até os dados atuais, com exceção dos quatro produtos de safra múltipla, que só estão disponíveis a partir de 2003.
O pacote contém três funções: load_pam_permanent
, load_pam_temporary
e load_pam_main
que extraem dados da API do site do banco de dados IBGE. O primeiro extrai os dados de produtos de preparo permanente, o segundo de produtos de preparo temporário e o último abrange especificamente os quatro produtos que rendem colheitas múltiplas por ano (milho, batata, feijão e amendoim).
Todos eles permitem ao usuário inserir os anos que deseja que os dados englobem, o nível de agregação geográfica desejado, bem como escolher o idioma dos dados (atualmente só são suportados o português e o inglês). Essas funções também oferecem a opção de saída dos dados no formato longo, no qual tabelas separadas são criadas para cada variável e cada produto se torna uma coluna (enquanto anteriormente ambos eram linhas de um único quadro de dados maior).
A saída é um quadro de dados contendo dados para o nível territorial escolhido, o nome desse nível geográfico, o ano dos dados, a variável em questão, a unidade de medida e o valor. Cada coluna possui uma coluna correspondente contendo o código numérico do valor específico, com exceção da coluna Valor, que já é numérica. Se o formato longo for selecionado, a saída se torna uma lista de quadros de dados, um para cada uma das variáveis.
Para maiores detalhes da construção do pacote datazoom.amazonia
acesso ao Github