Releases: ipeaGIT/geocodebr
Releases · ipeaGIT/geocodebr
v0.6.2
Correção de bugs (Bug fixes)
- Bug corrigido para garantir que o pacote utiliza apenas os dados em cache do
data release corrente, e ignora eventuais dados de releases antigos que estejam
na pasta. Encerra #90 - A função
geocode()agora retorna erro informativo quando alguma coluna na tabela
de input tem nome com algum caractere não alfanumérico, como . , ? ^ - ! ~. Não
há problema com o sublinhado _, como em “name_muni”. Fecha issue #92 - Corrigido erro na função de
geocode_reverso()que impedia usar valores muito
altos dedist_max. Encerra #88 - Incluido 'Language: pt' na DESCRIPTION
v0.6.1
Correção de bugs (Bug fixes)
- Essa versão corrige um erro que havia nas coordenadas co CNEFE utilizadas na
v0.6.0.
v0.6.0
Mudanças grandes (Major changes)
- A função
geocode()agora retorna o codigo do setor censitário do endereço
encontrado quandoresultado_completo = TRUE. Essa alteração atende parcialmente
ao issue #66 porque ela somente
retorna o código do setor dos casos em que o endeço encontrado está 100% dentro
de um único setor censitário. Quanto os dados do CNEFE correspondentes ao endereço
buscado estão em mais de um setor, o resultado da colunacod_setoréNA. - Dependência do pacote agora usa enderecobr (>= 0.5.0), que foi reescrito em
Rust. Isso traz grandes ganhos de performance para processamento de bases acima
de 10 milhões - Nova atualização da da base de referência (CNEFE padronizado v0.4.0)
Outras novidades (Other news)
- Novo co-autor do pacote: Gabriel Garcia de Almeida
v0.5.0
Mudanças grandes (Major changes)
- Novas versões da funções
geocode(),geocode_reverso()ebusca_por_cep()são
significamente mais rápidas e usam menos memória RAM. O ganho de eficiência é
relativamente maior em consultas pequenas. Ver ganhos de performance no issues
encerrados: #82,
#81 e #83 - Por padrão, as funções agora recebem
n_cores = NULL, e o pacote utiliza o
número máximo de cores físicos disponíveis. - Agora o argumento
resolver_empatespassa a serTRUEcomo padrão.
Mudanças pequenas (Minor changes)
- As tabelas do cnefe agora são registradas na db uma única vez. Encerra issue #79.
- O output da função
geocode()agora é apenas um"data.frame", e não mais um
"data.table" "data.frame". - A função
geocode()passa a ter um novo argumentopadronizar_enderecosque
indica se os dados de endereço de entrada devem ser padronizados. Por padrão, é
TRUE. Essa padronização é essencial para uma geolocalizaçao correta. Alerta!
Apenas utilizepadronizar_enderecos = FALSEcaso os dados de input já tenham
sido padronizados anteriormente comenderecobr::padronizar_enderecos(..., formato_estados = 'sigla', formato_numeros = 'integer'). Encerra issue #68. - Incluído o apoio do Instituto Todos pela Saúde (ITpS) no
READMEe no arquivo
DESCRIPTION. Encerra issue #71.
Correção de bugs (Bug fixes)
- A função
geocode()agora é envolta com {callr}, e por isso usa muito menos
memória RAM e não tem vazamento de memória. #48
geocodebr v0.4.0
Mudanças grandes (Major changes)
- A função
geocode()agora não aplica match probabilístico em lograouros cujo
nome são só uma letra (e.g. RUA A, RUA B, RUA C) ou compostos só por dígitos
(RUA 1, RUA 10, RUA 20). Encerra issue #67.
Isso diminui muito os casos de falso positivo no match probabilístico. - O parâmetro
h3_resutilizado nas funçõesgeocode()ebusca_por_cep()
agora aceita um vetor de números indicando diferentes resoluções de H3. Encerra issue #72.
Mudanças pequenas (Minor changes)
- Definição de número de
n_corespara paralelização mais segura usando{parallelly}. - Ganhos de performance em algumas funções de match (issues #73,
#74 e #75). - Tratamento de casos de empate agora é feito interamente dentro do DuckDB. Encerra issue #57
- O geocodebr não depende mais do pacote Rcpp, que antes era utilizado para
calcular distâncias entre coordendas. Esses cálculo agora é feito inteiramente
dentro do DuckDB.
v0.3.0
Mudanças grandes (Major changes)
- Novo parâmetro
h3_resnas funçõesgeocode()ebusca_por_cep(), que permite
o usuário inserir uma coluna no output indicando o id da célula H3 na resolução
espacial desejada. Encerra issue #43. - O output da função
geocode()agora inclui uma nova colunadesvio_metrosque
apresenta de forma intuitiva o grau de incerteza do resultado encontrado. Encerra issue #11. - Nova base de dados (release
v0.3.0). A principal mudança aqui foi a
estratégia de agregação de coordenadas. Na versão anterior, a base consistia numa
média simples das coordenadas dos pontos que pertenciam ao mesmo grupo de colunas.
Na atual versão, esse cálculo é feito em duas etapas. Primeiro encontramos o ponto
médio e calculamos sua distância até todos os pontos. Em seguida, descartamos
aqueles pontos que estão acima do percentil 95% de distância, e recalculamos então
novo ponto médio. Isso evita eventuais distorções quando há poucos pontos muito
isolados. - A nova base de dados (release
v0.3.0) utiliza arquivos em formato.parquet
compactados, o que diminuiu pela metade o tamanho dos arquivos (de2.98GB para
1.17GB) e acelera o processo de download dos dados (embora deixa o
processamento em si ligeiramente mais devagar). - Os dados de cache agora são armazenados na sub-pasta
"geocodebr_data_release_{data_release}",
dentro da pasta de cache definida pelo usuário. De agora em diante, os dados de
releases antigos passam a ser deletados automaticamente quando há atualização do
data release. Encerra issue #64.
Mas os dados das versões anterioresv0.2.0devem ser apagados manualmente com
a funçãodeletar_pasta_cache().
geocodebr v0.2.1
Correção de bugs (Bug fixes)
- Resolvido bug que retornava erro se o input to usuario comecava o geocode direto a partir do match case
"pl01".
geocodebr v0.2.0
Mudanças grandes (Major changes)
- A função
geocode()agora inclui busca com match probabilistico. Encerra issue #34. - Nova função
buscapor_cep(). Encerra issue #8. - Nova função
geocode_reverso(). Encerra issue #35. - A função
download_cnefe()agora aceita o argumentotabelapara baixar tabelas específicas.
Mudanças pequenas (Minor changes)
- Ajuste na solução de casos de empate mais refinada e agora detalhada na documentação da função
geocode(). Encerra issue #37. O método adotado na solução de empates agora fica transparente na documentação da funçãogeocode(). - Nova vignette sobre a função
geocode_reverso() - Vignette sobre Get Started e da função
geocode()reorganizadas
Correção de bugs (Bug fixes)
- Resolvido bug que decaracterizava colunas de classe
integer64na tabela de input de endereços. Encerra issue #40.
Novos contribuidores (New contributions)
- Arthur Bazzolli
geocodebr v0.1.1
Correção de bugs
- Corrigido bug na organização de pastas do cache de dados. Fecha o issue 29.
geocodebr v0.1.0
- Primeira versão estável.