Trabalho final para disciplina Geoinformática (CAP-395)

Biblioteca para análise, visualização de trajetória e geometrias de sistemas atmosféricos rastreados

Helvécio B. Leal Neto

Instituto Nacional de Pesquisas Espaciais (INPE)
Avenida dos Astronautas, 1758, Jardim da Granja, São José dos Campos, SP 12227-010, Brazil

Contato: helvecio.neto@inpe.br

Última atualização: 30 de Agosto de 2021

Resumo. A A dinâmica de propagação dos sistemas atmosféricos precipitantes pode ser estudada por meio de algoritmos computacionais que abstraem informações com base em dados de observação. Os resultados de saída destes algoritmos podem ser interpretados para realização de pesquisas, produção de gráficos, tabelas e imagens. Neste trabalho, foi desenvolvida uma biblioteca na linguagem Python que reúne diversas funcionalidades para visualização e análise dos dados da saída de um algoritmo que rastreia sistemas atmosféricos precipitantes na Amazônia. A biblioteca desenvolvida aplica conceitos de Geoinformática para processamento, visualização e análise de trajetória de sistemas atmosféricos precipitantes. Conceitos relacionados à geometria e trajetória de objetos foram utilizados para representar a morfologia de clusters de chuva e a trajetória em que os sistemas propagaram-se. Os módulos desenvolvidos nesta biblioteca realizam a leitura dos dados de saída do algoritmo desenvolvido por Leal Neto (2021) e os ajustam para uma melhor abstração das informações de rastreio. A biblioteca contém funções de filtragem de eventos com base na sua duração e tipo de evento, exibição da trajetória de deslocamento, visualização das características morfológicas, além de possibilitar a produção de gráficos dinâmicos com base nas estatísticas abstraídas pelo algoritmo de rastreio.

Este Jupyter Notebook foi desenvolvido para auxiliar na visualização e análise dos dados de saída do algoritimo desenvovido no trabalho:

Leal Neto, H. B. Rastreio e previsão de sistemas precipitantes e convectivos na bacia Amazônica utilizando aprendizado de máquina não-supervisionado. Dissertação (Mestrado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais (INPE), São José dos Campos, 2021. Disponível em: <http://urlib.net/rep/8JMKD3MGP3W34R/44HGF8E>.

1. Introdução¶

      A atmosfera do planeta é composta por diferentes níveis, onde a interação entre os gases que a compõem apresentam características distintas, provocando a alteração nos campos de pressão e a formação de sistemas atmosféricos. Nos níveis mais próximos à superfície, onde ocorrem os principais sistemas atmosféricos precipitantes, as gotículas de água e os cristais de gelo aglutinados formam as nuvens de chuva, que deslocam-se de acordo com a variação dos fluxos atmosféricos [1]. As estruturas dos sistemas atmosféricos precipitantes podem ser do tipo estratiforme (regiões com menor intensidade de precipitação) ou convectivo (maior intensidade e núcleos convectivos) [2].

      Alguns instrumentos são utilizados para mensurar os níveis de precipitação e o deslocamento dos sistemas atmosféricos precipitantes, dentre estes destacam-se os radares meteorológicos. As medições realizadas pelos radares meteorológicos são varreduras volumétricas relacionadas ao conteúdo de precipitação contido nas nuvens, onde, os índices de precipitação são obtidos por meio de pulsos eletromagnéticos [3].

      Monitorar o deslocamento e evolução dos sistemas atmosféricos precipitantes por meio de instrumentos e softwares contribui para o entendimento dos processos de formação e ciclo de vida destes sistemas. Para este fim, diversos algoritmos computacionais são utilizados para abstração de informações a partir dos dados de sensores. Esses algoritmos aplicam diversas técnicas com intuito de identificar os sistemas atmosféricos precipitantes, e rastrear sua trajetória de deslocamento. Um destes algoritmos foi desenvolvido por Leal Neto (2021) e utiliza técnicas baseadas nas geometrias de clusters de chuva presentes em dados de radar, aplicando operações espaciais de sobreposição para determinar a trajetória de deslocamento de sistemas precipitantes.

      A saída do algoritmo é composta por uma tabela que contém informações sobre os clusters identificados. Estas informações correspondem às feições de contorno (boundary), centróide, vetores de deslocamento e estatísticas do conjunto de clusters identificados pelo algoritmo. Como o objetivo do algoritmo é apenas explorar informações estatísticas dos sistemas rastreados, as geometrias de cada sistema atmosférico são representadas de forma simplificada, ou seja, não foram associados nenhum tipo de sistemas de coordenadas as geometrias.

      Com base nos dados de saída do algoritmo desenvolvido por Leal Neto (2021), este trabalho apresenta uma biblioteca que faz a interpretação dos dados, e implementa conceitos de Geoinformática para melhor representar os sistemas precipitantes rastreados. Além disso, algumas funcionalidades para visualização dos resultados obtidos pelo algoritmo são demonstradas neste trabalho.

2. O Algoritmo de rastreio e estrutura dos dados¶

2.1 Algoritmo¶

O algoritmo abordado neste trabalho tem como propósito rastrear sistemas atmosféricos, partindo da definição de parâmetros relacionados à morfologia e valores de intensidade presentes em dados de radar meteorológico. Nesta metodologia, utilizou-se da técnica baseada no centróide das células precipitantes identificadas após um processo de clusterização, e a sobreposição entre geometrias correspondentes às feições de contorno provenientes dos limiares de refletividade, para identificar a trajetória individual dos sistemas precipitantes. Na Figura 1. é demonstrado o fluxo de processamento do algoritmo até a sua saída, onde, um arquivo no formato de tabela (Tabela de rastreio) é gerado e corresponde a informações de rastreio das células precipitantes.

Figura 1. Fluxograma com o funcionamento do algoritmo.

Fonte: Adaptado de Leal Neto (2021).

A tabela de rastreio (Tr) é a entidade responsável por armazenar as informações e estatísticas do algoritmo. Esta tabela é utilizada por outros processos do algoritmo, onde, uma interação ocorre a cada ciclo de leitura e processamento. Ao final de todos os ciclos de leitura dos dados, a Tr será a saída do algoritmo. Uma das principais consultas realizadas na tabela tem como objetivo retornar a geometria das células precipitantes. Neste processo, as informações e estatísticas são carregadas para memória do computador e utilizadas para identificação da trajetória das células entre dois tempos consecutivos [4].

2.2 Estrutura dos dados¶

Como supracitado, a biblioteca desenvolvida neste trabalho utiliza os dados de saída do algoritmo de rastreio. O conjunto destes dados são informações correspondentes aos parâmetros de rastreio selecionados pelo usuário, onde, um arquivo compactado que contém diversas informações referentes ao período de rastreio é gerado. A estrutura do arquivo de saída é composta pelos itens demonstrados abaixo:

Essa estrutura agrupa diversas informações, desde os clusters (clusters/) identificados em cada iteração do e os clusters previstos (predict_clusters/) pelo algoritmo. Um arquivo de log (LOG_SYYMMDDHHMM_EYYMMDDHHMM_VAR_THR_LVL_FLAGS.txt) armazena informações sobre o início e fim do rastreio, e os parâmetros definidos pelo usuário. O arquivo que armazena as habilidades do algoritmo também é criado (SKILL_SCORE.txt). E por fim, a TABELA_DE_RASTREIO.csv que armazena as geometrias e estatísticas de rastreio.

A Tabela de Rastreio será o principal arquivo a ser adaptado pela biblioteca desenvolvida neste trabalho, isso porque as geometrias armazenadas não possuem nenhum sistema de referência de coordenadas (crs) associados. Portanto, o primeiro ajuste a ser feito é nas geometrias de contorno de cada cluster, transformando os pontos x e y de cada geometria em pontos de coordenadas (latitude e longitude), esse tema será abordado na seção de Metodologias deste trabalho. Na Figura 2. demonstra-se a estrutura da Tabela de Rastreio no formato de DataFrame com as respectivas informações sobre as estatísticas e geometrias de contorno de cada cluster.

Figura 2. Exemplo da Tabela de Rastreio.

Fonte: Produção do Autor.

3. Metodología: A biblioteca “stanalyzer”¶

Esta seção demonstra o processo de instalação e utilização da biblioteca denominada stanalyzer ( Storm Track Analyzer ). Um dos objetivos da biblioteca é realizar a adaptação dos dados de saída do algoritmo desenvolvido por Leal Neto (2021). Funções com intuito de ler, processar e visualizar os resultados foram implementadas na biblioteca stanalyzer. A utilização da biblioteca será demonstrada nas próximas seções.

3.1. Download e instalação da biblioteca¶

A biblioteca stanalyzer está em contínuo desenvolvimento, que pode ser acompanhado diretamente na plataforma de hospedagem de código-fonte e arquivos com controle de versão Github, através do link: github.com/helvecioneto/stanalyzer. A biblioteca foi desenvolvida na linguagem Python na versão 3.7, sua instalação necessita de algumas dependências que podem ser encontradas no arquivo README também disponível no Github. Para instalar basta entrar com o seguinte comando no terminal:

$ git clone https://github.com/helvecioneto/stanalyzer $ cd stanalyzer $ conda env create --file stanalyzer.yml $ conda activate stanalyzer

3.2. Organização dos dados¶

#### 3.2.1 Fam Generator:

O Fam Generator é uma função da biblioteca stanalyzer que recebe parâmetros para adaptar as saídas do algoritmo. O processamento realizado pela função fam_generator() cria um novo conjunto de arquivos. Estes arquivos seguem um padrão que facilita o manuseio das informações, geração de gráficos e estatísticas. Abaixo é demonstrado os códigos necessários para importação da biblioteca e os parâmetros necessários para realizar o processamento dos dados de rastreio.

## Importação da biblioteca
import stanalyzer as sta

## Parâmetro que indica o arquivo de saída gerado pelo algoritmo de rastreio.
PATH= '~/S201409070000_E201409100000_VDBZc_T20_L5_SPLTTrue_MERGTrue_TCORTrue_PCORFalse.zip'

## Caminho que indica os arquivos que o algoritmo utilizou para realizar o rastreio (arquivos netCDF).
DATA_PATH = '~/DADOS/sbandradar/'

## Nome da variável presente nos arquivos netCDF.
VAR_NAME = 'DBZc'

## Nível de elevação dos dados da matriz 3 dimensional referente às varreduras volumétricas de radar. 
LEVEL = 5

## Limiares de rastreio.
THRESHOLD = [20,35,40]

## Diretório de saída para os novos arquivos.
OUTPUT = './output/'
NC_OUTPUT = './output/data/'
OUTPUT_FILE = './output/output_file_tracked'

## Função que inicia o processo de geração das famílias.
sta.fam_generator()

Um dos conceitos abordados no trabalho Leal Neto (2021) fala sobre as famílias de clusters. Uma família (Fam) é um conjunto de observações para um mesmo cluster no decorrer do seu ciclo de vida, e cada Fam é enumerada com um UID (Identificador único) utilizado para identificar os clusters individuais [4]. O UID será utilizado para agrupar as Fams rastreadas, na Figura 3. exibe-se um exemplo de como será organizado o novo DataFrame. A primeira coluna será o índice de identificação que agrupa as famílias de acordo com seu UID, as demais informações correspondem a estatísticas e identificadores dos clusters rastreados.

Figura 3. Exemplo de organização das Fams na nova tabela de rastreio.

Fonte: Produção do Autor.

Além de organizar os dados de saída do algoritmo utilizando os conceitos de famílias, foi aplicado um processo de transformação das geometrias (Figura 3). A transformação geográfica é uma operação matemática que converte as coordenadas de um ponto em um sistema de coordenadas geográficas nas coordenadas do mesmo ponto em outro sistema de coordenadas geográficas [5]. Essa operação foi realizada pois o algoritmo de rastreio apenas gera geometrias de contorno dos clusters com as mesmas dimensões do arquivo original (241 linhas e 241 colunas). A operação foi realizada utilizando as matrizes de latitude e longitude contidas nos arquivos netCDF que contém as informações de pontos de coordenadas geográficas, tais informações foram armazenadas no sistema de referências WGS84. Cada geometria corresponde ao contorno dos clusters individuais, e após a operação de transformação as geometrias foram armazenadas no novo DataFrame.

Figura 4. Exemplo de transformação dos vértices de um polígono (x,y) para um polígono georreferenciado.

Fonte: Produção do Autor.

3.3. Trajetórias¶

A trajetória das células precipitantes no algoritmo desenvolvido por Leal Neto (2021), pode ser descrita como um vetor de deslocamento gerado a partir dos centróides de duas ou mais células em tempos sucessivos, e que atendem a um critério mínimo de sobreposição. Segundo Ferreira et al. 2014, uma trajetória representa como as localizações ou limites de um objeto variam ao longo do tempo, ou seja, aplicando este conceito ao estudo aqui apresentado e implementado na biblioteca stanalyzer, a trajetória de uma Fam pode ser representada pelo deslocamento das geometrias que correspondem ao contorno dos clusters de células precipitantes e seu vetor de deslocamento. Com base nisso, a biblioteca stanalyzer utiliza os pontos de latitude e longitude correspondentes aos centróides de cada geometria de contorno das células para criar uma LineString entre os pontos em tempos sucessivos (t e t-1). O conjunto de LineStrings de uma mesma Fam representa o deslocamento do centróide e o ciclo de vida de um cluster rastreado pelo algoritmo. A Figura 4.a representa o DataFrame com as geometrias de uma Fam (UID 6) no decorrer do seu ciclo de vida, e na Figura 4.b demonstra-se o deslocamento do cluster por meio das geometrias (linhas e polígonos) rastreados pelo algoritmo.

Figura 4. DataFrame com as informações da Fam 6, a coluna trajectory representa o deslocamento dos centróides e a coluna geom_20 as geometrias de contorno dos clusters para o limiar de 20 dBZ. b) Visualização de trajetórias dos LINESTRING’s e POLYGON’s da Fam 6.

Fonte: Produção do Autor.

3.4. Leitura dos dados “stanalyzer.read_data()”.¶

Após o processo de organização dos dados feito pela função fam_generator() (seção anterior 3.2) as informações de rastreio são organizadas no formato de DataFrame e armazenadas como um arquivo no formato Pickle da linguagem Python. Este arquivo foi gerado e compactado para ocupar menos espaço de armazenamento, esta compactação foi feita no modo de compressão XZ (https://tukaani.org/xz/). Para ler este arquivo é possível chamar a função “read_file(path)” como demonstrado na célular de código abaixo, ou diretamente pela biblioteca pandas (https://pandas.pydata.org/docs/) com o comando: pandas.read_pickle(path,compression='xz').

Exemplo 2:¶

In [ ]:

### Flags para autoreload
%load_ext autoreload
%autoreload 2

## Importação biblioteca do sistema
import sys
sys.path.append("../")

## Importação da biblioteca stanalyzer
import stanalyzer as sta

In [ ]:

## Chamada da função read_file() e armazenamento em um DataFrame (track_frame)
track_frame = sta.read_file('../output/tracking_compressed.pkl')

In [ ]:

## Cabeçalho do DataFrame
track_frame.head()

3.5. Ciclo de vida “stanalyzer.life_cycle()”.¶

O ciclo de vida dos sistemas atmosféricos é um assunto bastante discutido em vários trabalhos [7][8][9]. O estudo sobre a duração do ciclo de vida dos sistemas atmosféricos é importante para descrever as características de deslocamento e evolução dos processos envolvidos em sua formação. Com base nisso, desenvolveu-se uma função que exibe a duração dos sistemas rastreados pelo algoritmo. Esta função exibe o início e o final do ciclo de vida de cada família com seus respectivos UIDs. Abaixo demonstra-se um exemplo da função “stanalyzer.life_cycle()”.

No DataFrame abaixo (lifes) as informações estão armazenadas de acordo com o uid (Identificador Único), times (Corresponde ao número de vezes que o cluster permaneceu ativo), begin (Data de inicio do evento), end (Data de dissipação ou fusão do cluster) e duration (Tempo de duração do evento).

In [ ]:

## Esta função retorna a duração dos eventos
lifes = sta.life_cycle(track_frame,sort=True)
lifes

3.6. Filtro de eventos e consultas¶

A estrutura bidimensional dos DataFrames fornece uma vasta possibilidade de aplicações, desde consultas diretas por meio das buscas por indexação loc e iloc, a buscas que lembram a estrutura de consulta em SQL com a função “query” do Pandas. Algumas funções foram implementadas na biblioteca stanalyzer para facilitar sua utilização pelos usuários. O primeiro filtro foi realizado para duração dos eventos e o segundo para o tipo de evento com base em seus “status”.

3.6.1. Filtro por duração “stanalyzer.time_filter()”.¶

A biblioteca stanalyzer tem uma função que faz a filtragem de eventos com base em sua duração, e foi implementada para facilitar os estudos de eventos rastreados com tempo mínimo e máximo de duração. Neste caso a função recebe um DataFrame no formato pré-definido pelo fam_generator() e mais três parâmetros relacionados à duração, sendo estes:

In [ ]:

### Exemplo 4.

## PAR METROS
TIME_MIN = 2        # Tempo mínimo de duração de um evento
TIME_MAX = 4        # Tempo máximo
UNIT = 'h'        # String para unidade temporal (h = hora, m = minuto)

## Uso do filtro de eventos baseado no tempo mínimo e máximo
track_frame_filtered = sta.time_filter(track_frame, TIME_MIN, TIME_MAX, UNIT)
track_frame_filtered.head()

Para verificar se o track_frame_filtered armazenou apenas eventos de acordo com o filtro temporal basta chamar a função de duração de eventos novamente. No exemplo acima a função time_filter() retorna um novo DataFrame com eventos que possuem duração mínima por Fam de 2 Horas e duração máxima de até 4 Horas.

In [ ]:

## Esta função retorna a duração dos eventos
verification = sta.life_cycle(track_frame_filtered,sort=True)
verification.head()

3.6.2. Filtro por tipo de evento “stanalyzer.fam_type(data,)”.¶

Outra forma bastante utilizada em alguns trabalhos [10][11] é o filtro por tipo de eventos. A função fam_type() recebe como parâmetros um DataFrame gerado pela função fam_generator() e uma String especificando qual tipo de evento a ser filtrado. Os tipos de eventos são:

NEW: Células que foram identificadas no tempo atual, ou geradas a partir de uma divisão entre clusters.
CONT: Eventos cuja dinâmica de propagação dos clusters manteve-se contínua durante todo ciclo de vida.
SPLIT: Famílias de clusters que apresentaram UM ou mais eventos de divisão entre os seus clusters.
MERG: Famílias que apresentaram UM ou mais eventos de fusão entre seus clusters durante todo ciclo de vida.

Selecionar o tipo de evento com base na dinâmica dos clusters corrobora para compreensão dos movimentos de propagação das células precipitantes. Com isso, a função fam_type() torna-se bastante útil pois desmembra eventos com base na sua dinâmica. Abaixo segue um exemplo de operação que retorna famílias com eventos onde houveram um ou mais divisões entre células durante o ciclo de vida dos clusters.

In [ ]:

## Função fam_type para eventos famílias apenas com eventos de continuidade
cont_events = sta.fam_type(track_frame,'CONT')

## Função fam_type para eventos famílias apenas com eventos de continuidade
splt_events = sta.fam_type(track_frame,'SPLT')

## Função fam_type para eventos famílias apenas com eventos de continuidade
merg_events = sta.fam_type(track_frame,'MERG')

In [ ]:

print('Tempo médio das famílias do tipo CONT:',sta.life_cycle(cont_events,sort=True)['duration'].mean())
print('Tempo médio das famílias do tipo SPLT:',sta.life_cycle(splt_events,sort=True)['duration'].mean())
print('Tempo médio das famílias do tipo MERG:',sta.life_cycle(merg_events,sort=True)['duration'].mean())

3.7. Visualização de eventos¶

Uma das aplicações que podem ser utilizadas para compreensão da dinâmica de propagação de células precipitantes é por meio da visualização dos eventos. Para este fim, a biblioteca stanalyzer conta com funções de visualização dos rastreios com informações individualizadas de cada cluster rastreado. Os módulos de visualização possuem funções interativas que permitem a seleção de características e eventos de forma mais específica. Além da interação com os gráficos, os usuários também podem aplicar os filtros e consultas para uma melhor visualização dos eventos.

A saída da “stanalyzer.track()” retorna uma imagem com base no último registro da coluna “timestamp” do DataFrame utilizado pela biblioteca stanalyzer. Na imagem gerada pela função é possível selecionar e visualizar características relacionadas às geometrias, clusters e a trajetória das células precipitantes rastreadas. Os botões laterais na esquerda da Figura 5. e Figura 6. possuem funções interativas que alteram as informações diretamente na imagem gerada. Além destes botões, informações relacionadas aos clusters podem ser visualizadas ao passar o indicador do mouse sobre o centróide de cada cluster. Estas informações surgem como um “balão” na tela. A Figura 6. demonstra esta funcionalidade, e também é demonstrado como estão distribuídos os clusters rastreados em 20 dBZ com o botão “Clusters 20 dBZ” selecionado.

Opções de visualização

None: Exibe apenas a imagem extraída do arquivo netCDF.
All: Exibe todas as camadas de rastreio.
Clusters {Primeiro Limiar}: Exibe os clusters do primeiro Limiar.
Clusters {Segundo Limiar}: Exibe os clusters do primeiro Limiar, mais intensos que o primeiro limiar.
Clusters {Terceiro Limiar}: Exibe os clusters do segundo Limiar, clusters mais internos e intensos.
Geometrias {Primeiro Limiar}: Exibe as geometrias de contorno do primeiro Limiar.
Geometrias {Segundo Limiar}: Exibe as geometrias de contorno do segundo Limiar.
Geometrias {Terceiro Limiar}: Exibe as geometrias de contorno do terceiro Limiar.
Trajectory: Exibe a trajetória dos clusters durante todo seu ciclo de vida.

Exemplo 6¶

In [ ]:

## Nome da variável com as matrizes de dados nos arquivos netCDF.
VAR = "DBZc"

## Caso dados contenham múltiplos níveis, se não deixar vazio.
LEVEL = 5

## Operação para filtrar dados de visualização com time <= 100 (coluna time)
query_frame = track_frame.query('time <= 100')

## Função para visualização
sta.track(query_frame, var=VAR, level=LEVEL)

3.7.1 Rosa dos Ventos “stanalyzer.plot_wind()”¶

A rosa dos ventos (em inglês, wind rose) é um artifício gráfico bastante utilizado na meteorologia para representar a velocidade e direção do vento. No caso da função “stanalyzer.plot_wind()” foi implementado um conjunto de operações que agrupa as informações das componentes vetoriais (velocidade e direção) de uma Fam individual, e as representa graficamente por meio de uma rosa dos ventos. Dois métodos de representação foram implementados, o primeiro (Figura 7.a) tem como propósito representar o deslocamento médio de cada sistema com o uso do desvio vetorial padrão (desvios-padrão dos componentes velocidade e direção) [12] pelo modo de gráfico de barras. E o segundo modo (dispersão) (Figura 7.b) demonstra o acumulado das informações vetoriais de cada Fam no decorrer do rastreio. Abaixo um exemplo para cada um dos modos de visualização da função stanalyzer.plot_wind():

In [ ]:

## Filtro no dataFrame para eventos no time <= 100.
query = track_frame.query('time <= 100')

# ## Modo gráfico para wind rose com estilo scatter (Figura 7.b).
wind_frame =  sta.plot_wind(query, style = 'scatter')

Caso seja necessário trabalhar com os dados de direção e vento a função plot_wind também retorna um DataFrame.

In [ ]:

wind_frame

Uma outra maneira de visualização dos dados de direção e velocidade de propagação dos clusters é por meio do wind_plot() como gráfico de barras. Abaixo segue um exemplo que foi aplicado filtro individual por tempo.

In [ ]:

## Filtro no dataFrame para eventos no tempo <= 40
query2 = track_frame.query('time <= 40')

# ## Modo gráfico para wind rose com estilo bar (Figura 7.b).
wind_frame2 =  sta.plot_wind(query2, style = 'bar')

3.7.2 Linhas “stanalyzer.plot_lines()”¶

A visualização das informações de rastreios por meio dos gráficos de linhas é utilizada para analisar diversas variáveis na forma de séries temporais. Para isso, a função stanalyzer.plot_lines() foi desenvolvida com intuito de facilitar a análise dos dados. É possível visualizar um conjunto de colunas do DataFrame por meio do parâmetro ‘analyze_columns’ que irá selecionar apenas as colunas necessárias, por exemplo, as informações de refletividade dos clusters: 'mean_ref_20','mean_total_ref_35','mean_total_ref_40' ou o tamanho dos clusters com as colunas: 'size_20','total_size_35','total_size_40'. Uma query pode ser utilizada para filtrar informações de acordo com a necessidade dos usuários. No Exemplo 8. e na Figura 8. é demonstrado como a função stanalyzer.plot_lines() pode ser utilizada para acompanhar o ciclo de vida e as características de refletividade dos clusters para cada limiar de rastreio (Figura 8a.) e o desenvolvimento no tamanho dos clusters (em pixels) (Figura 8b.) da Fam com UID igual a 182. Demais informações sobre as colunas presentes no DataFrame podem ser encontradas no ANEXO 1. no final deste trabalho.

In [ ]:

## Lista dos UIDs
LIST_UIDS = [182]

## Filtro no DataFrame.
query = track_frame.query('uid == @LIST_UIDS')


## Colunas analisadas e nome do eixo y na Figura 8a.
ANALIZE_a = ['mean_ref_20','mean_total_ref_35','mean_total_ref_40']
AXIS_NAME_a = 'dBZ'

## Colunas analisadas e nome do eixo y na Figura 8b.
ANALIZE_b = ['size_20','total_size_35','total_size_40']
AXIS_NAME_b = 'Tamanho (pixels)'

## Função plot_lines da Figura 8a.
sta.plot_lines(track_frame.query('uid == @LIST_UIDS'), analyze_columns=ANALIZE_a, axis_name=AXIS_NAME_a)

## Função plot_lines da Figura 8b.
sta.plot_lines(track_frame.query('uid == @LIST_UIDS'), analyze_columns=ANALIZE_b, axis_name=AXIS_NAME_b)

Estudo de caso¶

O arquivo utilizado para análise corresponde eventos que ocorreram entre os dias 2014-09-07 00:00:00 e 2014-09-09 23:48:00 na área de cobertura do radar SIPAM-MANAUS.

In [ ]:

print('Eventos rastreados entre: ',track_frame['timestamp'].min(),' e ',track_frame['timestamp'].max())

Agrupando o grupo de clusters que apresentaram apenas continuidade no seu movimento temos o seguinte caso, para refletividade média.

In [ ]:

### Eventos Continous
sta.plot_lines(cont_events, analyze_columns=['mean_ref_20','mean_total_ref_35','mean_total_ref_40'], axis_name='Reflectivity (dBZ)')

Observando a rosa dos ventos que retrata a direção e intensidade de propagação dos sistemas, é possível observar na imagem abaixo que os sistemas deslocaram-se preferêncialmente na direção 180°, o que corresponde aos padrões de propagação para região de cobertura do Radar SIPAM-MANAUS.

In [ ]:

wind_frame_cont =  sta.plot_wind(cont_events, style = 'scatter')

In [ ]:

wind_frame_cont

In [ ]:

### Eventos Split
sta.plot_lines(splt_events,analyze_columns=['mean_ref_20','mean_total_ref_35','mean_total_ref_40'], axis_name='Reflectivity (dBZ)')

In [ ]:

### Eventos Split
sta.plot_lines(merg_events,analyze_columns=['mean_ref_20','mean_total_ref_35','mean_total_ref_40'], axis_name='Reflectivity (dBZ)')

4. Considerações finais¶

Referêncial¶

[1] JACOB, Daniel J. Introduction to atmospheric chemistry. Princeton University Press, 1999.
[2] HOUZE JR, Robert A. Structures of atmospheric precipitation systems: A global survey. Radio Science, v. 16, n. 5, p. 671-689, 1981.
[3] DE QUEIROZ, Antônio Paulo. Monitoramento e previsão imediata de tempestades severas usando dados de radar. 2009.
[4] LEAL NETO, Helvécio. B. Rastreio e previsão de sistemas precipitantes e convectivos na bacia Amazônica utilizando aprendizado de máquina não-supervisionado. 144 p. IBI: <8JMKD3MGP3W34R/44HGF8E>. Dissertação (Mestrado em Computação Aplicada) - Instituto Nacional de Pesquisas Espaciais (INPE), São José dos Campos, 2021. Disponível em: http://urlib.net/rep/8JMKD3MGP3W34R/44HGF8E. Acesso em: 20 ago. 2021.
[5] RUSSELL, Christopher T. Geophysical coordinate transformations. Cosmic Electrodynamics, v. 2, n. 2, p. 184-196, 1971.
[6] FERREIRA, Karine R.; CAMARA, Gilberto; MONTEIRO, Antônio M. V. An algebra for spatiotemporal data: From observations to events. Transactions in GIS, v. 18, n. 2, p. 253-269, 2014.
[7] MACHADO, L. A. T. et al. Life cycle variations of mesoscale convective systems over the Americas. Monthly Weather Review, v. 126, n. 6, p. 1630-1654, 1998.
[8] MACHADO, Luiz A. T.; LAURENT, Henri. The convective system area expansion over Amazonia and its relationships with convective system life duration and high-level wind divergence. Monthly weather review, v. 132, n. 3, p. 714-725, 2004.
[9] ANSELMO, Evandro M. et al. Amazonian mesoscale convective systems: Life cycle and propagation characteristics. International Journal of Climatology, 2021.
[10] MACHADO, Luiz A.T. et al. Overview: Precipitation characteristics and sensitivities to environmental conditions during GoAmazon2014/5 and ACRIDICON-CHUVA. Atmospheric Chemistry and Physics, v. 18, n. 9, p. 6461-6482, 2018.
[11] EICHHOLZ, Christiano. W. Análise cinemática e dinâmica da propagação de células de chuva e aglomerados de nuvens. 2017. 157 p. IBI: <8JMKD3MGP3W34P/3NQ5D2P>. (sid.inpe.br/mtc-m21b/2017/04.28.15.17-TDI). Tese (Doutorado em Meteorologia) - Instituto Nacional de Pesquisas Espaciais (INPE), São José dos Campos, 2017. Disponível em: http://urlib.net/rep/8JMKD3MGP3W34P/3NQ5D2P.
[12] CRUTCHER, Harold L. On the standard vector-deviation wind rose. Journal of Atmospheric Sciences, v. 14, n. 1, p. 28-33, 1957.

ANEXO 1.¶

Variável -> Especificação

Fam_N -> Refere-se ao número da Família rastreada.
timestamp -> Um registro da hora de ocorrência de um determinado evento.
time -> Refere-se ao tempo de rastreio no algoritmo.
uid -> Identificador único, é usado para gerar as famílias.
id_t -> Identificador de cluster de referência no momento da ocorrência de rastreamento. Do algoritmo de armazenamento em cluster DBSCAN.
lat -> Refere-se ao centróide de latitude, obtido da matriz de referência dos arquivos nc originais.
lon -> Refere-se ao centróide da longitude, obtido da matriz de referência dos arquivos nc originais.
p0 -> O primeiro ponto de coordenada do centróide na matriz (clusters ou nc_file): (p0, p1) = (x, y) = (lon, lat).
p1 -> O segundo ponto de coordenada do centróide na matriz (clusters ou nc_file): (p0, p1) = (x, y) = (lon, lat).
size_%THRESHOLD -> Número total de pixels no cluster principal. Cada ponto depende da resolução espacial do sensor (tamanho do pixel): RADAR 2x2km.
mean_ref_%THRESHOLD -> Refletividade média do cluster. Valor em dBZ.
max_ref_%THRESHOLD -> Refletividade máxima do cluster. Valor em dBZ.
angle_%THRESHOLD_orig -> ngulo de deslocamento original do cluster no momento atual.
angle_%THRESHOLD_cor -> ngulo de deslocamento corrigido do cluster no momento atual.
vel_%THRESHOLD_orig -> Velocidade de deslocamento original do aglomerado no tempo atual em quilômetros por hora (km / h).
vel_%THRESHOLD_cor -> Velocidade de deslocamento corrigida do aglomerado no tempo atual em quilômetros por hora (km / h).
mean_total_ref_%THRESHOLD -> Refletividade média dos clusters internos por limite (valor em dBZ).
total_size_%THRESHOLD -> Tamanho total dos clusters internos por limite (número de pixels).
n_cluster_%THRESHOLD -> Número total de clusters internos por Limite.
avg_angle_%THRESHOLD -> ngulo médio para o cluster interno por limite (valor em graus).
avg_vel_%THRESHOLD -> Velocidade média para clusters internos por limite (valor em km / h).
status -> Estado de ocorrência, tipo: NEW> Novo cluster; CONT-> Cluster contínuo; SPLT -> Cluster dividido; MERG -> Cluster mesclado.
delta_t -> Intervalo de tempo para o ciclo de vida do cluster.
nc_file -> Caminho do arquivo netCDF.
cluster_file -> Caminho do arquivo de cluster (cluster do DBSCAN).
dsize_%THRESHOLD -> Diferença entre os tamanhos de dois clusters consecutivos (em Pixel).
dmean_ref_%THRESHOLD -> Diferença entre as refletividades médias de dois clusters consecutivos para o limite principal (em dBZ).
dmean_total_ref_%THRESHOLD -> Diferença entre as refletividades médias de todos os clusters entre duas vezes consecutivas para um limite interno (em dBZ).
dtotal_size_%THRESHOLD -> Diferença entre o tamanho total (em pixel) de todos os clusters entre duas vezes consecutivas para um limite interno (valores em pixel).

This website does not host notebooks, it only renders notebooks available on other websites.

Delivered by Fastly, Rendered by OVHcloud

nbviewer GitHub repository.

nbviewer version: 8b013f7

nbconvert version: 7.2.3

Rendered a few seconds ago

Trabalho final para disciplina Geoinformática (CAP-395)

Biblioteca para análise, visualização de trajetória e geometrias de sistemas atmosféricos rastreados

Sumário¶

1. Introdução¶

2. O Algoritmo de rastreio e estrutura dos dados¶

2.1 Algoritmo¶

2.2 Estrutura dos dados¶

3. Metodología: A biblioteca “stanalyzer”¶

3.1. Download e instalação da biblioteca¶

3.2. Organização dos dados¶

3.3. Trajetórias¶

3.4. Leitura dos dados “stanalyzer.read_data()”.¶

Exemplo 2:¶

3.5. Ciclo de vida “stanalyzer.life_cycle()”.¶

3.6. Filtro de eventos e consultas¶

3.6.1. Filtro por duração “stanalyzer.time_filter()”.¶

3.6.2. Filtro por tipo de evento “stanalyzer.fam_type(data,)”.¶

3.7. Visualização de eventos¶

Exemplo 6¶

3.7.1 Rosa dos Ventos “stanalyzer.plot_wind()”¶

3.7.2 Linhas “stanalyzer.plot_lines()”¶

Estudo de caso¶

4. Considerações finais¶

Referêncial¶

ANEXO 1.¶