23/03/20 13h38

USP integra parceria internacional sobre gestão e compartilhamento de dados climáticos

Acordo estimula desenvolvimento de serviços computacionais, a começar por informações coletadas em projetos apoiados pela Fapesp

Governo do Estado de São Paulo

A Universidade de São Paulo (USP) é uma das instituições brasileiras a firmar acordo com o Oak Ridge National Laboratory, do Departamento de Energia dos Estados Unidos, com 27 anos de experiência na gestão de dados ambientais e atmosféricos, para contribuir na melhoria do sistema de ciência e tecnologia do País. A Universidade Federal de São Paulo (Unifesp) e o Instituto Nacional de Pesquisas Espaciais (Inpe) integram a parceria.

Pesquisadores coletam diariamente, na Amazônia e em outras regiões brasileiras, milhares de dados sobre as condições da atmosfera – entre eles, a concentração de material particulado e de gases, as propriedades de nuvens e os parâmetros meteorológicos como temperatura, umidade e velocidade dos ventos. As informações ajudam a entender, por exemplo, o impacto da poluição no clima e no ciclo hidrológico.

Elas também permitem estimar como determinadas localidades serão afetadas pelas mudanças climáticas. Contudo, boa parte dos dados gerados não é publicada e permanece inacessível à grande maioria dos cientistas.

Trabalho conjunto

A cooperação envolve a troca de conhecimento (compartilhamento de dados e softwares de código aberto) e o intercâmbio de pesquisadores para o aprendizado de técnicas e mecanismos de gerenciamento de dados, integração, compartilhamento, modelagem e visualização de dados. O tema foi debatido no 5º Workshop on Data Science – Challenges in Brazilian Context to Promote Atmospheric Data Management, realizado em fevereiro, na Escola Politécnica (Poli) da USP.

O acordo visa a apoiar o desenvolvimento de um sistema e de serviços computacionais para que a gestão e a curadoria dos dados atmosféricos possam ser feitas nas instituições brasileiras, a começar pelas informações coletadas em projetos apoiados pela Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), como a campanha científica GoAmazon (Green Ocean Amazon) e o projeto “O ciclo de vida de aerossóis e nuvens na Amazônia”, vinculado ao Programa Fapesp de Pesquisa sobre Mudanças Climáticas Globais (PFPMCG).

“Estima-se que mais de 80% dos dados atmosféricos coletados não são publicados. E, em geral, eles são obtidos com recursos públicos. São, portanto, dados públicos. Avançar na gestão desse conhecimento, disseminando-o e tornando-o acessível aos demais cientistas, é otimizar o uso dos recursos. Contribui ainda para o avanço da ciência, pois mais pesquisadores e a sociedade como um todo poderão ter acesso a essas valiosas informações”, disse Paulo Artaxo, pesquisador do Instituto de Física da Universidade de São Paulo (IF-USP) e membro da coordenação do PFPMCG, à Agência Fapesp.

A iniciativa tende a solucionar um gargalo importante na pesquisa como um todo. No mundo, há maior coleta do que análise de dados. Isso porque, enquanto o investimento em infraestrutura e o avanço tecnológico permitiram avançar nas formas de coleta, ainda é necessário muito tempo e capital humano para análises baseadas em big data. Esse é o foco do Grupo de Estudos, Pesquisa e Extensão em Big Data da Poli-USP, organizador do evento.

“A soberania do País está relacionada à capacidade de gerir esses dados, fazer descobertas a partir deles e desenvolver uma infraestrutura brasileira. É importante criar essa competência. Nossa ciência atmosférica é muito avançada e é preciso também capacitação e infraestrutura para trabalhar com grandes volumes de dados atmosféricos, que permitam a gestão e a curadoria integrada, envolvendo desde a aquisição, o processamento, a publicação e até a análise das informações”, afirmou à Agência Fapesp Pedro Luiz Pizzigatti Corrêa, professor do Departamento de Engenharia de Computação e Sistemas Digitais da Poli-USP e coordenador do acordo.

Segundo o docente, a formalização do convênio com o laboratório do Departamento de Energia dos Estados Unidos permitirá que cientistas brasileiros possam aplicar o conhecimento de outras iniciativas de gestão de dados atmosféricos, além de se capacitar para desenvolver uma infraestrutura adequada ao cenário nacional.

“O objetivo é trazer essa competência para o Brasil, gerando uma infraestrutura computacional adequada ao nosso ambiente de pesquisa e, ao mesmo tempo, formar pesquisadores capazes de gerir essa infraestrutura”, salientou.

Gerenciamento

De acordo com Paulo Artaxo, em todas as áreas da ciência é extremamente importante fazer o gerenciamento e a otimização do uso de dados e o acordo representa um passo importante para facilitar o compartilhamento do conhecimento.

“A quantidade de dados ambientais coletada atualmente é enorme e ferramentas de visualização e disponibilização de big data são absolutamente necessárias. São dados importantes, às vezes históricos, mas, por causa do grande volume, impossíveis de serem analisados e publicados por um único grupo de pesquisa ou pesquisador. Acabam sendo colocados na gaveta ou deixados no hard disk de um computador qualquer. Apesar de serem únicos, provavelmente estarão perdidos daqui a 10 ou 20 anos, com informações valiosas financiadas pelo Estado”, disse Artaxo, que também é membro do Painel Intergovernamental sobre Mudanças Climáticas (IPCC) da Organização das Nações Unidas (ONU).

A ideia é que, com a colaboração, os dados fiquem abertos para a população em geral acessar, assim como já acontece em plataformas como o Programa de Cálculo do Desflorestamento da Amazônia (Prodes) do Inpe, que traça o histórico dos últimos 30 anos de focos de desmatamento na Amazônia.

“O objetivo é integrar. Com a colaboração, será possível agregar dados de diferentes naturezas: de emissão atmosférica, de mudanças climáticas, variáveis meteorológicas e de desmatamento. Assim, será possível, por exemplo, verificar em uma única plataforma se em um ano de muita poluição havia muito foco de queimada”, enfatizou Luciana Varanda Rizzo, professora da Unifesp e integrante do GoAmazon, à Agência Fapesp.

Outra vantagem do projeto está em incentivar a interdisciplinaridade. “É muito dado para pouca gente trabalhar. Ao compartilhá-los, é possível que pesquisadores de outras áreas façam correlações, por exemplo, ajudando a identificar o impacto da poluição na população de uma determinada espécie”, completou a docente.

Bancos de dados

No acordo, o Atmospheric Radiation Measurement (ARM) – programa responsável pelo desenvolvimento de ferramentas computacionais do Oak Ridge National Laboratory – fornecerá recursos para gestão, compartilhamento e visualização de dados atmosféricos para que pesquisadores da USP, Unifesp e Inpe possam operacionalizar um Centro de Gestão de Dados Atmosféricos, com grandes bancos de dados, sistemas de compartilhamento e de inteligência artificial para o melhor aproveitamento das informações coletadas.

Desde 2015, a maior parte dos dados do projeto GoAmazon é depositada no ARM. A outra parte está no repositório do Instituto Max Plank, na Alemanha. “Estamos trabalhando com a USP nos últimos cinco anos para o compartilhamento de dados, padrões de dados abertos e gerenciamento de dados. Nos próximos três anos, trabalharemos inicialmente no sentido de compartilhar conhecimento e desenvolver algumas ferramentas. O acordo que estamos desenvolvendo vai permitir também a mobilidade de alunos para a capacitação”, pontuou à Agência Fapesp Giri Prakash, diretor do Data Center do ARM.

Atualmente, o gerenciamento de dados dos projetos de pesquisa é feito exclusivamente pelos cientistas. “Como hoje temos uma quantidade brutal de dados sendo coletada, nem todos os pesquisadores têm o conhecimento, a infraestrutura e o tempo necessário para disponibilizar esse material. Por isso, serão construídas ferramentas para facilitar o trabalho desses pesquisadores”, afirmou Paulo Artaxo.

Desde 2017, a Fapesp exige um Plano de Gestão de Dados entre os anexos obrigatórios de propostas submetidas, especificando quais dados serão produzidos e como serão gerenciados, compartilhados e preservados.