V Simpósio Interdisciplinar de Ciência Ambiental
V SICAM 2024 - IEE/USP
22/10/2024
Formação acadêmica:
Co-organizadora da R-Ladies São Paulo
Equipe da secretaria executiva da Revista Ambiente & Sociedade
Software peer review editor da rOpenSci
Fazer as análises de forma “manual”, tabelas, gráficos, mapas em algum software específico (ex. Excel, Google Sheets, QGIS, etc.).
Copiar e colar os resultados em um documento de texto (ex. Word, Google Docs, etc.), em uma apresentação (ex. Power Point, Google Slides, etc.).
Salvar o arquivo e enviar para a pessoa que te orienta, colegas, etc.
Isso é uma generalização, baseado em como eu fazia antes de começar a usar R :)
Recebemos feedback e precisamos incorporar as sugestões
A base de dados é atualizada
Precisamos fazer alterações nas análises
Precisamos refazer os passos do slide anterior! :(
Não conseguimos reproduzir os resultados sem refazer tudo manualmente.
Gastamos muito tempo refazendo tudo manualmente.
Maior chance de erros!
“É um conceito que não tem uma definição única e comum”. (Gundersen, 2021)
“Para alguém fazer uma afirmação científica legítima, ele deve ser capaz de reproduzir totalmente seus resultados a partir de seus dados brutos (e de preferência outros devem ser capazes de reproduzi-los também)”. Dr. John Paul Helveston
Além de promover a confiança na ciência, a reprodutibilidade facilita a colaboração entre pesquisadores, permitindo que análises sejam revisadas, aprimoradas e adaptadas para outros contextos.
Quais fatores contribuem com pesquisa não reprodutível? Fonte: Baker (2016)
“Reprodutibilidade é como escovar os dentes. Isso é bom para você, mas leva tempo e esforço. Depois de aprender, torna-se um hábito.” - Irakli Loladze, Bryan College of Health Sciences em Lincoln, Nebraska.
Baker, M. 1,500 scientists lift the lid on reproducibility. Nature 533, 452–454 (2016). https://doi.org/10.1038/533452a
Documentação adequada de métodos
Disponibilização da base de dados original
Disponibilização dos códigos utilizados para realizar as etapas de análise de dados de dados
Critérios SciELO Brasil: critérios, políticas e procedimentos para a admissão e a permanência de periódicos científicos na Coleção SciELO Brasil, Versão atual: Setembro, 2022.
Editorial 2/2024 Ambiente & Sociedade: Recuperar a ciência como um bem público: novos caminhos para as políticas editoriais (em processo de publicação)
R é um ambiente de software livre para computação estatística e gráficos. (https://www.r-project.org/)
RStudio é uma IDE (integrated development environment) da Linguagem R, ou seja, um ambiente de desenvolvimento que utilizamos para editar e executar os códigos em R.
É a IDE RStudio que podemos utilizar diretamente do navegador (sem que seja necessário instalar nada).
O código é uma linguagem, então podemos documentar a nossa análise
O código é texto, então podemos copiar e colar
As principais linguagens de programação para ciência de dados são de código aberto
Slide por Curso-R.
Acesso gratuito.
Todas as pessoas podem usar as melhores ferramentas independentemente do poder financeiro.
Estudantes podem usar as mesmas ferramentas que profissionais.
Você pode corrigir problemas e aprimorar a linguagem.
Você pode desenvolver suas próprias ferramentas.
Possibilita a existência de uma comunidade ativa.
Slide por Curso-R.
Slide por Curso-R.
É uma linguagem de programação que possui muitas ferramentas para análise de dados
É código aberto (open source)
Possui uma comunidade ativa de pessoas desenvolvedoras
É flexível, permite desenvolver funções e pacotes para facilitar o trabalho
Está disponível, gratuitamente, em diferentes plataformas: Windows, Linux e Mac
Mantido pela R Development Core Team
Fonte: Allison Horst (@allison_horst).
Slides por Beatriz Milz (@BeaMilz), feito com Quarto.