Introdução ao R

V Simpósio Interdisciplinar de Ciência Ambiental
V SICAM 2024 - IEE/USP

22/10/2024

Beatriz Milz

  • Atualmente:
    • Estágio pós-doutoral na UFABC
  • Formação acadêmica:

    • Graduação: Gestão Ambiental - EACH/USP
    • Mestrado: PPG-Análise Ambiental Integrada - UNIFESP Diadema
    • Doutorado: PPG Ciência Ambiental (PROCAM) - IEE/USP

Outras participações

Introdução

Rotina de trabalho comum

  • Fazer as análises de forma “manual”, tabelas, gráficos, mapas em algum software específico (ex. Excel, Google Sheets, QGIS, etc.).

  • Copiar e colar os resultados em um documento de texto (ex. Word, Google Docs, etc.), em uma apresentação (ex. Power Point, Google Slides, etc.).

  • Salvar o arquivo e enviar para a pessoa que te orienta, colegas, etc.

Ainda em uma rotina comum

  • Recebemos feedback e precisamos incorporar as sugestões

  • A base de dados é atualizada

  • Precisamos fazer alterações nas análises

  • Precisamos refazer os passos do slide anterior! :(

Problemas dessa rotina

  • Não conseguimos reproduzir os resultados sem refazer tudo manualmente.

  • Gastamos muito tempo refazendo tudo manualmente.

  • Maior chance de erros!

Reprodutibilidade

  • “É um conceito que não tem uma definição única e comum”. (Gundersen, 2021)

  • “Para alguém fazer uma afirmação científica legítima, ele deve ser capaz de reproduzir totalmente seus resultados a partir de seus dados brutos (e de preferência outros devem ser capazes de reproduzi-los também)”. Dr. John Paul Helveston

  • Além de promover a confiança na ciência, a reprodutibilidade facilita a colaboração entre pesquisadores, permitindo que análises sejam revisadas, aprimoradas e adaptadas para outros contextos.

Reprodutibilidade

Quais fatores contribuem com pesquisa não reprodutível? Fonte: Baker (2016)

Reprodutibilidade

“Reprodutibilidade é como escovar os dentes. Isso é bom para você, mas leva tempo e esforço. Depois de aprender, torna-se um hábito.” - Irakli Loladze, Bryan College of Health Sciences em Lincoln, Nebraska.

Baker, M. 1,500 scientists lift the lid on reproducibility. Nature 533, 452–454 (2016). https://doi.org/10.1038/533452a

Exemplos

  • Documentação adequada de métodos

  • Disponibilização da base de dados original

  • Disponibilização dos códigos utilizados para realizar as etapas de análise de dados de dados

Ciência Aberta

Usando o R para fazer as análises das nossas pesquisas

O que é o …

R?

R é um ambiente de software livre para computação estatística e gráficos. (https://www.r-project.org/)

RStudio?

RStudio é uma IDE (integrated development environment) da Linguagem R, ou seja, um ambiente de desenvolvimento que utilizamos para editar e executar os códigos em R.

RStudio Cloud?

É a IDE RStudio que podemos utilizar diretamente do navegador (sem que seja necessário instalar nada).

Por quê usar linguagens de programação para analisar dados?

As vantagens de analisar dados usando linguagens de programação

  • O código é uma linguagem, então podemos documentar a nossa análise

  • O código é texto, então podemos copiar e colar

  • As principais linguagens de programação para ciência de dados são de código aberto

O que significa ser código aberto?

  1. Acesso gratuito.

  2. Todas as pessoas podem usar as melhores ferramentas independentemente do poder financeiro.

  3. Estudantes podem usar as mesmas ferramentas que profissionais.

  4. Você pode corrigir problemas e aprimorar a linguagem.

  5. Você pode desenvolver suas próprias ferramentas.

  6. Possibilita a existência de uma comunidade ativa.

Por quê o R?

O ciclo da ciência de dados

Por quê usar o R?

  • É uma linguagem de programação que possui muitas ferramentas para análise de dados

  • É código aberto (open source)

  • Possui uma comunidade ativa de pessoas desenvolvedoras

  • É flexível, permite desenvolver funções e pacotes para facilitar o trabalho

  • Está disponível, gratuitamente, em diferentes plataformas: Windows, Linux e Mac

  • Mantido pela R Development Core Team

Ciclo da Ciência de Dados

Ciclo da Ciência de Dados

Vamos ao R!

Para após o workshop

  • R e RStudio instalados no seu computador:

  • Links para instalação:

Durante o workshop

Materiais para estudo

Obrigada!

Slides por Beatriz Milz (@BeaMilz), feito com Quarto.