cebrap.lab online - Análise quantitativa de texto
Para saber de próximos oferecimentos, entre em contato com cebrap.lab@cebrap.org.br
Informações gerais
-
Ministrante: Beatriz Milz
-
Data/horário: 27 de novembro a 1 de dezembro/2023;
- Segunda, Quarta e Sexta: aula ao vivo, online, das 19h00 às 22h00.
- Terça e quinta: haverão tarefas para casa, para praticar os conceitos.
-
Inscrições: https://cursos.cebrap.org.br/
Pacotes para instalar
- Para ser instalado via CRAN:
pacotes <-
c("tidyverse",
"tidytext",
"stopwords",
"wordcloud2",
"janitor",
"remotes",
"readtext",
"fs")
install.packages(pacotes)
- Para ser instalado via GitHub:
remotes::install_github("dfalbel/ptstem")
Materiais
Slides
Scripts pós aula
Segunda-feira
-
01-download-dados.R - exemplo simplificado do download dos dados.
-
01-download-dados-extra.R - arquivo mais extenso com o exemplo do download dos dados.
-
02-pre-processamento.R - leitura, limpeza, conhecendo os dados, tokenização, removendo stop words, removendo números, stemming, salvando a base pré-processada para a análise na aula seguinte.
-
stop-words.R - script usado para gerar a lista de stop words usada no exercício.
Quarta-feira
-
03-descritiva-visualizacao.R - buscando palavras mais frequentes por grupo, visualização com wordcloud, visualização com gráfico de barras.
-
04-ngrams.R - bigramas, visualização com gráfico de barras, tf-idf.
Sexta-feira
-
05-importacao.R - importação de arquivos (exemplo com PDFs).
-
06-modelagem-topicos.R - modelagem de tópicos (LDA).
Exercícios
Terça-feira
Quinta-feira
Materiais para revisão do conteúdo básico
-
Material do curso de Introdução ao R - 2023 (ministrado por Beatriz Milz)
-
Material do curso de Visualização de dados - 2023 (ministrado por Beatriz Milz)
-
Material da disciplina “Análise de Dados para as Ciências Sociais” - tutoriais 1 até 6.
-
Livro online, gratuito e em inglês: R for Data Science - A versão preliminar da tradução deste livro está disponível em: https://cienciadedatos.github.io/pt-r4ds/
Materiais para ir além
-
Principal referência do curso: Text Mining with R - Julia Silge and David Robinson
-
Referência mais avançada: Livro Supervised Machine Learning for Text Analysis in R - Emil Hvitfeldt and Julia Silge