Minicurso gratuito de programação para Ciências Sociais

Foi realizado entre os dias 15 e 16 de julho de 2020, o minicurso gratuito a distância sobre programação para Ciências Sociais:

A programação como ferramenta para as ciências sociais: phyton e r na coleta e análise de dados

O curso foi gravado e encontra-se disponível no canal do Núcleo de Políticas Públicas e Desenvolvimento sustentável (NPDS) da UFPB, no Youtube. Os links estão logo abaixo.

  • SOBRE O CURSO:

O curso é fruto de uma parceria entre o Núcleo de Políticas Públicas e Desenvolvimento sustentável (NPDS) da UFPB e o CAENI (Centro de Estudos das Negociações Internacionais) da USP e tem como objetivo explorar o universo da programação computacional e como essas ferramentas podem ser facilitadores na construção do trabalho de um Cientista Social.

Existem duas linguagens de programação essenciais e de fácil acesso para leigos no assunto, Python e R. Cada uma dessas linguagens tem vantagens e desvantagens específicas para coleta, organização e análise de dados retirados da Internet.

Sob essa ótica, o curso trará um foco maior em Python por sua versatilidade de funções e bibliotecas disponíveis que podem auxiliar extensivamente a coleta e o tratamento de dados (dados numéricos e estatísticos, dados textuais ou imagens). Essas técnicas podem trazer benefícios para pesquisas em quaisquer ciências humanas, especialmente quando se conhece suas vastas possibilidades. A linguagem R também será explorada, de forma mais específica, para coletar e analisar o banco de dados do IBGE, PNDA, com interesse especial em suas aplicações para as Ciências Sociais.

Público-alvo:

Pessoas interessadas em aprender web scraping e coleta de dados na web. Não é exigido conhecimento aprofundado em programação, mas é recomendado para absorção do conteúdo em sua totalidade.

Responsável: Prof. Pascoal Teófilo Carvalho Gonçalves ([email protected]).

Ministrantes: Luís Henrique Martins (Mestrando em História Social/USP e Pesquisador do CAENI/USP) e Gustavo Grivol (Economista/FGV e fundador do GVCODE).

  • PROGRAMAÇÃO:

1º dia: 15/07/2020 das 13 às 17 horas

Conteúdo: Abriremos o curso aprendendo a instalar o Python e os pacotes necessários para a aula. Posteriormente, exploraremos noções básicas de Web Scraping em diferentes websites da internet, coletando textos e imagens, além de baixar documentos e tabelas da internet. Finalizaremos com o pós-processamento do conteúdo coletado com OCR (Optical Caracter Recognition) e princípios de NLP (Natural Language Processing).

Canal do Youtube: https://www.youtube.com/watch?v=cpxSWBQ1Mwc

2º dia: 16/07/2020 das 13 às 17 horas

Conteúdo: O segundo dia será composto de uma apresentação dos dados do IBGE, como se estruturam, como coletar e analisar. O foco desse dia, estará na apresentação da linguagem R e a biblioteca “PNADcIBGE” para coleta de dados da Pesquisa Nacional por Amostra de Domicílios e análise dos microdados resultantes.

Canal do Youtube: https://www.youtube.com/watch?v=cpxSWBQ1Mwc

Material do curso: Clique aqui

Veja também