Prefácio

Dado que se interessou por este livro, prevejo que você é um aluno de pós-graduação dando os primeiros passos em pesquisa empírica, ou é um profisional experiente procurando conhecer novas ferramentas para utilizar em seu trabalho e maximizar sua produtividade. Em ambos os casos, este livro é para você. A finalidade e objeto deste trabalho é introduzir o leitor ao uso do R como ferramenta de computação e análise de dados, com uma ênfase especial para pesquisa empírica no tópico de Finanças e Economia. Ao final deste livro você irá aprender como utilizar o R para importar dados financeiros, manipular estas informações e, por fim, reportar os resultados em um relatório.

Este livro é o resultado do meu trabalho como docente na Escola de Administração da Universidade Federal do Rio Grande do Sul. No programa de pós-graduação em Administração, eu leciono uma disciplina introdutória ao uso do R para resolver problemas de pesquisa na área de Finanças e Economia. Observando os alunos em sala de aula, percebo diariamente o impacto positivo que esse tipo de orientação tem em suas futuras carreiras profissionais, seja como pesquisadores acadêmicos, seja como analistas de dados em organizações públicas e privadas. Este livro é uma tentativa pessoal de registrar o meu conhecimento sobre a ferramenta e expandir o impacto de seu uso para um público maior e mais diversificado.

Outra motivação que tive para escrever o livro foi minha experiência na utilização de códigos disponibilizados por outros pesquisadores em pesquisas específicas. Na maioria das vezes, esses códigos são desorganizados, pouco claros e, possivelmente, funcionam apenas no computador do pesquisador que os escreveu! Após algumas tentativas frustradas, percebi que o trabalho de desvendar o código de outros professores levaria mais tempo do que desenvolver eu mesmo o procedimento, por mais complexo que ele fosse. Esses casos, aliás, ferem a ciência, pois um dos princípios básicos da pesquisa é a replicabilidade - isto é, uma rotina de pesquisa mal escrita irá reduzir a possibilidade de outras pessoas a utilizarem.

Assim como se espera que um artigo científico esteja bem escrito, também se deve esperar que o código por trás da respectiva pesquisa seja de qualidade. Porém, esse não é o caso na grande maioria das vezes. Com este livro, irei atacar esse problema, formalizando uma estrutura de código voltada à reprodutibilidade científica, focando em organização e usabilidade. O código resultante deve ser facilmente utilizável e extensível por outra pessoa. Nesse sentido, espero que as futuras gerações de pesquisadores estejam mais bem preparadas para compartilhar o seu trabalho.

Antes de prosseguir, um aviso. Não iremos trabalhar usos avançados do R. O conteúdo será limitado a exemplos simples e práticos de utilização do software para a construção de pesquisa baseada em dados financeiros e econômicos. De fato, um dos desafios na escrita deste livro foi definir o limite entre o material introdutório e o avançado. Procurei, sempre que possível, dosar gradualmente o nível de complexidade. Para leitores interessados em conhecer funções avançadas do programa e o seu funcionamento interno, sugiro a leitura do manual oficial do R (Teetor 2011) e as obras de Venables et al. (2004) e Wickham (2014a).

O livro está organizado com os seguintes capítulos:

Capítulo 1 - Introdução - Apresenta e justifica o R como plataforma de programação desenhada para resolver problemas relacionados a dados. Neste capítulo iremos apresentar os primeiros passos para o uso da ferramenta, incluindo a instalação dos programas necessários.

Capítulo 2 - Operações Básicas - Discute os comandos básicos do R e os recursos do RStudio. Estas são operações costumeiras e constituem a base de conhecimento para o uso eficiente do software. Inclui o tópico de criação de objetos, execução de scripts, formato local e internacional, recursos do RStudio e muito mais.

Capítulo 3 - Desenvolvendo Rotinas de Pesquisa - Discute as etapas e a estrutura de uma rotina de pesquisa, incluindo estágios, organização de pastas e políticas desejáveis para a melhor organização do trabalho.

Capítulo 4 - Importação e Exportação de Dados Locais - Este capítulo apresenta as funções mais comuns para importar e exportar dados de diferentes arquivos locais, includindo formatos nativos do R, planilhas eletrônicas, entre outros.

Capítulo 5 - Importação de Dados via Pacotes - Apresenta e discute o contexto de dados financeiros. Os principais pacotes disponíveis no CRAN para importar dados financeiros e econômicos são apresentados, incluindo pacotes desenvolvidos pelo próprio autor.

Capítulo 6 - Dataframes e outros Objetos - Discute o uso de dataframes para organizar e estruturar bases de dados em um formato eficiente. Inclui também a discussão sobre o uso de listas e matrizes.

Capítulo 7 - As Classes Básicas de Objetos - Apresenta as classes de objetos mais utilizadas, incluindo tipos numéricos, fatores, texto e Datas. Neste capítulo você aprenderá a usar as classes básicas para representar informações sobre seu problema de pesquisa e as possíveis manipulações para cada tipo de objeto.

Capítulo 8 - Programando com o R - Este capítulo apresenta as capacidades de programação do R, incluindo o uso de funções, loops e declarações condicionais. É dada especial ênfase ao uso das funções do R na manipulação de conjuntos de dados financeiros e econômicos.

Capítulo 9 - Estruturando e Limpando Dados - Apresenta a forma de estruturar e limpar dados com o R. Inclui a mudança de formato do dataframe (longo/largo), tratamento de outliers, desinflação de preços e mudança da frequência temporal de dados.

Capítulo 10 - Criando e Salvando Figuras - Trata do uso das funções do pacote ggplot2 para criar visualizações do conjunto de dados, incluindo os casos mais comuns em finanças e economia, séries temporais e gráficos estatísticos.

Capítulo 11 - Modelos Econométricos no R - Apresenta o uso de seis modelos econométricos para pesquisa financeira e econômica. Inclui modelos lineares, GLM, dados em painel, Arima, Garch e modelos de Markov. Para cada tipo de modelo, aprenderemos como simular, estimar e prever. Sempre que apropriado, também aprenderemos a usar o R para efetivar testes estatísticos relacionados aos modelos.

Capítulo 12 - Reportando Resultados e Criando Relatórios - Discute e apresenta maneiras de efetivar a última etapa da pesquisa: o reporte dos resultados obtidos. Isto inclui a apresentação e exportação de tabelas simples e estimações de modelos com pacotes específicos. Uma seção dedicada ao uso da tecnologia RMarkdown, mesclando código e texto, também é apresentada.

Capítulo 13 - A Performance de Investimentos no Brasil - O capítulo final apresenta um caso replicável de pesquisa, envolvendo todo o ciclo de análise, desde obtenção e estruturação dos dados até reporte dos resultados. Estuda-se a performance histórica de diferentes investimentos no mercado financeiro Brasileiro.

Sou um grande fã de código aberto e isso não será diferente neste livro. Todo o código utilizado aqui, incluindo exemplos separados por capítulos, está disponibilizado na internet. Também mantenho um site pessoal, onde busco escrever a respeito do uso do R em problemas específicos, entre outras coisas. O endereço é https://msperlin.github.io/. O material do livro está disponibilizado nesse endereço.

Espero que goste desta obra e encontre utilidade para o seu trabalho.

Boa leitura!

Marcelo S. Perlin

Referências

Teetor, Paul. 2011. R Cookbook. " O’Reilly Media, Inc.".

Venables, William N, David M Smith, R Development Core Team, and others. 2004. “An Introduction to R.” Network Theory Limited.

Wickham, Hadley. 2014a. Advanced R. CRC Press.