Skip to content

wapsyed/cursor

Repository files navigation

Ciência de dados de saúde e bioinformática com o R

Ministrante: Wasim Aluísio Prates Syed, Farmacêutico pela FCFRP-USP, doutorando em biotecnologia pelo ICB/IPT/Butantan, e divulgador científico pela UPVacina (IEARP-USP) e Projeto Halo (ONU).

Descrição do curso:

Desenvolvemos dois cursos para tornar o aprendizado de uma das linguagens de programação e análise de dados mais populares mais acessível, especialmente para aqueles que não têm formação em áreas de exatas, como TI e ciência da computação. O curso de ciência de dados em saúde explora dados de vacinação e de doenças infecciosas e, por enquanto, é o mais completo material do nosso projeto Vidya DataScience. Entretanto, também desenvolvemos um curso de R para bioinformática mais introdutório, utilizando dados de transcriptômica de pacientes vacinados com vacinas de covid-19.

A linguagem R é amplamente utilizada por cientistas devido à sua variedade de ferramentas para análise de dados em ciências biológicas e da saúde. Com uma abordagem prática e interativa, os participantes explorarão conceitos e ferramentas para realizar análises de dados de forma simples e intuitiva. Além disso, terão acesso a um grupo de discussão para compartilhar dúvidas e ideias, criando um ambiente colaborativo e de aprendizado mútuo.

Slides: Link

Slides em pdf Link

Tutorial gratuito: Link

Programação e conteúdo

Os participantes terão uma aula introdutória à ciência de dados e fundamentos da manipulação de dados no R e visualização de dados com o ggplot, no ambiente do RStudio. Em seguida, os participantes terão um tempo para praticar e desenvolver as análises com 5 países de escolha, e no final deverão criar um poster com os gráficos produzidos.

  • Introdução ao R: Explicaremos por que o R é importante para cientistas e profissionais da saúde.

  • Fundamentos da Programação em R: Abordaremos conceitos como funções, pacotes, variáveis e estruturas de dados, como data frames, listas e matrizes.

  • Manipulação e Visualização de Dados: Exploraremos técnicas para importar, limpar, filtrar e visualizar dados usando pacotes do Tidyverse, como dplyr e ggplot2.

  • Análise Exploratória de Dados: Realizaremos análises exploratórias de dados, incluindo estatísticas descritivas, gráficos e interpretação de resultados. Aplicaremos os conhecimentos adquiridos em um projeto prático com dados reais de saúde, incluindo análise de vacinação e indicadores de saúde pública.

Como será o projeto:

O projeto consistirá na geração de pelo menos 5 gráficos acompanhados de discussões pertinentes, e terão direito a um certificado à parte. Para isso, durante o curso, serão apresentadas perguntas que poderão ser utilizadas para desenvolver o projeto. O objetivo principal é explorar os diversos tipos de gráficos disponíveis, formular perguntas pertinentes e explicar os padrões e comportamentos observados nos dados analisados.

Os participantes terão 1 mês para desenvolver o projeto, e poderão tirar dúvidas no grupo de WhatsApp e marcar uma mentoria individual, se necessário.

Quer saber mais sobre o curso e outros materiais que estamos desenvolvendo?

Siga-nos no Instagram (@cursocursor) e acesse nosso site!

Como usar este tutorial?

Para rodar este tutorial, siga os seguintes passos:

Passo 1: Acesse o GitHub

Passo 2: Baixe o projeto

  • No repositório do GitHub, clique no botão verde "Code".

  • Selecione "Download ZIP". Isso iniciará o download do arquivo ZIP contendo o projeto.

Passo 3: Descompacte o arquivo ZIP

  • Após o download ser concluído, localize o arquivo ZIP em sua pasta de downloads.

  • Clique com o botão direito do mouse no arquivo ZIP e selecione "Extrair tudo" ou "Descompactar".

  • Escolha a pasta de destino onde deseja descompactar o arquivo e clique em "Extrair".

Passo 4: Configure o projeto no RStudio

  • Abra o RStudio em seu computador.

  • No menu do RStudio, clique em "File" (Arquivo) e selecione "New Project" (Novo Projeto).

  • Escolha a opção "Existing Directory" (Diretório Existente).

  • Navegue até a pasta onde você descompactou o projeto.

  • Selecione a pasta do projeto com um clique.

  • Clique em "Create Project" (Criar Projeto).

Pronto! Agora você configurou o projeto do GitHub em seu RStudio e está pronto para começar a trabalhar.

Recomendações para evitar erros comuns

  1. Para encontrar este documento com as linhas de códigos, clique no arquivo RMD "Introducao_analise_exploratoria.rmd". Se clicar no .md, não funcionará.
  2. Se você veio para o curso de bioinformática, entre na pasta "Bioinformática" e acesse o arquivo .RMD do diretório.
  3. Siga o tutorial todo neste documento ou crie uma copia para fazer as anotações. Não se preocupe, que modificar este arquivo aqui não mudará nada no original do site.
  4. Ao fazer a parte prática com suas análises, faça no mesmo documento. Se estiver muito complicado, mande mensagem no grupo do Whatsapp ou envie um e-mail. A prática deve ser fácil e descomplicada.
  5. Lembre-se de criar blocos de códigos abaixo dos blocos de códigos de exemplos do tutorial. Também, descreva os gráficos e códigos no espaço em branco, ou seja, fora do bloco de código. Isso garantirá que seu documento estará organizado e fácil de alterar.

About

Acesse o site para mais informações

Topics

Resources

Stars

Watchers

Forks

Languages