ciia-saude@dcc.ufmg.br

Qualidade de Dados em Saúde para IA

Introduzir os conceitos de dados em saúde, da qualidade de dados e mostrar a sua importância na utilização secundária das informações geradas na prestação de cuidados para gestão e pesquisa científica.

Duração: 20 horas
Modalidade: EAD Síncrono com aulas 100% práticas
Certificado Gratuito emitido pelo CI-IA da UFMG

Objetivos Específicos
– Apresentar conceitos elementares e as boas práticas para a coleta qualificada de dados em cenários de saúde.
– Contextualizar o uso secundário dos dados de saúde com metodologias da ciência de dados, utilizando Python.
– Verificar a qualidade de bases de dados e aplicar técnicas de limpeza e tratamento de dados coletados em cenários da saúde.
– Mensurar resultados da capacitação oferecida pela avaliação dos exercícios práticos oferecidos.

Público-alvo
Profissionais de saúde, alunos de graduação e pós-graduação da área das ciências da saúde, exatas ou quaisquer interessados em utilizar os recursos computacionais para análise de dados em saúde, desde que tenham vínculo com as instituições que compõem o CIIA-Saúde ou demandandos pelas agências de fomento financiadoras.

Justificativa
O curso tem por objetivo atuar no processo interdisciplinar educativo capaz de promover interação transformadora na sociedade, envolvendo a informática para promoção da saúde. Justifica-se pela importância de se associar a qualidade, segurança e eficiência do cuidado em saúde às informações de saúde coletadas e tratadas de forma adequada, para apoiar tomada de decisões, a gestão dos serviços de saúde e a pesquisa científica. Na abordagem dos cenários de saúde, os conceitos clínicos representados em números e os números coletados diretamente são particularmente adequados para representar os parâmetros biológicos de interesse, facilitando analise e conclusões. O Python é um software estatístico em uso no mercado, cuja licença é gratuita. Permite gerenciar e analisar bases de dados, aplicando conceitos, descrevendo variáveis e aplicando testes de hipóteses automatizados.

Conteúdo Programático

  • Os dados em saúde
    • O registro clínico e os dados em saúde
    • Processos de coleta e análise de dados em saúde
    • Instrumento de coleta e manipulação de dados
    • Modelagem de dados em saúde
    • Bases de dados em saúde
    • Bases de dados populacionais e amostrais
  • Qualidade de dados em saúde
    • Desafios da coleta e manipulação de dados em saúde
    • Tipos de dados, variáveis
    • Conceitos de qualidade de dados: Disponibilidade, relevância, consistência,reprodutibilidade, acurácia, completude
    • Estudos de casos reais e erros comuns
    • Melhores práticas para coleta e manipulação de dados em ambientes de pesquisa e prática clínica.
  • Introdução ao Python para manipulação de dados em saúde
    • Introdução ao módulo online e gratuito de utilização do Python
    • Conceitos básicos utilização
    • Conceitos de variáveis e dados
    • Conceitos de funções de manipulação de dados
  • Manipulação preliminar de dados
    • Importação e leitura de bases de dados biomédicos
    • Manipulação e visualização de dados
    • Seleção e filtros de dados
    • Amostragem de dados
    • Exportando os dados
  • Limpeza e tratamento de dados
    • Identificação de problemas nos dados
    • Avaliação dos limites das faixas numéricas
    • Avaliação das categorias válidas
    • Tratamento de valores omissos: imputação de dados versus exclusão de dados omissos
    • Manipulação de variáveis do tipo datas
    • Manipulação de variáveis do tipo textos
  • Manipulação de dados em saúde
    • Descrevendo as variáveis
    • Medidas de resumo numéricas e gráficas
    • Codificação e recodificação de variáveis
    • Criação de variáveis