Python para enfermeiras 23 Seguimos com o estudo da linguagem Python. Experimentando um modelo de Machine Learning, segundo Data Science Academy. Nosso dataset ou conjunto de dados: Conjunto de Dados do Repositório de Machine Learning da UCI / Kaggle https://www.kaggle.com/uciml/pima-indians-diabetes-database/dataO dataset (df) tem 768 linhas (observações ou registro de pacientes) e 10 colunas (variáveis)Os índices (posições) em Python começam em 0 (zero) e representam os(as) pacientes Nas colunas temos as variáveis preditoras e a variável alvo (diabetes). Por exemplo, no índice 0, a pessoa tem atributos e desenvolveu diabetes (True). Por sua vez, no índice 1, a pessoa tem também muitos atributos, mas não desenvolveu diabetes (False).Neste conjunto de dados não há valores nulos. Se houvesse um tratamento do banco de dados seria necessário com outras técnicas e funções.Em diagonal e amarelo vemos a correlação de cada variável com ela mesma (-1 a 1). Aqui no exemplo, não há valores nulos (vazios) ou faltando. Mas, o 0(zero) em algumas variáveis representa justamente a falta do valor informado por quem coleta (é como a variável "ignorado" incluída arbitrariamente no quesito cor). É preciso corrigir isso para alimentar corretamente o modelo de ML buscando os valores 0(zero) no dataset (poderia se buscando "ignorado"). Isso é um valor missing oculto. E há técnicas para corrigir isso também.