Dashboard Operacional com Power BI - VivaSaúde
Descrição
Você é o Analista de Dados da operadora de plano de saúde, VivaSaúde, que atende em quatro regiões do Brasil. Os diretores perceberam que os gastos de seguro saúde aumentaram de forma considerável e precisam monitorar a evolução dos gastos.Problema
Os diretores fizeram diversas perguntas e gostariam de poder visualizar as respostas em uma única tela ou visualização.Os dados disponíveis correspondem ao ano anterior dos usuários da operadora possuem as colunas: idade, sexo, IMC (índice de massa corpórea), se é criança, se é fumante, a região do usuário e o valor de seguro saúde de cada usuário.
Sua fonte de dados é um arquivo .csv com dados coletados do sistema de vendas, CRM e ERP da empresa. O conjunto de dados foi entregue pelo departamento de TI.
Os diretores precisam de respostas às seguintes perguntas:
Qual o gasto total da operadora?
Qual a idade média dos usuários da operadora?
Qual o gasto médio por região?
Qual faixa etária possui maior gasto com seguro saúde por região?
Crianças tem gasto maior que adultos?
Qual a proporção de crianças por região?
O aumento da idade influencia no IMC?
Quem tem maior gasto, homens ou mulheres?
Se o usuário for mulher, o IMC é acima ou abaixo da média?
Se for homem, com mais de 50 anos e da região Sudeste, o gasto é maior ou menor que a média de gastos da região?
Proposta de Solução
Indagações iniciais
Qual problema de negócio eu preciso atender?
Ajudar a responder as perguntas dos diretores através de uma única visualização para justificar o aumento dos gastos do seguro saúde.
Quais são os requisitos do problema?
Avaliar a evolução dos gastos da operadora, sendo assim, o gasto total da operadora; a idade média dos usuários da operadora; o gasto médio por região; a faixa etária que possui maior gasto com seguro saúde por região; as crianças tem gasto maior que adultos; qual a proporção de crianças por região; o aumento da idade influencia no IMC; quem tem maior gasto, homens ou mulheres; o IMC de um usuário mulher é acima ou abaixo da média; o gasto é maior ou menor que a média de gastos da região de um usuário homem com mais de 50 anos e da região Sudeste.
A minha fonte de dados é suficiente para responder às perguntas de negócios?
Sim, os atributos necessários serão ValorSeguro do primeiro requisito; Idade para o segundo requisito; ValorSeguro e Região para o terceiro requisito; agrupar Idade em faixas etárias, ValorSeguro e Região para o quarto requisito; EhCrianca e/ou Idade e ValorSeguro para o quinto requisito; EhCrianca e Região para o sexto requisito; Idade e IMC para o sétimo requisito; ValorSeguro e Sexo para o oitavo requisito; Sexo e IMC para o nono requisito; Sexo, Idade, Região e ValorSeguro para o décimo requisito. Nenhum outro será preciso.
Meus dados estão prontos para criar as visualizações?
Não, os dados requerem pré-processamento adicional. Contudo, também é importante averiguar as configurações regionais da fonte de dados e mapear os tipos de dados.
Preciso estabelecer um Modelo de Organização dos Dados?
O problema abordado não requer a definição de um Modelo de Organização de Dados. Contudo, caso os tomadores decisão necessitem da apresentação operacional da empresa mais vezes e/ou a fonte dos dados esteja em um banco de dados relacional, talvez seja necessário a criação de um.
Como os dados que possuo vão contribuir para resolver o problema?
Os dados têm a capacidade de responder as perguntas dos diretores e contribuir para a identificação do aumento considerável dos gastos do seguro saúde.
Houve algum problema na implementação da solução?
Os diretores estão preocupados sobre como tomar suas decisões e não cabe a eles avaliar se os dados atendem as suas indagações (cabe ao analista de dados avaliar).
Sobretudo, o departamento de TI notificou que havia a informação de que o usuário era criança ou não, mas não foi possível estabelecer com exatidão a informação no conjunto de dados.
Para validar se os dados continham usuários crianças ou não. Verificou-se que a idade mínima dos usuários é de 18 anos, ou seja, não havia nenhuma criança nos dados. Deste modo, não foi possível responder as perguntas 5 e 6 dos diretores.
Dashboard (versão 1.0)
Dashboard (versão 1.1)
Agrupar dados por Faixa Etária
Agrupar dados por Meia Idade
Alterar o Gráfico de Dispersão para não resumir os dados contínuos
Adicionado Cartão da Média Geral IMC
Adicionado Tabela da Média IMC Por Gênero
Adicionado Filtro por Meia Idade
Adicionado Filtro por Gênero
Adicionado Filtro por Região
Dashboard (versão 1.2)
Organizado layout
Alterado cores do dashboard
O gasto total da operadora é de 17,68 milhões.
A idade média dos usuários é de 39 anos.
Os gastos médios das regiões Sul e Norte estão acima do gasto médio operacional.
A faixa etária de 50 a 59 anos possui maior gasto com seguro saúde.
O aumento da idade influencia no IMC.
O gênero masculino tem maior gasto.
O IMC está abaixo da média para o usuário mulher.
O gasto é maior do que a média de gastos para o usuário homem com mais de 50 anos da região Sudeste.
Arquivos
Os arquivos com os dados e o dashboard do projeto podem ser acessados em meu GitHub.
Referências
- Microsoft Power BI para Data Science, Versão 2.0. Data Science Academy.
Comentários
Postar um comentário