Dashboard Operacional com Power BI - VivaSaúde

Descrição

Você é o Analista de Dados da operadora de plano de saúde, VivaSaúde, que atende em quatro regiões do Brasil. Os diretores perceberam que os gastos de seguro saúde aumentaram de forma considerável e precisam monitorar a evolução dos gastos.

Problema

Os diretores fizeram diversas perguntas e gostariam de poder visualizar as respostas em uma única tela ou visualização.

Os dados disponíveis correspondem ao ano anterior dos usuários da operadora possuem as colunas: idade, sexo, IMC (índice de massa corpórea), se é criança, se é fumante, a região do usuário e o valor de seguro saúde de cada usuário.

Sua fonte de dados é um arquivo .csv com dados coletados do sistema de vendas, CRM e ERP da empresa. O conjunto de dados foi entregue pelo departamento de TI.

Os diretores precisam de respostas às seguintes perguntas:
  1. Qual o gasto total da operadora?

  2. Qual a idade média dos usuários da operadora?

  3. Qual o gasto médio por região?

  4. Qual faixa etária possui maior gasto com seguro saúde por região?

  5. Crianças tem gasto maior que adultos?

  6. Qual a proporção de crianças por região?

  7. O aumento da idade influencia no IMC?

  8. Quem tem maior gasto, homens ou mulheres?

  9. Se o usuário for mulher, o IMC é acima ou abaixo da média?

  10. Se for homem, com mais de 50 anos e da região Sudeste, o gasto é maior ou menor que a média de gastos da região?

Seu trabalho é responder às perguntas dos diretores em uma única visualização, ou seja, um único Dashboard.

Proposta de Solução

Indagações iniciais

  1. Qual problema de negócio eu preciso atender?

    Ajudar a responder as perguntas dos diretores através de uma única visualização para justificar o aumento dos gastos do seguro saúde.

  2. Quais são os requisitos do problema?

    Avaliar a evolução dos gastos da operadora, sendo assim, o gasto total da operadora; a idade média dos usuários da operadora; o gasto médio por região; a faixa etária que possui maior gasto com seguro saúde por região; as crianças tem gasto maior que adultos; qual a proporção de crianças por região; o aumento da idade influencia no IMC; quem tem maior gasto, homens ou mulheres; o IMC de um usuário mulher é acima ou abaixo da média; o gasto é maior ou menor que a média de gastos da região de um usuário homem com mais de 50 anos e da região Sudeste.

  3. A minha fonte de dados é suficiente para responder às perguntas de negócios?

    Sim, os atributos necessários serão ValorSeguro do primeiro requisito; Idade para o segundo requisito; ValorSeguro e Região para o terceiro requisito; agrupar Idade em faixas etárias, ValorSeguro e Região para o quarto requisito; EhCrianca e/ou Idade e ValorSeguro para o quinto requisito; EhCrianca e Região para o sexto requisito; Idade e IMC para o sétimo requisito; ValorSeguro e Sexo para o oitavo requisito; Sexo e IMC para o nono requisito; Sexo, Idade, Região e ValorSeguro para o décimo requisito. Nenhum outro será preciso.

  4. Meus dados estão prontos para criar as visualizações?

    Não, os dados requerem pré-processamento adicional. Contudo, também é importante averiguar as configurações regionais da fonte de dados e mapear os tipos de dados.

  5. Preciso estabelecer um Modelo de Organização dos Dados?

    O problema abordado não requer a definição de um Modelo de Organização de Dados. Contudo, caso os tomadores decisão necessitem da apresentação operacional da empresa mais vezes e/ou a fonte dos dados esteja em um banco de dados relacional, talvez seja necessário a criação de um.

  6. Como os dados que possuo vão contribuir para resolver o problema?

    Os dados têm a capacidade de responder as perguntas dos diretores e contribuir para a identificação do aumento considerável dos gastos do seguro saúde.

  7. Houve algum problema na implementação da solução?

    Os diretores estão preocupados sobre como tomar suas decisões e não cabe a eles avaliar se os dados atendem as suas indagações (cabe ao analista de dados avaliar).

    Sobretudo, o departamento de TI notificou que havia a informação de que o usuário era criança ou não, mas não foi possível estabelecer com exatidão a informação no conjunto de dados.

    Para validar se os dados continham usuários crianças ou não. Verificou-se que a idade mínima dos usuários é de 18 anos, ou seja, não havia nenhuma criança nos dados. Deste modo, não foi possível responder as perguntas 5 e 6 dos diretores.

Dashboard (versão 1.0)

Dashboard (versão 1.1)

  • Agrupar dados por Faixa Etária

  • Agrupar dados por Meia Idade

  • Alterar o Gráfico de Dispersão para não resumir os dados contínuos

  • Adicionado Cartão da Média Geral IMC

  • Adicionado Tabela da Média IMC Por Gênero

  • Adicionado Filtro por Meia Idade

  • Adicionado Filtro por Gênero

  • Adicionado Filtro por Região

Dashboard (versão 1.2)

  • Organizado layout

  • Alterado título do dashboard

  • Alterado cores do dashboard

Insights

  • O gasto total da operadora é de 17,68 milhões.

  • A idade média dos usuários é de 39 anos.

  • Os gastos médios das regiões Sul e Norte estão acima do gasto médio operacional.

  • A faixa etária de 50 a 59 anos possui maior gasto com seguro saúde.

  • O aumento da idade influencia no IMC.

  • O gênero masculino tem maior gasto.

  • O IMC está abaixo da média para o usuário mulher.

  • O gasto é maior do que a média de gastos para o usuário homem com mais de 50 anos da região Sudeste.

Arquivos

Os arquivos com os dados e o dashboard do projeto podem ser acessados em meu GitHub.

Referências

Fique à vontade para deixar nos comentários opiniões ou sugestões de melhoria.

Comentários

Postagens mais visitadas deste blog

Dados Estruturados, Semi-Estruturados e Desestruturados

Normalização e Desnormalização de Banco de Dados

Por que usar R?

Tipos de Análise de Dados

Dashboard de Vendas com Power BI - RoupasParaTodos