top of page

Home Credit Group Prediction on Credit Payment Delay

PARTE 2

Análise Exploratória de Dados

Nesta seção do projeto, iniciaremos a extração de insights a partir do dataset fornecido pela empresa. Vamos explorar abordagens para responder às perguntas solicitadas e identificar novas correlações que a empresa pode não ter considerado. Incluiremos os códigos utilizados para gerar os gráficos, os próprios gráficos, e as interpretações que podem ser extraídas deles, todo o processo será feito usando Python com Matplotlib e Seaborn.

Impacto da idade na confiança do seguro:
Idade traz mais responsabilidade?

É um senso comum que pessoas mais velhas tendem a ser mais responsáveis, porém é

necessário conferir essa informação, para isso, criei um código que exibe um histograma que

faz a contagem de quantas pessoas em diferentes idades atrasam, ou não, o pagamento.

image.png

Temos uma clara tendência para confiar no senso comum nesse caso, dentre os clientes que não costumam atrasar, a idade parece bem distribuída, isso é visível pois os valores que estão acima da média marcados em preto estão centralizados no gráfico. No entanto, no 

gráfico dos clientes que atrasam, é possível observar uma clara queda conforme a idade aumenta, isso pode indicar que clientes mais velhos são mais confiáveis para obter crédito.

Vamos agora conferir fatores financeiros, pra depois ver como se relacionam com a idade.

image.png

Nesses gráficos, a linha preta representa clientes que não atrasam, e a linha cinza clientes que atrasam o pagamento, cada círculo representa um cliente e os círculos fora do intervalo interquartil estão ocos e pretos. De cara é possível perceber algumas coisas interessantes, num geral, os clientes que atrasam solicitam mais crédito que os outros também possuem bens mais caros à pagar, oque faz sentido, ambos possuem os preços dos bens equivalentes no intervalo, mas existem mais membros que atrasam fora do IQR, o mesmo pode ser dito sobre o salário do cliente, e isso ficará mais evidente no próximo gráfico, junto às idades.

image.png

Comparando essas linhas podemos identificar um problema, ainda que o salário seja bem parecido, como vimos anteriormente, os clientes que atrasam costumam solicitar mais dinheiro, a linha cinza acima da preta, e também costumam solicitar esses empréstimos para bens mais caros, esse problema costuma atingir seu pico na idade dos 50 anos, mas vale lembrar que os mais jovens costumam solicitar menos dinheiro e atrasam mais, como vimos no começo, então os mais velhos costumam dever mais dinheiro, mas são menos clientes.

image.png

Com isso fica evidente a discrepância entre os clientes que atrasam e os pontuais, nesse gráfico a cor cinza representa os valores dos bens à serem pagos pelos clientes, e o preto o valor do crédito que foi solicitado, podemos observar que os clientes que possuem atrasos solicitam mais crédito que os clientes pontuais solicitam, em média $11379 a mais de crédito, oque é um indicativo forte de um dos problemas pode ser a solicitação excessiva de crédito. 

Em resumo, podemos concluir que:

  • Clientes mais jovens tem mais chance de atrasar pagamento, enquanto clientes mais velhos costuma ser mais pontuais.

  • Clientes mais velhos pedem mais crédito e financiam bens mais caros, principalmente até os 50 anos.

  • Cliente que atrasam tem salário parecido com quem paga em dia, mas pede mais dinheiro emprestado e financia bens mais caros.

  • Clientes que atrasam aparecem mais fora do intervalo interquartil, ou seja, há mais casos extremos de endividamento.

  • Clientes jovens atrasam mais, mas devem menos; cliente mais velhos atrasa menos, mas deve mais dinheiro.

  • Clientes que atrasam pede, em média, $11.379 a mais em crédito do que quem paga em dia, o que pode indicar excesso de endividamento.

  • Cliente de 50 anos parece ser o ponto crítico, onde os pedidos de crédito e os atrasos se tornam mais evidentes.

Influência do perfil ocupacional e familiar dos clientes: Como esses fatores afetam o atraso dos clientes?

Em princípio, vamos entender quem são os nossos clientes, anteriormente entendemos melhor sobre como a idade dos clientes afeta suas decisões, agora vamos observar diferentes

aspectos de trabalho e educação, para isso vamos usar esse gráfico de barras horizontal: 

image.png

Rapidamente podemos notar um padrão nos clientes, a grande maioria não possui educação superior, e percebemos uma maior taxa de pontualidade quando os clientes possuem esse nível, além disso, clientes com cargos mais elevados também aparentam ser mais pontuais, isso é visível no gráfico dos "Tipos de Ocupação", cargos de alto nível como "Core Staff" ou "High Skill Tech Staff" são mais característicos de clientes pontuais. Isso indica que clientes de camadas mais altas na sociedade, com maior renda, atrasam menos, vamos conferir isso:

output.png

Nesse gráfico, cada ponto representa um cliente do banco, e não é tão óbvio o insight desse gráfico, ao menos não quanto pode ter parecido ser, mas ainda é visível que clientes pontuais solicitam relativamente valores semelhantes de crédito comparativamente aos que atrasam, mas possuem mais integrantes de alta renda, indicando que salário é pode ser um fator de importância para a previsão dos atraso dos clientes. Vamos agora brevemente analisar para quais tipos de produtos esses créditos solicitados tem sido direcionados.

output2.png

Esse gráfico é útil para confirmarmos algumas informações passadas, a maioria dos clientes realmente não realiza compras de grande magnitude, sendo a maioria das compras para eletrônicos, e a minoria para turismo e medicina, reforçando a ideia de uma base de clientes de baixa/média renda, raramente bens caros são disponibilizados para obter crédito. Vamos conferir agora se existe algo a ser extraído dos aspectos familiares dos clientes.

image.png

Nesse gráfico podemos perceber que há poucas diferenças entre os clientes pontuais e os que atrasam, num geral a base de clientes possui o mesmo padrão nos quatro gráficos. Com isso, percebemos que a grande maioria dos clientes se encontram solteiros, moram com poucas pessoas em casa, e geralmente não possuem filhos, existe um pequeno aumento na taxa de atraso para clientes com mais filhos, mas é uma porcentagem pequena.

Em resumo, podemos concluir que: ​​

  • Clientes costumam não possuir nível superior de ensino, mas os que possuem atrasam menos.

  • Clientes com cargos mais altos onde trabalham costumam atrasar menos.

  • Clientes com atrasos e pontuais solicitam valores semelhantes de crédito, mas clientes com salários maiores costumam atrasar menos o pagamento do crédito, mas não é um valor tão significativo.

  • Produtos que  créditos são mais solicitados estão relacionados à eletrônicos, e não custam muito. outras solicitações mais caras para veículos, medicina e turismo são quase inexistentes ou negadas.

  • ​Fatores familiares não impactam no atraso dos clientes, e a maioria é solteira, com poucos membros na família.

bottom of page