Author(s):
Martins, Maria Cristina M. S. G.
; Cardoso, Margarida G. M. S.
Date: 2008
Persistent ID: http://hdl.handle.net/10400.2/1288
Origin: Repositório Aberto da Universidade Aberta
Subject(s): Análise de agrupamento; Avaliação de agrupamentos; Clustering; Estabilidade interna; Clustering evaluation; Internal stability
Description
Este trabalho centra-se na avaliação de um agrupamento de clientes de cartões de crédito de uma
instituição financeira portuguesa, mediante um processo de validação cruzada, transpondo um
procedimento comum no âmbito da aprendizagem supervisionada para a análise de agrupamento
(uma metodologia de aprendizagem não supervisionada). Este procedimento de validação
cruzada que é proposto é, ainda, trabalhado de modo a adequar-se às condições da amostra de
dados usada – conjunto de dados de grande dimensão e utilização de variáveis mistas (numéricas
e categoriais). Esta metodologia permite não só a avaliação da solução de agrupamento, mas
também ajuda à caracterização dos grupos obtidos. Para além disso, fornece regras de
classificação para novos clientes de cartões de crédito. Face aos resultados obtidos, a estabilidade
interna é verificada para uma solução constituída por cinco grupos de clientes. Finalmente, são
obtidos os perfis dos grupos constituídos sendo, ainda, apontadas possíveis estratégias, no contexto de negócio, a estudar para cada um deles. Abstract: This work is focused on the evaluation of a clustering of credit card holders of a Portuguese
financial organization, using a cross-validation procedure which is imported from supervised
learning and used for evaluating results yielded by cluster analysis (an unsupervised technique).
The proposed approach is conceived to deal with the particular sample characteristics – it handles
a large data set and mixed (numerical and categorical) variables. This approach provides both the
evaluation of the clustering solution and helps characterizing the clusters. Furthermore, it
provides classification rules for new credit card holders. According to the obtained results, the
internal stability is verified for a solution with five clusters. Finally, this work presents the
profiles of the credit card holders’ clusters and suggests some possible strategies to study in each
of them, in the business context.