客群划分思路大集合
过去的一段时间里一直在琢磨客群划分的问题
隐隐约约觉得所谓的 客群划分 和 市场细分 不谋而合,并且我发现风控领域很重视 “圈客群”
但因为部门不同,最后关注的目的也存在一定的差异。对于风控而言,在兼顾风险的同时,给出差异性的策略。在贷前,差异性策略方面可能更多是关注授信额度的问题。贷中,更多关注调额方面。
本文将整理市场细分/客群划分的一些方法
有监督学习—树模型
相关文章:
将客群划分(/市场细分)看成是一个分类问题,因为做客群划分肯定是有目的/目标的,比如是否违约、客户忠诚等等
针对我们的目标,定义好我们的问题,进一步得到模型需要的label(y值)。基于提取的变量,最后可采用决策树实现客群划分,甚至可以采用随机森林、XGBoost,可视化前几棵树,看看模型给出的变量规则。
除了对算法本身的了解外,我觉得 找变量(影响label的影响因素)也是难点,毕竟需要面向业务建模(最近新造的词)。除了关注模型区分度等,更多需要注意的是 解释性,是否make sense,能不能从业务的角度去解释树模型给出的规则。
所以,在特征选择以及构造新特征方面真的需要花很大的功夫。
得到树模型输出的规则后,我们还需要注意
-
客群之间的差异性
基于决策树得到的规则,看客群之间在目标方面(如,违约率)的差异性
-
客群的稳定性
基于规则,看未来的人数分布及目标(如,违约率)
这里还涉及到一个外部数据的问题。客群划分时,尽量避免使用外部数据、尤其是被加工过的一些指标。一是不知道计算逻辑;二是不稳定。所以一般直接选取用户本身属性变量。当然,这也取决于分群的场景。
聚类
聚类用于市场细分也是比较常见的。
但最近我觉得,聚类目的性不明确。换句话说,市场细分的目的性不明显。
聚类更多是在某些变量下将相似的归为一簇
但在车企,还是会采用聚类细分市场的,如基于价格、投影面积、离地高度等变量划分车型。这也符合最初的目的:根据某些车辆参数相似的归为一类。
到底是视为聚类还是分类问题,还是要具体问题具体分析
基于常规的细分变量
-
人口统计变量
性别、年龄、职业、收入等,但“收入”的数据一般比较难获取,大多数情况下可能也是通过各种方式去预测
-
地理位置
“地域决定论” + 一方水土养一方人
这个还是要考虑具体业务
如果从逾期等违约情况来看的话:经济基础决定上层建筑,而一个城市的文明程度和经济发展也是有很大关系的。而经济发展又会受到地域的限制,正是所谓的“地域决定论”,所以经济发展差距较大的城市往往违约率也存在一定差异
不成熟的想法
在现金贷背景下,基于入不敷出的逻辑来关注风险的问题,我通过构建“收支”模型(收入和支出之间的关系)实现客群的划分。
seg | 收入 | 支出 |
---|---|---|
1 | 高 | 高 |
2 | 高 | 低 |
3 | 低 | 高 |
4 | 低 | 低 |
当然,这里的高、低是针对产品的目标用户而言
显然,对于低收入、高支出的客群,更有可能发生逾期的情况,但同时这部分人群也是更有可能产生收益的人群,所以针对这部分人群就需要深挖,兼顾风险的同时给予一定的高额度。
但难点就是在于对“收入”、“支出”的测量,在无法准确获取收入、支出数据的情况下,无论是用于测量收入还是支出的变量都需要满足产品所服务对象的特征,以能较为准确的测量“收入”与“支出”的状态。
总结
本文分别阐述了 有监督、无监督以及 常规细分变量三大划分客群的方法,具体还是要结合实际业务场景采用相应的方法
基于相应的规则完成划分后,还要基于目标问题进行横纵向对比:
-
横向比较客群的稳定性
-
纵向比较客群的差异性