0
点赞
收藏
分享

微信扫一扫

【MatLab手记】 --从0到了解超超超详过程!!!

最不爱吃鱼 2024-11-11 阅读 11

金融风控相关业务介绍

【了解】项目整体介绍

1.风控业务和风控报表</span>
零售金融产品
相关的指标
风控建模流程
​
#2.特征工程
特征构造
特征筛选
​
3.评分卡模型构建
逻辑回归
集成学习 XGBoost LightGBM
模型评估
​
#4.样本不均衡问题/异常点检测

【了解】今日内容介绍

  • 知道常见信贷风险

  • 知道机器学习风控模型的优势

  • 知道信贷领域常用术语含义

  • 了解风控业务报表(SQL)

【理解】信贷&风控介绍

  • 信贷业务,就是贷款业务,是商业银行和互联网金融公司最重要的资产业务和主要赢利手段

    • 通过放款收回本金和利息,扣除成本后获得利润。

    • 贷款平台预测有信贷需求用户的还款情况,然后将本金借贷给还款概率大的用户

  • 信贷业务中的风险控制

    • 信贷业务中,使用信用来预支金钱,在小额贷业务中往往没有抵押物,那么贷款方就会承担一定风险(用户不还钱)

    • 风控就是对用户的信用风险进行管理与规避,对于预测信用较差的人,不向其放款,即便放款,也会是较小的贷款额度和较高的利率

    • 信贷领域有两类风险

      • 信用风险:借款人的的还款能力和还款意愿在贷款后出现问题的风险

      • 欺诈风险:借款人压根没想还钱,以诈骗为目的

    • 风控业务主要针对这两类风险

      • 信用评分系统:针对信用风险

      • 反欺诈系统:针对欺诈风险

    • 基于机器学习的人工智能风控模型对比传统人工审批

      • 人工审批:效率低,对人员业务能力要求高,不适合金融零售业务场景

      • 机器学习模型:批量,迅速,准确,同时处理大量贷款请求(几万,几十万,上百万/天)

申请中信信用卡的经验:

A,信用好,有征信纪录,没有预期,违约等,没有太多的申请纪录和拒绝的纪录,结果秒批。

B,信用很差,征信记录上有逾期,有其他网贷纪录,没有安全还款,结果秒拒。

C,信用好,但是他有很多网贷纪录,同时网贷纪录也保持按期还款,纪录良好,结果是人工打电话过来,审核通过。

综上,目前银行/互金公司,一般如上两种情况都有。

【理解】常见信贷产品及常见风险介绍

  • 信贷产品介绍

    个人信贷产品
    大额借贷房贷车贷
    小微企业贷
    小额借贷消费贷蚂蚁花呗,京东白条
    现金贷蚂蚁借呗,京东金条,微粒贷,各类网贷
    数据服务信用分服务芝麻信用分,京东小白分
    信用数据服务同盾数据,百融,集奥,大峰...
    • 现金贷

    申请借款->放款给客户->客户还款

    额度500~3000
    利率24%~36%
    期限714,30天
    放款形式借给现金,不限场景
    可选功能订单展期
    现金贷产品年化利率现金贷产品年化利率
    苏宁金融24%国美易卡34%
    蚂蚁借呗24%马上消费35%
    微粒贷24%招联金融36%
    有钱花24%桔子分期36%
    京东金条24%拍拍贷36%
    360借条24%趣店36%
    小米金融24%捷信36%
    美团生活费24%宜人贷44%
    分期乐24%玖富50%
    • 消费贷

    信用卡,花呗,白条等产品,备用金(500),有账单日,还款日

信用卡/花呗:假设账单日为每个月1号。出账单的日子。

还款日:15号是还款日。还款的日子。

13日还款,提前还款。

申请消费贷 -> 额度授信->客户使用消费贷消费

额度1000~10000
利率24%
账期30天
放款形式指定消费场景
可选功能最低还款,账单展期,账单分期,停息挂账,临时额度,备用金
  • 产品类型

    • 单期产品

    • 多期产品

    • 循环额度产品

  • 还款方式

    • 砍头息:短期产品(服务费)

    • 等额本金

      • 10w,10个月,每个月1w,1w+10w的利息,1w+9w的利息

      • 每个月还款额度依次递减

    • 等额本息

      • 利息多,本金少

      • 每个月还款是一样的,整个贷款利息要比等额本金多一些

  • 信贷领域风险类别

    • 信用风险:借款人的的还款能力和还款意愿在贷款后出现问题的风险

    • 欺诈风险:借款人压根没想还钱,以诈骗为目的

  • 常见风险形式

    • 冒名顶替,黑产骗贷

    • 多头借贷,借新还旧

      • 客户:工行信用卡,招商信用卡... n张信用卡,网贷平台1,网贷平台2,网贷平台n

      • 用新借来的钱还已有的负债: 负债变多 -> 需新借更多 -> 设法提额 -> 信用资质不够 -> 出现流动性风险 -> 逾期

      • 特点:第三方数据:多头申请记录

        APP安装:大量借款类APP

        短信:大量申请短信,提醒还款,催收短信

    • POS机套现,以少换多

      • 购买有支付牌照机构的POS机进行套现,手续费0.6%

    • 针对风控模型,制作数据

      • 使用花呗在天猫购物,对花呗账单做分期

      • 买入存金宝,一个礼拜后追加存金宝资金

      • 购买***元基金

      • 保持余额宝XXX元不动,余额宝累计收益做到 XX元

      • 购买XXXX保险

【理解】风控相关术语介绍

术语解释
DPDDay past due 逾期天数 DPD0为到期当日,DPD1为逾期一日,DPD7为逾期一周
FPDFirst time past due 首次逾期天数
F/S/T/QPD首次 二次 三次 四次 逾期天数
M1逾期 [1, 30)天 M 是英文“Months”的首写字母
M1+逾期[30, inf]天
default坏账
delinquency拖欠
flow rate流动率 一般指M1向M2,M2向M3转移的比例
bad rate坏账率 当月不良资产数/总资产数
vintage账龄分析

【实现】风控业务案例

案例背景介绍

  • 通过对业务数据分析了解信贷业务状况

  • 数据集说明

    • 从开源数据改造而来,基本反映真实业务数据

    • 销售,客服可以忽略

    • 账单周期,放款日期

    • 账单金额-实收金额 = 未收金额

    • 应付日期为还款时间

    • 账期分成两种:60天和90天

    • 实际到账日为空白,说明没还钱

  • 通过对贷后业务数据的分析要分析出如下内容

    • 每个季度账单金额和坏账率(逾期90天以上)

      • 所有未收金额/所有账单金额

      • 未收金额 = 账单金额-实收金额

    • 每个季度60天账期的入催率,90天账单的入催率

      • 入催率 = 入催金额/账单金额

    • 历史逾期天数的回款情况(回收账单数)

      • 历史逾期天数:历史有逾期,但是相对现在来说,钱已经还完了

      • 当前逾期天数:现在还欠着钱,也就是说钱没还完

代码实现

  • 加载数据

import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
df1 = pd.read_excel('../data/业务数据.xlsx') 
#要使用原始数据构建新指标,所以保留原始数据,copy新的数据,在新的数据中创建新指标
df2 = df1.copy()
df2.head()
  • 查看数据基本情况

df2.info()
df2.describe()
  • 数据处理,填充缺失值,将日期时间类型转换成datetime类型

# 获取最大的日期,作为当前时间
today_time = pd.to_datetime(df2.实际到账日.fillna('0').max())

#给缺失值填充0
df2['实收金额'] = df2.实收金额.fillna(0)
df2['开票金额'] = df2.开票金额.fillna(0)
df2['未收金额'] = df2.未收金额.fillna(0)

#把时间类型转换为datetime类型
df2['账单周期'] = pd.to_datetime(df2.账单周期)
df2['应付日期'] = pd.to_datetime(df2.应付日期)

df2['实际到账日'] = pd.to_datetime(df2.实际到账日).fillna(today_time)
  • 为了后续计算,在原始数据基础上构造新的字段:是否到期,是否到期90天,未收金额2(校验原始数据中的未收金额),历史逾期天数,当前逾期天数

df2['是否到期'] = df2.apply(lambda x : 0 if x.应付日期 > today_time else 1,axis=1)

#map可以看做是apply,效果类似
df2['是否到期90天'] =  ( today_time - df2.应付日期 ).map(lambda x : 1 if x.days >= 90 else 0)

df2['未收金额2'] =  (df2.账单金额 - df2.实收金额)

df2['历史逾期天数'] = df2.apply(lambda x : (x.实际到账日 -  x.应付日期).days if x.未收金额2 == 0  else  (today_time - x.应付日期).days,axis=1)

df2['当前逾期天数'] = df2.apply(lambda x : (x.历史逾期天数) if x.未收金额2 > 0  else 0 ,axis = 1)
  • 查询实际到账日期字段得知当前最近的到账日为2019年5月17日,如果以2019年5月17日为观察点,有些贷款还没到还款日,没法统计DPD90的数据,所以,这里只统计2019年之前的情况,下面将对应时间段的数据取出

df3 =df2.copy()
#创建’账单季度‘字段,将日期转换成季度,to_period函数可以转换为季度信息
df3['账单季度'] = df3['账单周期'].map(lambda x : x.to_period('Q'))
#提取2017年3季度到2018年4季度数据
df3 = df3[(df3['账单季度']<='2018Q4') & (df3['账单季度']>='2017Q3')]
df3.shape
  • 按照季度统计账单金额,到期金额,和逾期金额

#账单金额
fn1 = df3.groupby('账单季度')[['账单金额']].sum()
fn1.columns = ['账单金额']
fn1
#90天到期金额
df4 = df3[(df3.是否到期90天 == 1)]
fn2 = df4.groupby('账单季度')[['账单金额']].sum()
fn2.columns = ['到期金额']
fn2
#当前逾期90+金额
df4 = df3[(df3.是否到期90天 == 1)]
fn3 = df4.groupby('账单季度')[['未收金额2']].sum()
fn3.columns = ['当前逾期90+金额']
fn3
  • 合并数据计算坏账率

dfs = [fn1,fn2,fn3]
final1 = pd.concat(dfs,axis=1)
final1
final1['90+净坏账率'] = round(final1['当前逾期90+金额'] / final1.到期金额,3)
final1
  • pyecharts绘图

bar = (
    Bar()
    .add_xaxis(list(final1.index.values.astype(str)))
    .add_yaxis(
        "账单金额",
        list(final1.账单金额),
        yaxis_index=0,
        color="#5793f3",
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="90+净坏账率"),
    )
    .extend_axis(
        yaxis=opts.AxisOpts(
            name="90+净坏账率",
            type_="value",
            min_=0,
            max_=0.014,
            position="right",
            axisline_opts=opts.AxisLineOpts(
                linestyle_opts=opts.LineStyleOpts(color="#d14a61")
            ),
            axislabel_opts=opts.LabelOpts(formatter="{value}"),
        )
    )
)
line = (
    Line()
    .add_xaxis(list(final1.index.values.astype(str)))
    .add_yaxis(
        "90+净坏账率",
        list(final1['90+净坏账率']),
        yaxis_index=1,
        color="#675bba",
        label_opts=opts.LabelOpts(is_show=False),
    )
)
bar.overlap(line).render()
  • 计算每个季度的60天账单金额、60天入催金额,90天账单金额、90天入催金额

#60天账期的账单金额
df4 = df3[(df3.账期 == 60)]
fn1 = df4.groupby('账单季度')[['账单金额']].sum()
fn1.columns = ['60天账期的账单金额']
#60天账期的入催金额
df4 = df3[(df3.账期 == 60)]
fn2 = df4.groupby('账单季度')[['未收金额2']].sum()
fn2.columns = ['60天账期的入催金额']
#90天账期的账单金额
df4 = df3[(df3.账期 == 90)]
fn3 = df4.groupby('账单季度')[['账单金额']].sum()
fn3.columns = ['90天账期的账单金额']
#90天账期的入催金额
df4 = df3[(df3.账期 == 90)]
fn4 = df4.groupby('账单季度')[['未收金额2']].sum()
fn4.columns = ['90天账期的入催金额']
  • 计算入催率

dfs = [fn1,fn2,fn3,fn4]
final2 = pd.concat(dfs,axis=1)
# final2 = fn1.merge(fn2,on='账单季度').merge(fn3,on='账单季度',how='left').merge(fn4,on='账单季度')
final2['60天账期入催率'] = round(final2['60天账期的入催金额'] / final2['60天账期的账单金额'],3)
final2['90天账期入催率'] = round(final2['90天账期的入催金额']/final2['90天账期的账单金额'],3)
final2
  • pyecharts绘图

line = (
    Line()
    .add_xaxis(list(final1.index.values.astype(str)))
    .add_yaxis(
        "60天账期入催率",
        list(final2['60天账期入催率']),
        yaxis_index=0,
        color="#675bba",
        label_opts=opts.LabelOpts(is_show=False),
    )
    .set_global_opts(
    title_opts=opts.TitleOpts(title="不同账期入催率"),
    )
    .add_xaxis(list(final1.index.values.astype(str)))
    .add_yaxis(
        "90天账期入催率",
        list(final2['90天账期入催率']),
        yaxis_index=0,
        color="#d14a61",
        label_opts=opts.LabelOpts(is_show=False),
    )
)
line.render()
  • 历史逾期天数的回收情况(回收账单数)

df5 = df3[(df3.未收金额2 == 0)&(df3.是否到期 == 1)].copy()
#使用cut,讲数据按照逾期天数分箱,然后添加分箱之后结果标签
df5['历史逾期天数'] = pd.cut(df5['历史逾期天数'],bins=[-999,0,5,10,15,20,30,60,90,999],right=True,
                       labels=['0','1-5','6-10','11-15','16-20','21-30','31-60','61-90','91+'])
final3 = df5.groupby('历史逾期天数')[['账期']].count()
final3.columns = ['回收账单数']
final3
  • pyecharts绘图

ydata = final3['回收账单数'].values.tolist()
bar = (
    Bar()
    .add_xaxis(list(final3.index.values.tolist()))
    .add_yaxis("收回账单数",ydata,yaxis_index=0,color="#675bba")
    .set_global_opts(
    title_opts=opts.TitleOpts(title="不同逾期天数的已收回账单数"),
    )
)
bar.render()

业务解读

  • 从数据中看出,在2018年Q2季度之前,运营策略比较保守,坏账金额和入催率都比较低,

  • 2018年Q2之后,有可能是由于运营策略调整,给更多的人放贷,但坏账率和入催率均在3%一下,在合理范围内

  • 不同逾期天数收回账单的数据看,30天内能收回绝大部分账单

【理解】信贷业务涉及部门

市场:获客 (新客, 老客)

风控:把逾期率控制在合理范围,尽可能提高通过率

催收:回款(内催 , 外催)

小结

  • 知道常见信贷风险

    • 信用风险

    • 欺诈风险

  • 知道机器学习风控模型的优势

    • 批量,迅速,准确,同时处理大量贷款请求

    • 在零售信贷业务场景下,与人工审核相比优势显著

  • 知道信贷领域常用术语含义

    • DPD 逾期天数

    • FPD 首次逾期天数

    • bad rate 坏账率

    • M1 逾期一个月以内

举报

相关推荐

0 条评论