0
点赞
收藏
分享

微信扫一扫

2022数维杯A

悲催博士僧 2022-05-06 阅读 86

A题是经典的数据问题,那对这类问题我们首先要做的就是数据预处理,至于怎么处理,删除或者填补都是可以的。

问题1:请你从这64项数据中整理出适合的投入产出数据,并对各银行的效率展开对应评价,同时提供银行倒闭效率的分界线;

针对这个问题,确定权重和评价的方法有很多,熵权法、Tosis、灰色评价等。第一问还是比较简单的,可以参考2020年的国赛C题。

问题2:请利用该 64 项指标对银行倒闭的原因进行挖掘,并提供最为重要的 5 项指标数据及其对应的权重;

针对这个问题,依旧是确定权重。

问题3:对任务 1 和任务 2 中的银行倒闭分析结果展开比对分析,同时提出 一个精确的倒闭风险预测模型;

针对这个问题,这个问题可以考虑用机器学习结合0-1分类。无非就是倒闭或者没倒闭,0-1分类还是很好做的。

问题4:你能否从 2021 年银行数据中筛选出最具代表意义的 20 家现存银行 和 20 家倒闭银行,并利用这些银行数据对其它银行倒闭风险进行预测;

针对这个问题,套用前一问的模型即可。

问题5:你能否通过相关理论分析出 2017 年至 2021 年的银行数据中哪些数 据可能来自同一家银行,并结合同一家银行的时间序列数据预测哪些银行呈现出 了倒闭的趋势。

针对这个问题的话,目前我还没想到很好的做法,后面想到了我再更新。

如果仅仅是数据预处理的话,估计效果依旧不是很好。所以可以再想想建立一个数据清洗的模型,这样机器学习的效果估计好点。

以上只是我个人拙见,不一定是正确的。后续有新思路或者修改,我会继续更新。

举报

相关推荐

0 条评论