一、问题背景
利用集成学习xgboost实现心脏病预测。
二、数据集分析
- 数据集地址:https://www.kaggle.com/ronitf/heart-disease-uci
- 数据集中一共有303个样本,共有14个特征,特征描述如下:
| 属性 | 含义 | 
|---|---|
| age | 年龄 | 
| sex | 性别 1=male,0=female | 
| cp | 胸痛类型(4种) 值1:典型心绞痛,值2:非典型心绞痛,值3:非心绞痛,值4:无症状 | 
| trestbps | 静息血压 | 
| chol | 血清胆固醇 | 
| fbs | 空腹血糖 >120mg/dl ,1=true; 0=false | 
| restecg | 静息心电图(值0,1,2) | 
| thalach | 达到的最大心率 | 
| exang | 运动诱发的心绞痛(1=yes;0=no) | 
| oldpeak | 相对于休息的运动引起的ST值(ST值与心电图上的位置有关) | 
| slope | 运动高峰ST段的坡度 Value 1: upsloping向上倾斜, Value 2: flat持平, Value 3: downsloping向下倾斜 | 










