0
点赞
收藏
分享

微信扫一扫

python泰坦尼克号生存预测

python泰坦尼克号生存预测_填充空白

python泰坦尼克号生存预测_填充空白_02

python泰坦尼克号生存预测_填充空白_03

缺失值分析处理

python泰坦尼克号生存预测_数据分析_04

python泰坦尼克号生存预测_数据_05

python泰坦尼克号生存预测_填充空白_06

python泰坦尼克号生存预测_填充空白_07

python泰坦尼克号生存预测_数据分析_08

可视化&数据分析

python泰坦尼克号生存预测_填充空白_09

python泰坦尼克号生存预测_数据_10

python泰坦尼克号生存预测_数据_11

python泰坦尼克号生存预测_数据分析_12

代码

  1. importnumpyasnp
  2. importpandasaspd
  3. importmatplotlib.pyplotasplt
  4. importseabornassns
  5. importwarnings
  6. warnings.filterwarnings('ignore')

  7. train = pd.read_csv("train.csv")
  8. test = pd.read_csv("test.csv")
  9. gender= pd.read_csv("gender.csv")
  10. print(train.head())
  11. print(test.head())
  12. print(gender.head())

  13. data=pd.concat([train,test],ignore_index=True)
  14. data

  15. print(data.info())

  16. print(data.isnull().sum())#Cabin缺失数据较多,可直接删除

  17. data.describe()#查看年龄统计数据数据,使用年龄的平均值填充空白值

  18. data.Age=data.Age.fillna(data.Age.mean())#用平均值填充年龄
  19. data

  20. data[data.Fare.isnull()]

  21. data.Fare=data.Fare.fillna(data[(data.Embarked =='S')&(data.Pclass ==3)].Fare.median())

  22. data[data.Embarked.isnull()]

  23. data.groupby(by=['Pclass','Embarked']).Fare.median()

  24. data.groupby(by=['Pclass','Embarked']).Survived.count()

  25. data.Embarked=data.Embarked.fillna('C')

  26. data.iloc[61]

  27. data=data.drop('Cabin',axis=1)#Cabin数据缺失将近70%,删除Cabin列。
  28. data

  29. print(data.isnull().sum())

  30. sns.barplot(x='Pclass',y='Survived',data=data)

  31. plt.subplots(figsize=(15,8))
  32. sns.kdeplot(data.loc[(data['Survived']==0),'Pclass'],shade=True,color='red',label='Not Survived')
  33. sns.kdeplot(data.loc[(data['Survived']==1),'Pclass'],shade=True,color='blue',label='Survived')
  34. labels=['1','2','3']
  35. plt.xticks(sorted(data.Pclass.unique()),labels)
  36. plt.show()

  37. sns.barplot(x='Sex',y='Survived',data=data)#女性生存数量大于男性

  38. sns.barplot(x='Parch',y='Survived',data=data)

  39. sns.barplot(x='SibSp',y='Survived',data=data)

  40. sns.barplot(x='Embarked',y='Survived',data=data)


举报

相关推荐

0 条评论