0
点赞
收藏
分享

微信扫一扫

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理


目录

  • ​​前言​​
  • ​​2.2. 数据预处理​​
  • ​​2.2.1. 读取数据集​​
  • ​​2.2.2. 处理缺失值​​
  • ​​2.2.3. 转换为张量格式​​
  • ​​结语​​

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_数据预处理

前言

Hello!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
 
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研。
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
 
唯有努力💪
 

知其然 知其所以然!

 
本文仅记录自己感兴趣的内容

2.2. 数据预处理

2.2.1. 读取数据集

创建一个人工数据集,并存储在CSV(逗号分隔值)文件 路径: ​​../data/house_tiny.csv​

import os

os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
f.write('NumRooms,Alley,Price\n') # 列名
f.write('NA,Pave,127500\n') # 每行表示一个数据样本
f.write('2,NA,106000\n')
f.write('4,NA,178100\n')
f.write('NA,NA,140000\n')

​../data/house_tiny.csv​​表示在上一层目录新建一个data文件夹,再在其中创建一个csv文件,存放数据

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_缺失值_02


【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_读取数据_03


【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_读取数据_04

​os.makedirs()​​​ 方法用于​​递归创建目录​

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_数据预处理_05


读取csv文件中的数据

import pandas as pd

data = pd.read_csv(data_file)
print(data)

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_深度学习_06

2.2.2. 处理缺失值

使用​​fillna​​处理缺失值

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_缺失值_07


​get_dummies​​的使用

进行one-hot编码

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_缺失值_08


【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_数据预处理_09

2.2.3. 转换为张量格式

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_深度学习_10

结语

学习资料:​​http://zh.d2l.ai/​

文章仅作为个人学习笔记记录,记录从0到1的一个过程

希望对您有一点点帮助,如有错误欢迎小伙伴指正

【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理_数据预处理_11


举报

相关推荐

0 条评论