1.1-1.5一些概念
SQL structured Query Language :检索,筛选,更新,写入程序
DBA database admin管理整个数据库,保护数据库:
ü Manages entire database
ü Gives permissions to users
ü Determines access to data
ü Manages and creates tables
ü Uses SQL to query and retrieve data
DS data scientist 数据科学家是数据库的的最终用户
ü End user of a database
ü Uses sql to squery and retrieve data
Data modeling
-used to organizes and structures information into multiple, related tables
-can represent a business process or show relationships between business processes
Relational model:用来优化查询数据
Transactional model:储存信息
Data model building blocks:关系模型有三个构建模块
entity:实体,可以是人,地点,事件
Attribute:属性,实体的特征
Relationship:一对多,一对一,多对多,经常用ER model描述
Primary key主键,唯一标识表中的每一行
Foreign key 外键,一列或者多列识别单行的值
1.6 使用select语句检索数据
筛选多个或者单个列
SELECT prod_name, prod_id, prod_price
FROM products;
筛选所有列
SELECT *
FROM products;
如果要进一步筛选:用limit语句
只要前五条数据
SELECT prod_name, prod_id, prod_price
FROM products
LIMIT 5;
1.7 创建表格table
table的作用:创建模型并预测检验,创建dashboards,和其他工具结合可视化,删除数据
第一列:列名称
第二列:char() 字符数; decimal()小数,varchar()
第三类:定义主键,能否允许null值;主键不允许出现null
添加数据
更加推荐使用这个方法:
1.8 创建临时表 temporary tables
临时表:如果客户端会话终止,临时表就会被删除;如果有复杂的查询,可以创建一个子集的临时表,在临时表中进行计算,速度快
用CREATE TEMPORARY TABLE 创建:
CREATE TEMPORARY TABLE sandals AS
(
SELECT *
FROM shoes
WHERE shoe_type = 'sandals'
)
生成一个临时表需要的流程,
添加注释: