R语言读取(加载)txt格式数据为dataframe、基于组合逻辑筛选dataframe中的数据(两个相等判断)
目录
R语言读取(加载)txt格式数据为dataframe、基于组合逻辑筛选dataframe中的数据(两个相等判断)
R语言读取(加载)txt格式数据为dataframe、基于组合逻辑筛选dataframe中的数据(两个相等判断)
R语言是解决什么问题的?
R 是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的Ross Ihaka 和 Robert Gentleman 共同创立。由于R 受Becker, Chambers & Wilks 创立的S 和Sussman 的Scheme 两种语言的影响,所以R 看起来和S 语言非常相似。
R语言被称作R的部分是因为两位R 的作者(Robert Gentleman 和Ross Ihaka) 的姓名,部分是受到了贝尔实验室S 语言的影响(称其为S 语言的方言)。
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。
如果你是一个计算机程序的初学者并且急切地想了解计算机的通用编程,R 语言不是一个很理想的选择,可以选择 Python、C 或 Java。
R 语言与 C 语言都是贝尔实验室的研究成果,但两者有不同的侧重领域,R 语言是一种解释型的面向数学理论研究工作者的语言,而 C 语言是为计算机软件工程师设计的。
R 语言是解释运行的语言(与 C 语言的编译运行不同),它的执行速度比 C 语言慢得多,不利于优化。但它在语法层面提供了更加丰富的数据结构操作并且能够十分方便地输出文字和图形信息,所以它广泛应用于数学尤其是统计学领域。
R语言读取(加载)txt格式数据为dataframe、基于组合逻辑筛选dataframe中的数据(两个相等判断)
ReportCard1 = read.table(file='test1.txt', header=TRUE)
ReportCard2 = read.table(file='test2.txt', header=TRUE)
names(ReportCard1)
names(ReportCard2)
ReportCard = merge(ReportCard1, ReportCard2, by = 'xh')
print(head(ReportCard))
attach(ReportCard)#访问数据框中域访问
SumScore = poli + chi + math + fore + phy + che + geo + his
detach(ReportCard)
AvScore = SumScore/8#计算平均值
ReportCard$sumScore = SumScore
ReportCard$avScore = AvScore
# 通过使用within和逻辑运算符将学生平均成绩分为5个级别
ReportCard = within(ReportCard,{
avScore[avScore>= 90] = 'A'
avScore[avScore>= 80 & avScore < 90] = 'B'
avScore[avScore>= 70 & avScore < 80] = 'C'
avScore[avScore>= 60 & avScore < 70] = 'D'
avScore[avScore < 60] = 'E'
})
# 下面通过%in%包含函数,找出非正常项
flag = ReportCard$avScore %in% c('A',"B","C","D","E")
# 通过使用flag标记,将非正常的标记为缺失值
ReportCard$avScore[!flag] = NA
# 输出平均成绩等级
print(ReportCard$avScore)
ReportCard$sex = factor(ReportCard$sex, levels = c(1,2), labels = c("M","F"))
str(ReportCard$sex)
MaleScore = subset(ReportCard, ReportCard$sex == 'M' & ReportCard$avScore == 'E')
print(MaleScore)
安利一个R语言的优秀博主及其CSDN专栏:
博主博客地址:
Data+Science+Insight的博客_CSDN博客-R语言从入门到机器学习,数据科学从0到1,机器学习面试+横扫千军领域博主
statistics+insight的博客_CSDN博客-R语言入门课,Excel入门到精通,数据科学持续学习领域博主
R语言从入门到机器学习、持续输出已经超过1500篇文章、从统计学到机器学习、从可视化到数据分析
参考:R