在 Python 中处理文本数据是使用
- 单引号:
'允许包含有 "双" 引号'
- Double quotes:
"allows embedded 'single' quotes"
- 三重引号:
'''三重单引号'''
,"""三重双引号"""
使用三重引号的字符串可以跨越多行 —— 其中所有的空白字符都将包含在该字符串字面值中。
作为单一表达式组成部分,之间只由空格分隔的多个字符串字面值会被隐式地转换为单个字符串字面值。 也就是说,("spam " "eggs") == "spam eggs"
。请参阅 字符串与字节串字面值 有解有关不同字符串字面值的更多信息,包括所支持的转义序列,以及使用 r
("raw") 前缀来禁用大多数转义序列的处理。字符串也可以通过使用 str
构造器从其他对象创建。由于不存在单独的“字符”类型,对字符串做索引操作将产生一个长度为 1 的字符串。 也就是说,对于一个非空字符串 s, s[0] == s[0:1]
。不存在可变的字符串类型,但是 str.join()
或 io.StringIO
可以被被用来根据多个片段高效率地构建字符串。
str 对象,也称为 字符串。 字符串是由 Unicode 码位构成的不可变序列。 字符串字面值有多种不同的写法:
str.
capitalize
()
返回原字符串的副本,其首个字符大写,其余为小写。
str.
casefold
()
返回原字符串消除大小写的副本。 消除大小写的字符串可用于忽略大小写的匹配。
str.
center
(width[, fillchar])
返回长度为 width 的字符串,原字符串在其正中。 使用指定的 fillchar 填充两边的空位(默认使用 ASCII 空格符)。 如果 width 小于等于 len(s)
则返回原字符串的副本。
str.
count
(sub[, start[, end]])
返回子字符串 sub 在 [start, end] 范围内非重叠出现的次数。 可选参数 start 与 end 会被解读为切片表示法。
str.
endswith
(suffix[, start[, end]])
如果字符串以指定的 suffix 结束返回 True
,否则返回 False
。 suffix 也可以为由多个供查找的后缀构成的元组。 如果有可选项 start,将从所指定位置开始检查。 如果有可选项 end,将在所指定位置停止比较。
str.
expandtabs
(tabsize=8)
返回字符串的副本,其中所有的制表符会由一个或多个空格替换,具体取决于当前列位置和给定的制表符宽度。 每 tabsize 个字符设为一个制表位(默认值 8 时设定的制表位在列 0, 8, 16 依次类推)。 要展开字符串,当前列将被设为零并逐一检查字符串中的每个字符。 如果字符为制表符 (\t
),则会在结果中插入一个或多个空格符,直到当前列等于下一个制表位。 (制表符本身不会被复制。) 如果字符为换行符 (\n
) 或回车符 (\r
),它会被复制并将当前列重设为零。 任何其他字符会被不加修改地复制并将当前列加一,不论该字符在被打印时会如何显示。
'01\t012\t0123\t01234'.expandtabs()
'01 012 0123 01234'
'01\t012\t0123\t01234'.expandtabs(4)
'01 012 0123 01234'