0
点赞
收藏
分享

微信扫一扫

Python集合和字符串

愚鱼看书说故事 2022-02-24 阅读 76

集合

认识集合

1.认识集合(set)

  1. 集合是容器型数据类型,将{}作为容器的标志里面多个数据用逗号隔开:{数据1, 数据2, 数据3,…}
  2. 可变的(支持增删改);无序(不支持下标操作)
  3. 元素的要求:
    • 必须是不可变的数据
    • 元素是唯一
# 空集合
set1 = set()
print(type(set1), len(set1))

# 集合是无序的
print({1, 2, 3} == {3, 2, 1})       # True

# 集合元素必须是不可变类型的数据
set1 = {1, 'acb', True, (10, 20)}
print(set1)

# set2 = {1, 'acb', True, [10, 20]}     # 报错!

# 集合元素是唯一
set3 = {10, 20, 10, 20, 30, 10}
print(set3)     # {10, 20, 30}

names = ['张三', '李四', '张三', '王五', '张三']
print(set(names))

2.集合的增删改查(不重要)

  1. 查 - 只能遍历

    补充:用for循环遍历无序序列的时候,系统在遍历之前会自动将无序序列转换成列表,然后再遍历列表

    • 集合.add(元素) - 添加指定元素
    • 集合.update(序列) - 将序列中所有的元素都添加到集合中
  2. 集合.remove(元素)

3.数学集合运算

python中使用的集合和数学集合是一个东西,并且支持数学集合运算

python支持的数学集合运算:交集(&)、并集(|)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)

  1. 交集 - 获取两个集合的公共部分

  2. 并集 - 将两个集合合并成一个集合

  3. 差集

    集合1 - 集合2 - 获取集合1中去掉包含在集合2中的部分剩下的部分

  4. 对称差集 - 将两个集合合并然后去掉公共部分

  5. 子集和真子集

    • 集合1 > 集合2 - 判断集合2是否是集合1的真子集
    • 集合1 < 集合2 - 判断集合1是否是集合2的真子集
set1 = {1, 2, 3, 4, 5}
set2 = {3, 4, 5, 6, 7, 8}

print(set1 & set2)      # {3, 4, 5}

print(set1 | set2)      # {1, 2, 3, 4, 5, 6, 7, 8}

print(set1 - set2)      # {1, 2}
print(set2 - set1)      # {8, 6, 7}

print(set1 ^ set2)      # {1, 2, 6, 7, 8}

print({1, 2} < {1, 2, 3})       # True
print({100, 200, 300, 400, 1, 2} > {1, 2})      # True

# {1, 2, 3}  真子集: {}、{1}、{2}、{3}, {1, 2}、{1, 3}、{2, 3}
# {1, 2, 3}  子集: {}、{1}、{2}、{3}, {1, 2}、{1, 3}、{2, 3}, {1, 2, 3}
# 练习:用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)
python = {'stu1', 'stu3', 'stu4', 'stu6', 'stu9', 'stu10'}
java = {'stu2', 'stu3', 'stu5', 'stu6', 'stu9', 'stu10'}
h5 = {'stu2', 'stu4', 'stu6', 'stu7', 'stu8', 'stu10'}

# 1. 求选课学生总共有多少人
set1 = python | java | h5
print(len(set1))

# 2. 求只选了第一个学科的人的数量和对应的名字
set2 = python - java - h5
print(set2)

# 5. 求选了三门学生的学生的数量和对应的名字
set3 = python & java & h5
print(set3)

# 3. 求只选了一门学科的学生的数量和对应的名字
set4 = python ^ java ^ h5 - set3
print(set4)

# 4. 求只选了两门学科的学生的数量和对应的名字
set5 = set1 - set3 - set4
print(set5)

字符串

字符串和字符

1.什么是字符串(str)

  1. 字符串是容器型数据类型;将’’、""、’’’’’’、""""""作为容器的标志,引号里面的每一个符号都是字符串的元素(字符串的元素又叫字符)
  2. 不可变的(不支持增删改)、有序的(支持下标操作)
  3. 字符串的元素:一切符号都可以作为字符串的元素,字符串的元素又叫字符。字符分为两种:普通字符和转义字符
# 三个引号和一个引号的区别:
str1 = 'abcsdfa'
str2 = "abc123"

str3 = '''abc123
阿士大夫和
阿士大夫和
爱撒娇是'''

str4 = """
        man
        爱斯达克加分号asd
        阿萨德发卡号
        阿萨德发卡号
"""
print(type(str3), type(str4))       # <class 'str'> <class 'str'>

# 空串
str5 = ''
print(len(str5))        # 0

str6 = ' '
print(len(str6))        # 1

# 字符可以是任何符号
str7 = 'sfhJAMF234沙士大夫~!@#$%([}❀😁'
print(str7)

2.字符 - 字符串中的每个独立的符号就是一个字符

字符分为普通字符和转义字符

  1. 普通字符 - 表示符号本身的字符就是普通字符

  2. 转义字符 - 具备特殊功能或特殊意义的符号就是转义字符。所有的转义字符的通用格式:\X、\XXXX(转义字符是通过\加普通字符构成的,但是不是所有的普通字符前加\都可以变成转义字符)

    \n    -    换行
    \t    -    水平制表符(相当于按一次tab键)
    \'    -    一个单引号
    \"    -    一个双引号
    \\    -    一个反斜杠
    

​ 注意:所有的转义字符的长度都是1

  1. \u4位的十六进制数 - 编码字符(4位的十六进制数是字符在计算机中的编码值)

    十六进制数 - 每一位上的数可以是09或者af(A-F)

字符编码

1.计算机存储数据的原理

  1. 计算机能够直接存储的数据只有数字,存数字的时候保存的时候数字的补码。
  2. 如果想要将非数字数据保存到计算机中,存储的时候一定会先将数据转换成数字。
  3. 如果需要存储的是文字,计算机会保存这个文字符号对应的编码值。

2.字符编码

每个文字符号(字符)在计算机中都对应一个固定的数字,这个数字就是这个符号的编码值。

3.字符编码表 - 记录每个符号和数字对应关系的表

常用编码表: ASCII码表、Unicode编码表(Python)

  1. ASCII码表

    • ASCII码表只有128个字符(不够用)

    • 在ASCII码表中:数字字符在字母的前面、大写字母在小写字母的前面、大写字母和小写字母之间有间隙、数字从0开始连续递增,字母从(a/A)开始连续递增

      a - 97

      A - 65

  2. Unicode编码表 - 是ASCII码表的扩展,里面包含ASCII码表

    • Unicode编码表中包含了世界上所有的国家所有的民族的所有符号(万国码)
    • 中文编码范围:4e00 ~ 9fa5

4.编码值在python中的应用

  1. chr函数: chr(编码值) - 根据编码值对应的字符; 编码值 - 整数
  2. ord函数: ord(字符) - 获取字符对应的编码值; 字符 - 长度是1的字符串
  3. 编码字符
# 程序中直接表示一个16进制数: 加前缀0x/0X
for x in range(0x1800, 0x18AF+1):
    print(chr(x), end=' ')

# hex(数字)  -  将数字转换成16进制
print(ord('余'), ord('婷'), ord('a'))
print(hex(20313), hex(23159))

# 编码字符
str1 = 'a\u0061一\u4e00'
print(str1)

# 判断指定的字符是否是中文字符
ch = '是'
print('\u4e00' <= ch <= '\u9fa5')
print(chr(0x9fa5))

字符串常用操作

1.查 - 获取字符

字符串获取字符和列表获取元素的语法一模一样

str1 = 'hello world!'
print(str1[1], str1[-1])

str2 = '\t123\u5fa3abc'
print(str2[5])

str1 = 'hello world!'
print(str1[-3:])        # 'ld!'
print(str1[-5::-1])     # 'ow olleh'

for x in str1:
    print(x)

2.字符串相关操作

  1. +、*

    str1 = 'abc'
    str2 = '123'
    print(str1 + str2)      # 'abc123'
    print(str1 * 3)     # 'abcabcabc'
    
  2. 比较大小: >、<、>=、<=

    两个字符串比较大小,比较的是第一对不相等的字符的编码值大小;

    应用:判断字符的性质

    • 判断字符x是否是数字字符: ‘0’ <= x <= ‘9’
    • 判断字符x是否是小写字母: ‘a’ <= x <= ‘z’
    • 判断字符x是否是大写字母: ‘A’ <= x <= ‘Z’
    • 判断字符x是否是字母:‘a’ <= x <= ‘z’ or ‘A’ <= x <= ‘Z’
    • 判断字符x是否是中文:’\u4e00’ <= x <= ‘\u9fa5’
  3. in 和 not in

    字符串1 in 字符串2 - 判断字符串1是在字符串2中(判断字符串1是否是字符串2的子串)

    str1 = 'abc123'
    print('a' in str1)      # True
    print('abc' in str1)    # True
    print('23' in str1)     # True
    print('13' in str1)     # False
    

作业

  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    str1 = input('请输入一个字符串:')
    print(str1[1::2])
    
  2. 输入用户名,判断用户名是否合法(用户名长度6~10位)

    str2 = input('请输入用户名:')
    if 6 <= len(str2) <= 10:
        print('合法')
    else:
        print('不合法')
    
  3. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    str3 = input('请输入用户名:')
    for x in str3:
        if '0' <= x <= '9' or 'A' <= x <= 'Z' or 'a' <= x <= 'z':
            continue
        else:
            print('不合法')
            break
    else:
        print('合法')
    
  4. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

  5. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    str5 = input('请输入一个字符串:')
    str0 = ''
    for x in str5:
        if '0' <= x <= '9':
            str0 += x
    print(str0)
    
  6. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    # 方法一
    str6 = input('请输入一个字符串:')
    print(str6.upper())
    
    # 方法二
    str0 = ''
    for x in str6:
        if 'a' <= x <= 'z':
            str0 += chr(ord(x) - 32)
        else:
            str0 += x
    print(str0)
    
  7. 输入一个小于1000的数字,产生对应的学号

    str7 = input('请输入一个小于1000的数字:')
    str0 = 'py1901'
    if len(str7) == 1:
        print(str0 + '00' + str7)
    elif len(str7) == 2:
        print(str0 + '0' + str7)
    elif len(str7) == 3:
        print(str0 + str7)
    
  8. 输入一个字符串,统计字符串中非数字字母的字符的个数

    str8 = input('请输入一个字符串:')
    count = 0
    for x in str8:
        if '0' <= x <= '9' or 'a' <= x <= 'z' or 'A' <= x <= 'Z':
            continue
        else:
            count += 1
    print(count)
    
  9. 输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串

    str9 = input('请输入一个字符串:')
    str0 = ''
    if len(str9) == 0:
        print('')
    elif len(str9) == 1:
        print('+')
    elif len(str9) == 2:
        print('++')
    else:
        for x in str9[1:len(str9)-1]:
            str0 += x
        print('+'+str0+'+')
    
  10. 输入字符串,获取字符串的中间字符

    str10 = input('请输入字符串:')
    if len(str10) % 2 == 1:
        print(str10[len(str10)//2])
    else:
        print(str10[len(str10)//2-1]+str10[len(str10)//2])
    
  11. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

  12. 获取两个字符串中公共的字符

    str1 = input('请输入字符串1:')
    str2 = input('请输入字符串2:')
    str12 = ''
    for x in str1:
     if x in str2:
            str12 += x
    print(str12)
    

举报

相关推荐

0 条评论