Python教程(12)——Python数据结构集合set介绍
集合是一种无序、可变的数据结构,它也是一种变量类型,集合用于存储唯一的元素。集合中的元素不能重复,并且没有固定的顺序。在Python 提供了内置的 set
类型来表示集合,所以关键字set
就是集合的意思。
你可以使用大括号 {}
或者 set()
函数来创建一个集合。
my_set = {1, 2, 3} # 使用大括号创建集合
print(my_set) # 输出: {1, 2, 3}
my_set = set([1, 2, 3]) # 使用 set() 函数创建集合
print(my_set) # 输出: {1,2, 3}
需要注意的是,集合是无序的,没有固定的顺序。因此,集合元素的顺序可能与你创建或添加的顺序不同。
集合具有以下特点:
- 集合中的元素是唯一的,不重复。如果重复相同的元素,集合将自动去重。
- 集合是无序的,没有固定的顺序。因此,你无法像列表或元组那样索引来访问集合中的元素。
- 集合是可迭代的,你可以使用
for
循环遍历集合中的元素。 - 集合是可变的,你可以添加、删除和修改集合中的元素
创建集合
要使用集合,首先就必须要创建,那么在 Python 中,有哪些创建集合的方式呢?你可以使用以下几种方式创建集合。
1、 使用大括号 {}
或者 set()
函数创建一个集合,将元素用逗号隔开:
my_set = {1, 2, 3} # 使用大括号创建集合
print(my_set) # 输出: {1, 2, 3}
my_set = set([1, 2, 3]) # 使用 set() 函数创建集合
print(my_set) # 输出: {1, 2, 3}
注意,如果你使用空的大括号 {}
来创建一个对象,那么创建的将是一个空字典,而非空集合。因此,你必须使用 set()
函数来创建一个空集合:
empty_set = set()
print(empty_set) # 输出: set()
2、 使用集合推导式来创建集合。集合推导式的语法类似于列表推导式,只需将中括号 [ ]
替换为大括号 { }
:
my_set = {i for i in range(1, 5)}
print(my_set) # 输出: {1, 2, 3, 4}
3、 将其他可迭代的对象(列表、字符串、元组等)转换为集合,可以使用 set()
函数来实现:
my_list = [1, 2, 3, 2]
my_set = set(my_list)
print(my_set) # 输出: {1, 2, 3}
my_string = 'hello'
my_set ={my_string}
print(my_set) # 输出: {'h', 'e', 'l', 'o'}
访问集合
由于集合是无序的,没有固定的索引,使用索引访问集合中的元素是不可行的,要访问集合中的元素,你可以使用迭代器或者通过成员运算符来实现。
1、 使用迭代器:通过使用 for 循环遍历集合中的每个元素。
my_set = {1, 2, 3}
for item in my_set:
print(item)
2、 使用成员运算:使用 in
或者 not in
运算符来检查元素是否存在于集合中。
my_set = {1, 2, 3}
print(2 in my_set) # 输出: True
print(4 not in my_set) # 输出: True
删除集合
在 Python 中,可以使用 del
关键字来删除集合:
1、 使用 del
关键字删除集合变量,删除之后如果再次访问,就会发生错误。
my_set = {1, 2, 3}
del my_set
修改集合元素
创建的集合,我们可以对其中的集合元素进行操作,不仅可以添加元素,还是可以删除其中的元素。
添加集合元素
1、使用 add()
方法向集合中添加元素。
my_set = {1, 2, 3}
my_set.add(4)
print(my_set) # 输出: {1, 2, 3, 4}
2、使用列表的解包操作添加多个元素。
my_set = {1, 2, 3}
new_elements = [4, 5]
my_set.update(new_elements)
print(my_set) # 输出: {1, 2, 3, 4, 5}
因为集合的元素是唯一的,所以如果添加了重复的元素,那么重复的元素不会被添加到集合中,当然执行的过程并不会发生报错,只是不会被添加进去而已。在使用update()
方法时,传入的参数可以是一个集合、列表或者其他可迭代对象。
删除集合元素
1、 使用 remove()
方法删除指定元素:remove()
方法会从集合中删除指定的元素。如果集合中不存在该元素,会引发 KeyError
异常。
my_set = {1, 2, 3, 4}
my_set.remove(3)
print(my_set) # 输出: {1, 2,4}
my_set.remove(5) # 删除不存在的元素,引发 KeyError 异常
2、 使用 discard()
方法删除指定元素:discard()
方法会从集合中删除指定的元素。如果集合不存在该元素,该不会引发异常而是不进行任何操作。
my_set = {1, 2, 3 4}
my_set.discard(3)
(my_set) # 输出: {1, 2, 4}
my_set.discard(5) # 删除不存在的元素,不会引发异常
3、 clear()
方法清空集合:clear()
方法会清空集合元素。
my_set = {1, 2, 3, 4}
my_set.clear()
print(my_set) # 输出: set()
集合运算:
集合的运算指的是对集合进行一系列操作,包括求并集、交集、差集和对称差集等。这些运算可通过运算符或方法来进行。
并集(Union)
可以使用 |
运算符或者 union()
方法来获取两个集合的并集。所谓的并集就是包含set1和set2集合的所有元素。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 | set2 # 使用 | 运算符
# 或者使用 union() 方法
# set3 = set1.union(set2)
print(set3) # 输出: {1, 2, 3, 4, 5}
交集(Intersection)
可以使用 &
运算符或者 intersection()
方法来获取两个集合的交集。所谓的交集就是取set1和set2集合的相同元素,没有相同元素的话返回的就是set()
。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 & set2 # 使用 & 运算符
# 或者使用 intersection() 方法
# set3 = set1.intersection(set2)
print(set3) # 输出: {3}
差集(Difference)
可以使用 -
运算符或者 difference()
方法来获取两个集合的差集。所谓的差集就是set1中独有
的元素,如果set1中的元素,在set2中也有,那么就该元素就不能在差集中。如果是set2 - set1
,那就是set2中独有的元素。结果为空的返回就是set()
。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 - set2 # 使用 - 运算符
# 或者使用 difference() 方法
# set3 = set1.difference(set2)
print(set3) # 输出: {1, 2}
对称差集(Symmetric Difference)
可以使用 ^
运算符或者 symmetric_difference()
方法来获取两个集合的对称差集。所谓的对称差集就是set1和set2中相同的元素剔除,剩下的元素就是对称差集。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
set3 = set1 ^ set2 #使用 ^ 运算符
# 或者使用 symmetric_difference() 方法
# set3 = set1.symmetric_difference(set2)
print(set3) # 输出: {1, 2, 4, 5}
需要注意的是,在使用集合运算符时,两个集合的元素类型必须一致。另外,集合的元素是唯一的,不会出现重复。
除了运算符外,还有其他一些常用的集合方法,比如 intersection_update()
方法用于在原集合上更新为两个集合的交集,difference_update()
方法用于在原集合上更新为两个集合的差集,symmetric_difference_update()
方法用于在原集合上更新为两个集合的对称差集。
集合的相关函数
Python中的集合也有不少相关的方法,以下就是列举了集合中常用的方法,如有错误的地方欢迎指出。
函数名 | 解释 |
---|---|
add(element) | 向集合中添加一个元素。 |
clear() | 移除集合中的所有元素。 |
copy() | 返回集合的副本。 |
difference(other_set[, ...]) | 返回该集合与其他集合的差集。 |
difference_update(other_set[, ...]) | 移除该集合中与其他集合相同的元素,并更新原集合。 |
discard(element) | 移除集合中指定的元素。 |
intersection(other_set[, ...]) | 返回该集合与其他集合的交集。 |
intersection_update(other_set[, ...]) | 移除该集合中与其他集合不同的元素,并更新原集合。 |
isdisjoint(other_set) | 如果两个集合没有共同的元素,则返回 True;否则返回 False。 |
issubset(other_set) | 如果该集合是另一个集合的子集,则返回 True;否则返回 False。 |
issuperset(other_set) | 如果该集合是另一个集合的超集,则返回 True;否则返回 False。 |
pop() | 随机移除并返回集合中的一个元素。 |
remove(element) | 移除集合中指定的元素。若元素不存在,将引发 KeyError 错误。 |
symmetric_difference(other_set) | 返回该集合与其他集合的对称差集。 |
symmetric_difference_update(other_set) | 移除该集合中与其他集合相同的元素,并更新原集合。 |
union(other_set[, ...]) | 返回该集合与其他集合的并集。 |
update(other_set[, ...]) | 向集合中添加其他集合的元素,并更新原集合。 |
更多精彩内容,请关注同名公众:一点sir(alittle-sir)