python元组类型

元组类型简介

使用括号包围的数据结构是元组(tuple)。例如:

>>> (1,2,3)
(1, 2, 3)

>>> T = (1,2,3,)
>>> T
(1, 2, 3)

元组和列表一样,都是容器型的数据结构,且都是序列,所以容器中的元素都是按照索引位置有序存放的。所以,可以进行索引取值、切片等序列通用操作。

不同的是,元组是不可变序列,无法原处修改,意味着修改元组必须创建新的元组对象。实际上元组的概念来源于数学,在关系型数据库中用来表示一行数据对象,而行数据对象是固定不变的完整、稳定结构,python的元组也一样隐含的是完整性、稳定性。

不可变序列同样意味着可以使用hash()内置函数进行hash,也就是说它是hashable的。

hashable的类型是稳定的数据,可以放在一些需要稳定结构的地方,比如Set、dict的key,它们内部都是通过hash后的数据存放的。hashable意味着不同对象的hash值不同。比如类的实例对象全都是不同的,之所以不同是因为它们默认就是hashable的,不同对象的hash值不同。

元组的结构

元组可以看作是不可变的列表。它们的结构非常类似,都是在容器中存放元素的引用地址。

它的结构图如下:

这个结构图什么意思,这里不再赘述,如有需要,参考我对列表的介绍文章。

因为元组是不可变对象,所以修改元组数据会报错。也就是说,元组中的保存的引用地址是不可变的。

>>> T = (1111,2222,3333,4444)

>>> T[0] = 11111
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment

构造元组

直接使用括号包围元素即可,或者使用元组的构造函数tuple()将数据转换成元组。例如:

>>> (1,2,3,4)
(1, 2, 3, 4)

>>> tuple("abcdef")
('a', 'b', 'c', 'd', 'e', 'f')

>>> tuple([1,2,3,4])
(1, 2, 3, 4)

括号中可以加一个尾随逗号:

>>> 1
1

需要注意的是,python中很多地方隐式地自动构造元组。它的隐式构造规则是这样的:如果没有指定括号,又有多个值,那么就使用元组作为容器。

>>> 1,2
(1, 2)

再者,为了区分没有括号的元组和单个数据对象,可以在想要作为元组元素的数据后面加上逗号。例如:

>>> 1,     # 元组
(1,)
>>> (1,)   # 元组
(1,)

>>> 1      # 单个数据
1
>>> (1)    # 单个数据
1

元组中可以嵌套任意类型的数据对象:

>>> (1,2,(3,4))
(1, 2, (3, 4))

>>> (1,2,[3,4])
(1, 2, [3, 4])

操作元组

元组是不可变的序列。序列意味着它的元素是按索引位置有序的,序列的通用操作元组都可以使用,不可变序列意味着那些序列的修改行为都不能用,但是却可以使用hash()内置函数对元组进行hash。

关于序列有哪些通用操作,哪些是不可变序列具有的操作,哪些是可变序列具有的操作,详细内容参见:Python中的序列操作

这里简单介绍一点基本操作。

元组支持+ *符号操作:

>>> T = (1,2,3,4)
>>> T1 = ('a','b','c')

>>> T + T1
(1, 2, 3, 4, 'a', 'b', 'c')

>>> (1,2) + tuple("34")
(1, 2, '3', '4')

>>> T * 2
(1, 2, 3, 4, 1, 2, 3, 4)
>>> 2 * T
(1, 2, 3, 4, 1, 2, 3, 4)

可以通过+=的方式进行二元赋值:

>>> T1 = (1,2,3)
>>> T2 = (4,5,6)

>>> T1 += T2
>>> T1
(1, 2, 3, 4, 5, 6)

元组是序列,序列类型的每个元素都是按索引位置进行存放的,所以可以通过索引的方式取得元组中的各个元素,通过切片的方式取得子元组:

>>> T = (1,2,3,4,5)
>>> T[0]
1

>>> T[:3]
(1, 2, 3)
>>> T[:]
(1, 2, 3, 4, 5)
>>> T[2:-1]
(3, 4)

但不能赋值,因为元组是不可变对象。

>>> T = (1,2,3,4)
>>> T[0] = 11
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment

因为元组是不可变对象,所以可以使用hash()进行hash:

>>> hash(T)
-1883319094
>>> hash((1,2,3))
-378539185
>>> hash([1,2,3])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'

修改元组

因为元组是不可变对象,所以没有直接方法修改元组,只能通过其它手段根据原始元组间接地构造新元组。切片返回的元组也是一种修改方式。

另外,要修改元组,可以考虑将元组转换成可变的列表,修改之后再转换回元组。例如:

>>> t = ('a','b','c','d')
>>> tmp = list(t)
>>> tmp[2] = "cc"
>>> t = tuple(tmp)
>>> t
('a', 'b', 'cc', 'd')

或者,通过解析的方式构造新元组,但元组解析必须注意的是元组的括号特殊性,因为它会被当作表达式的包围括号,而不是元组的构造括号。所以,只能使用tuple()包围解析表达式。

>>> T = (1,2,3,4,5)
>>> tuple( i * 2 for i in T)
(2, 4, 6, 8, 10)

>>> ( i * 2 for i in T)  # 不是元组,而是表达式括号
<generator object <genexpr> at 0x03572150>

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注