天天看点

简明Python教程学习笔记_4_数据结构列表列表综合元组在函数中接收元组和列表字典序列参考更多字符串的内容

在python中有三种内建的数据结构——列表、元组和字典。

<code>list</code>是处理一组有序项目的数据结构,即你可以在一个列表中存储一个 序列 的项目。假想你有一个购物列表,上面记载着你要买的东西,你就容易理解列表了。只不过在你的购物表上,可能每样东西都独自占有一行,而在python中,你在每个项目之间用逗号分割。

列表中的项目应该包括在方括号中,这样python就知道你是在指明一个列表。一旦你创建了一个列表,你可以添加、删除或是搜索列表中的项目。由于你可以增加或删除项目,我们说列表是可变的 数据类型,即这种类型是可以被改变的。

对象与类的快速入门

列表是使用对象和类的一个例子。当你使用变量<code>i</code>并给它赋值的时候,比如赋整数<code>5</code>,你可以认为你创建了一个类(类型)<code>int</code>的对象(实例)<code>i</code>。事实上,你可以看一下<code>help(int)</code>以更好地理解这一点。

类也有方法,即仅仅为类而定义地函数。仅仅在你有一个该类的对象的时候,你才可以使用这些功能。例如,python为<code>list</code>类提供了<code>append</code>方法,这个方法让你在列表尾添加一个项目。例如<code>mylist.append('an item')</code>列表<code>mylist</code>中增加那个字符串。注意,使用点号来使用对象的方法。

一个类也有域,它是仅仅为类而定义的变量。仅仅在你有一个该类的对象的时候,你才可以使用这些变量/名称。类也通过点号使用,例如<code>mylist.field</code>。

使用列表

变量<code>shoplist</code>是某人的购物列表。在<code>shoplist</code>中,我们只存储购买的东西的名字字符串,但是记住,你可以在列表中添加任何种类的对象 包括数甚至其他列表。

注意,我们在<code>print</code>语句的结尾使用了一个 逗号 来消除每个<code>print</code>语句自动打印的换行符。这样做有点难看,不过确实简单有效。

接下来,我们使用<code>append</code>方法在列表中添加了一个项目,就如前面已经讨论过的一样。然后我们通过打印列表的内容来检验这个项目是否确实被添加进列表了。打印列表只需简单地把列表传递给<code>print</code>语句,我们可以得到一个整洁的输出。

再接下来,我们使用列表的<code>sort</code>方法来对列表排序。需要理解的是,这个方法影响列表本身,而不是返回一个修改后的列表——这与字符串工作的方法不同。这就是我们所说的列表是可变的 而字符串是不可变的 。

最后,但我们完成了在市场购买一样东西的时候,我们想要把它从列表中删除。我们使用<code>del</code>语句来完成这个工作。这里,我们指出我们想要删除列表中的哪个项目,而<code>del</code>语句为我们从列表中删除它。我们指明我们想要删除列表中的第一个元素,因此我们使用<code>del shoplist[0]</code>(记住,python从0开始计数)。

如果你想要知道列表对象定义的所有方法,可以通过<code>help(list)</code>获得完整的知识。

通过列表综合,可以从一个已有的列表导出一个新的列表。例如,你有一个数的列表,而你想要得到一个对应的列表,使其中所有大于2的数都是原来的2倍。对于这种应用,列表综合是最理想的方法。

这里我们为满足条件(<code>if i &gt; 2</code>)的数指定了一个操作(<code>2*i</code>),从而导出一个新的列表。注意原来的列表并没有发生变化。在很多时候,我们都是使用循环来处理列表中的每一个元素,而使用列表综合可以用一种更加精确、简洁、清楚的方法完成相同的工作。

元组和列表十分类似,只不过元组和字符串一样是 不可变的 即你不能修改元组。元组通过圆括号中用逗号分割的项目定义。元组通常用在使语句或用户定义的函数能够安全地采用一组值的时候,即被使用的元组的值不会改变。

使用元组

变量zoo是一个元组,我们看到len函数可以用来获取元组的长度。这也表明元组也是一个序列。

由于老动物园关闭了,我们把动物转移到新动物园。因此,new_zoo元组包含了一些已经在那里的动物和从老动物园带过来的动物。回到话题,注意元组之内的元组不会失去它的身份。

我们可以通过一对方括号来指明某个项目的位置从而来访问元组中的项目,就像我们对列表的用法一样。这被称作 索引 运算符。我们使用new_zoo[2]来访问new_zoo中的第三个项目。我们使用new_zoo[2][2]来访问new_zoo元组的第三个项目的第三个项目。

含有0个或1个项目的元组。

一个空的元组由一对空的圆括号组成,如myempty = ()。然而,含有单个元素的元组就不那么简单了。你必须在第一个(唯一一个)项目后跟一个逗号,这样python才能区分元组和表达式中一个带圆括号的对象。即如果你想要的是一个包含项目2的元组的时候,你应该指明singleton = (2 , )。

给perl程序员的注释

列表之中的列表不会失去它的身份,即列表不会像perl中那样被打散。同样元组中的元组,或列表中的元组,或元组中的列表等等都是如此。只要是python,它们就只是使用另一个对象存储的对象。

元组与打印语句

元组最通常的用法是用在打印语句中,下面是一个例子:

<code>print</code>语句可以使用跟着<code>%</code>符号的项目元组的字符串。这些字符串具备定制的功能。定制让输出满足某种特定的格式。定制可以是<code>%s</code>表示字符串或<code>%d</code>表示整数。元组必须按照相同的顺序来对应这些定制。

观察我们使用的第一个元组,我们首先使用<code>%s</code>,这对应变量<code>name</code>,它是元组中的第一个项目。而第二个定制是<code>%d</code>,它对应元组的第二个项目<code>age</code>。

python在这里所做的是把元组中的每个项目转换成字符串并且用字符串的值替换定制的位置。因此<code>%s</code>被替换为变量<code>name</code>的值,依此类推。

<code>print</code>的这个用法使得编写输出变得极其简单,它避免了许多字符串操作。它也避免了我们一直以来使用的逗号。

在大多数时候,你可以只使用<code>%s</code>定制,而让python来提你处理剩余的事情。这种方法对数同样奏效。然而,你可能希望使用正确的定制,从而可以避免多一层的检验程序是否正确。

在第二个<code>print</code>语句中,我们使用了一个定制,后面跟着<code>%</code>符号后的单个项目——没有圆括号。这只在字符串中只有一个定制的时候有效。

当要使函数接收元组或字典形式的参数的时候,有一种特殊的方法,它分别使用<code>*</code>和<code>**</code>前缀。这种方法在函数需要获取可变数量的参数的时候特别有用。

由于在<code>args</code>变量前有<code>*</code>前缀,所有多余的函数参数都会作为一个元组存储在<code>args</code>中。如果使用的是<code>**</code>前缀,多余的参数则会被认为是一个字典的键/值对。

字典类似于你通过联系人名字查找地址和联系人详细情况的地址簿,即,我们把键(名字)和值(详细情况)联系在一起。注意,键必须是唯一的,就像如果有两个人恰巧同名的话,你无法找到正确的信息。

注意,你只能使用不可变的对象(比如字符串)来作为字典的键,但是你可以使用不可变或可变的对象作为字典的值。基本说来就是,你应该只使用简单的对象作为键。

键值对在字典中以这样的方式标记:<code>d = {key1 : value1, key2 : value2 }</code>。注意它们的键/值对用冒号分割,而各个对用逗号分割,所有这些都包括在花括号中。

记住字典中的键/值对是没有顺序的。如果你想要一个特定的顺序,那么你应该在使用前自己对它们排序。

字典是<code>dict</code>类的实例/对象。

我们使用已经介绍过的标记创建了字典<code>ab</code>。然后我们使用在列表和元组章节中已经讨论过的索引操作符来指定键,从而使用键/值对。我们可以看到字典的语法同样十分简单。

我们可以使用索引操作符来寻址一个键并为它赋值,这样就增加了一个新的键/值对,就像在上面的例子中我们对guido所做的一样。

我们可以使用我们的老朋友——<code>del</code>语句来删除键/值对。我们只需要指明字典和用索引操作符指明要删除的键,然后把它们传递给<code>del</code>语句就可以了。执行这个操作的时候,我们无需知道那个键所对应的值。

接下来,我们使用字典的<code>items</code>方法,来使用字典中的每个键/值对。这会返回一个元组的列表,其中每个元组都包含一对项目——键与对应的值。我们抓取这个对,然后分别赋给<code>for..in</code>循环中的变量<code>name</code>和<code>address</code>然后在for-块中打印这些值。

我们可以使用<code>in</code>操作符来检验一个键/值对是否存在,或者使用<code>dict</code>类的<code>has_key</code>方法。你可以使用<code>help(dict)</code>来查看<code>dict</code>类的完整方法列表。

关键字参数与字典。如果换一个角度看待你在函数中使用的关键字参数的话,你已经使用了字典了!只需想一下——你在函数定义的参数列表中使用的键/值对。当你在函数中使用变量的时候,它只不过是使用一个字典的键(这在编译器设计的术语中被称作符号表 )。

列表、元组和字符串都是序列,但是序列是什么,它们为什么如此特别呢?序列的两个主要特点是索引操作符和切片操作符。索引操作符让我们可以从序列中抓取一个特定项目。切片操作符让我们能够获取序列的一个切片,即一部分序列。

使用序列

首先,我们来学习如何使用索引来取得序列中的单个项目。这也被称作是下标操作。每当你用方括号中的一个数来指定一个序列的时候,python会为你抓取序列中对应位置的项目。记住,python从0开始计数。因此,<code>shoplist[0]</code>抓取第一个项目,<code>shoplist[3]</code>抓取<code>shoplist</code>序列中的第四个元素。

索引同样可以是负数,在那样的情况下,位置是从序列尾开始计算的。因此,<code>shoplist[-1]</code>表示序列的最后一个元素而<code>shoplist[-2]</code>抓取序列的倒数第二个项目。

切片操作符是序列名后跟一个方括号,方括号中有一对可选的数字,并用冒号分割。注意这与你使用的索引操作符十分相似。记住数是可选的,而冒号是必须的。

切片操作符中的第一个数(冒号之前)表示切片开始的位置,第二个数(冒号之后)表示切片到哪里结束。如果不指定第一个数,python就从序列首开始。如果没有指定第二个数,则python会停止在序列尾。注意,返回的序列从开始位置开始 ,刚好在结束 位置之前结束。即开始位置是包含在序列切片中的,而结束位置被排斥在切片外。

这样,<code>shoplist[1:3]</code>返回从位置1开始,包括位置2,但是停止在位置3的一个序列切片,因此返回一个含有两个项目的切片。类似地,<code>shoplist[:]</code>返回整个序列的拷贝。

你可以用负数做切片。负数用在从序列尾开始计算的位置。例如,<code>shoplist[:-1]</code>会返回除了最后一个项目外包含所有项目的序列切片。

使用python解释器交互地尝试不同切片指定组合,即在提示符下你能够马上看到结果。序列的神奇之处在于你可以用相同的方法访问元组、列表和字符串。

当你创建一个对象并给它赋一个变量的时候,这个变量仅仅 参考 那个对象,而不是表示这个对象本身!也就是说,变量名指向你计算机中存储那个对象的内存。这被称作名称到对象的绑定。

一般说来,你不需要担心这个,只是在参考上有些细微的效果需要你注意。这会通过下面这个例子加以说明。

大多数解释已经在程序的注释中了。你需要记住的只是如果你想要复制一个列表或者类似的序列或者其他复杂的对象(不是如整数那样的简单 对象 ),那么你必须使用切片操作符来取得拷贝。如果你只是想要使用另一个变量名,两个名称都参考 同一个对象,那么如果你不小心的话,可能会引来各种麻烦。

记住列表的赋值语句不创建拷贝。你得使用切片操作符来建立序列的拷贝。  

我们已经在前面详细讨论了字符串。我们还需要知道什么呢?那么,你是否知道字符串也是对象,同样具有方法。这些方法可以完成包括检验一部分字符串和去除空格在内的各种工作。

你在程序中使用的字符串都是<code>str</code>类的对象。这个类的一些有用的方法会在下面这个例子中说明。如果要了解这些方法的完整列表,请参见<code>help(str)</code>。

这里,我们看到使用了许多字符串方法。<code>startwith</code>方法是用来测试字符串是否以给定字符串开始。<code>in</code>操作符用来检验一个给定字符串是否为另一个字符串的一部分。

<code>find</code>方法用来找出给定字符串在另一个字符串中的位置,或者返回-1以表示找不到子字符串。<code>str</code>类也有以一个作为分隔符的字符串<code>join</code>序列的项目的整洁的方法,它返回一个生成的大字符串。