python开发总结六——c程序员python之路

前言

学习使用python已经一年，自从看了python简明教程后就开始使用python编码，并且在两个项目中尝试使用了。在使用的过程中遇到问题就查资料，边学边写，并且把自己学到的东西总结下来，不知不觉已经有三十多页。虽然到目前为止还没有完整的看过一本全面python文档，但我认为这种方式可能更适合用来学习新的语言。之前发表过一些，这次各个部分均有更新，并且新增了python性能相关总结。

电子版下载： http://download.csdn.net/detail/chgaowei/4586505

两本不错的书：

《Python参考手册》：对Python各个标准模块，特性介绍的比较详细。

《Python核心编程》：介绍的比较深入，关键是，对Python很多高级特性都有介绍。

一个开源代码：openstack，关于云计算的，用Python写的，可以重点学习一下。

套接字编程：

1、函数的功能基本和c类似，唯一不同的地方在于当发生错误时，它不是通过返回值来告知的，而是通过触发异常，所以udp中的bind, recvfrom, sendto必须要进行捕捉异常。

2、套接字在垃圾收集的时候也会关闭。

3、获取网卡的IP：

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

return socket.inet_ntoa(fcntl.ioctl(s.fileno(), 0X8915, struct.pack('256s', ethname[:15]))[20:24])

4、 epool使用：

1） epoll.poll()函数的入参是等待时间，如果缺省，负值，None，则会阻塞住。非阻塞的做法是epoll.poll(0)

2）

5、

字符串的使用：

1、 Python的字符串是不可以改变的。但是你可以操作字符串以形成新的字符串。

2、字符串中删除一个字串。没有直接提供这个方法，但是replace可以实现：

"abcdef".replace(" ", "")

同样的功能还有一个方法：translate。它的原有作用是将字符串中的某个字符替换为另外一个字符，注意，不是字符串。它的第一个参数是一个转换表。第二个参数是要删除的字符串。我们可以利用第二个参数del，实现这个功能。同时，第一个参数设置为None。

translate可能更高效一点。另外，它的第二个参数可以使一个字符串，含有多个字符，这样就会删除多个。

注意：translate方法不会对这个字符串操作，而是返回一个新的字符串。

txt = txt.translate(None, ' \r\n\t;')

3、 strip方法：去除字符串两侧的空格，返回新的字符串。这个功能非常有用。

4、 str中有一个函数，format，非常强大，有时间一定要看一下。

5、 endswitch：检查字符串是否已某字符串结尾。startswith：检查是否已某字符串开头。

6、 partition：它将字符串按指定的字符串分为三个部分，返回一个元组。第一个是指定字符串前面内容，第二个是指定字符串，第三个是指定字符串后面的内容。用于字符串解析非常好用。

7、 split：将字符串按照某指定字符串分割成多个子字符串，返回一个分割后的列表。

8、 join：将一个字符串列表中的各个字符串连接起来，中间插入指定的字符串。

9、 find的返回值不是false和true，所以不可以直接用于if判断。需要判断if s.find(‘’) >= 0:

10、基于字典的格式化：

a) sh = '''

b) python -mcompileall -fl ../src;

c) python -mcompileall -fl ../src/micbase;

d) mkdir%(packname)s;

e) mdkir%(packname)s;

f) ''' % {'packname':sys.argv[1], }

g) print(sh)

11、字符串的解析：如果出现错误：UnicodeEncodeError:”ascii” codec cannt encode charactersin position 36-39: ordinal not in range(128).

问题的原因是系统默认的编解码库不支持Unicode，所以，需要设置编解码库。

方法：

reload(sys) #必须要重新加载才可以。

sys.setdefaultencoding(‘gb2312’)

内建函数：

string.capitalize()	把字符串的第一个字符大写
string.center(width)	返回一个原字符串居中,并使用空格填充至长度 width 的新串
string.count(str, beg=0, end=len(string))	返回 str 在 string 里面出现的次数，如果 beg 或者 end 指返回指定范围内 str 出现的次数
string.decode(encoding='UTF-8', errors='strict')	以 encoding 指定的编码格式解码 string，如果出错默认报ValueError 的异常，除非 errors 指定的是'ignore'或'replace'
string.encode(encoding='UTF-8', errors='strict')	以 encoding 指定的编码格式编码 string，如果出错默认报ValueError的异常，除非errors指定的是'ignore'或者'repl
string.endswith(obj, beg=0, end=len(string))	检查字符串是否以 obj 结束，如果 beg 或者 end 指定则检定的范围内是否以 obj 结束，如果是，返回True,否则返回Fa
string.expandtabs(tabsize=8)	把字符串 string 中的 tab 符号转为空格，默认格数 tabsize 是 8.
string.find(str, beg=0, end=len(string))	检测 str 是否包含在 string 中，如果 beg 和 end 指定范则检查是否包含在指定范围内，如果是返回开始的索引值，返回-1
string.index(str, beg=0, end=len(string))	跟find()方法一样，只不过如果str不在string中会报一个异
string.isalnum()	a, b, c R如果string至少有一个字符并且所有字符都是字母或数字回 True,否则返回 False
string.isalpha()	a, b, c 如果string至少有一个字符并且所有字符都是字母则返回T否则返回 False
string.isdecimal()	b, c, d 如果 string 只包含十进制数字则返回 True 否则返回 False.
string.isdigit()	b, c 如果 string 只包含数字则返回 True 否则返回 False.
string.islower()	b, c 如果 string 中包含至少一个区分大小写的字符，并且所有这些(大小写的)字符都是小写，则返回 True，否则返回 False
string.isnumeric()	b, c, d 如果 string 中只包含数字字符，则返回 True，否则返回 False
string.isspace()	b, c 如果 string 中只包含空格，则返回 True，否则返回 False.
string.istitle()	b, c 如果 string 是标题化的(见 title())则返回 True，否则返回 False
string.isupper()	b, c 如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
string.join(seq)	Merges (concatenates)以 string 作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
string.ljust(width)	返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
string.lower()	转换 string 中所有大写字符为小写.
string.lstrip()	截掉 string 左边的空格
string.partition(str)	e 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把字符串 string 分成一个 3 元素的元组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string.
string.replace(str1, str2, num=string.count(str1))	把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.
string.rfind(str, beg=0,end=len(string))	类似于 find()函数，不过是从右边开始查找.
string.rindex( str, beg=0,end=len(string))	类似于 index()，不过是从右边开始.
string.rjust(width)	返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
string.rpartition(str)	e 类似于 partition()函数,不过是从右边开始查找.
string.rstrip()	删除 string 字符串末尾的空格.
string.split(str="", num=string.count(str))	以 str 为分隔符切片 string，如果 num有指定值，则仅分隔 num 个子字符串
string.splitlines(num=string.count('\n'))	b, c按照行分隔，返回一个包含各行作为元素的列表，如果 num 指定则仅切片 num 个行.
string.startswith(obj, beg=0,end=len(string))	b, e检查字符串是否是以 obj 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查.
string.strip([obj])	在 string 上执行 lstrip()和 rstrip()
string.swapcase()	翻转 string 中的大小写
string.title()	b, c 返回"标题化"的 string,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
string.translate(str, del="")	根据str给出的表(包含256个字符)转换string的字符,要过滤掉的字符放到 del 参数中
string.upper()	转换 string 中的小写字母为大写
string.zfill(width)	返回长度为 width 的字符串，原字符串 string 右对齐，前面填充0

正则表达式

1、为什么要学习正则：主要是为了处理字符串更加方便，特别是为后面进行代码生成做储备。

2、 match是匹配字符串的开头是否匹配，而search是查看字符串任意起始位置是否满足。

3、 sub可以对字符串中模式匹配的部分进行替换

4、 split：可以对字符串进行分割，这里是根据模式分割。

re.split('@|:|-','[email protected]:sdf-223:342-23-23-21')

将字符串根据模式'@|:|-'分割，

5、

函数的使用：

1、函数的作用域：函数中定义一个变量，如果和全局变量重名，则全局变量名称就会被覆盖，也就是，这里对这个变量的更改，不会更改全局变量。但是，如果直接使用的话，是会使用全局变量的。同时，如果想要修改全局变量，需要制定是全局变量：global a

2、 xrange用法和range一样，不过更为高效，因为他不会在内存中创建列表。所以，它只能用于循环。

3、如果函数没有return语句，则他的返回值为None。

4、关于函数的入参判断：如果如此为空，可能会发生异常。当异常发生后，可能会出现一种情况，一个事情做到了一半，就没有在进行下去，可能会造成内存泄露。这个问题如何解决？按照C的方式，每个入参都做判断是可以解决的，但是这样太麻烦了。而且看很多开源代码页没有这样来做。是不是有更好的方法？换一种思路，在调用之前确保不为空。在看看开源的代码是怎么做的。特别是openstack。

5、可变入参：*args, **kwargs表示可变入参。

def funtest(a,b, c):

print(a, b, c)

def fun2(*args,**kwargs):

funtest(*args, **kwargs)

fun2(1,2,3)

也可以这样定义：

fun2(a, *args, **kwargs)

如何从可变参数中解析出参数的值？

在fun2中添加打印：可以发现，其实args是一个元组，kwargs是一个字典。

分析：调用fun2(1,2,3)，会把a赋值给a，2赋值给元组args，{‘c’=3}赋值给kwargs.

args和kwargs的顺序不可颠倒。

args和kwargs可能同时都有值。这样，要获取指定的入参，首先根据看args中有没有，然后根据字符串看kwargs中是否存在。

如何建一个元组或者字典通过参数传递给一个函数？

def funtest(a,b, c):

print(a, b, c)

d = {'a':1, 'b':2,'c':3}

l = (1,2,3)

funtest(*l)

funtest(**d)

*和**在Python中可以实现这个功能。这样会很灵活的。

*和**也可以单独出现。但是，如果同时出现，*必须在**之前。

6、默认参数或者可选参数，参数顺序：调用时，可以指定默认参数中填充那个。

def funtest(a, b=1, c=2):

print(a, b, c)

funtest(1, c=5, b=6)

其实，即便定义为：def funtest(a, b, c)，也可以通过funtest(1, c=5, b=6)的形式调用。

7、参数组：*args, **kwargs就是参数组，通过元组和字典将产生携带进来。这个特性有助于更为动态的代码生成。

8、可变长度参数：

9、函数的参数中如果有一个是元组，可以这样：

def fun(a, (b,c)):

print(a, b, c)

fun(1, (1,2))

10、关于回调，可以使用闭包，生成器，以及对象的__call__属性。都可以封装状态。

11、函数的可变入参：定义：def dlog(msg, *args):

这样可以定义可变入参，后面根据msg以及args进行格式化。注意一点，args是元组的元组。

dlog(‘%s’, 1,2)

args是((1, 2), )。所以，在格式化的时候，要用：msg% args[0]

函数式编程：

1、 lambda使用的误区：

错误的代码：

for u in userList:

gcallinfo.userAdd(u)

curflet.addCompFun(lambda:gcallinfo.userLeave(u))

这里是想为每个用户增加一个处理函数。但是结果是所有的用户都是一个处理函数。原因是lambda它相当于是一个函数定义，而不是函数调用。即便是它出现在for循环中，它仍然是一个函数，而不是多个。

解决的方法是：

fun = lambda x:lambda :gcallinfo.userLeave(x)

for u in userList:

gcallinfo.userAdd(u)

curflet.addCompFun(fun(u))

使用两个lambda，第一个lambda返回的是一个函数。

当然也可以这样：

for u in userList:

gcallinfo.userAdd(u)

curflet.addCompFun((lambdax:lambda :gcallinfo.userLeave(x))(u))

但是我感觉这样的可读性不好。

2、

闭包的使用：

1、将组成函数的语句和语句的执行环境打包在一起形成的对象，成为闭包。

2、 2.7之前的闭包不支持关键字nonlocal。3.0之后才支持。所以2.7前的闭包不可以使用nonlocal。

3、这样他就不可以对执行环境中的变量进行更改。

字典的使用：

1、字典的删除：直接使用del dict[k]可能会引发异常；首先判断k是否存在则效率有些低；使用异常使程序结构看起来不好。一个好的方法是pop(k, default v)。这个删除一个k项，并且返回。如果不存在返回默认的v。如果不加默认值，则会引发异常。

2、直接使用字典下标获取字典的值可能会引发一场。使用get方法则不会，如果不存在会返回none。另外，还可以设置不存在的默认值。

3、通过字典格式化字符串：print “value is %(key)s” % kvdict

4、 items方法返回一个列表，列表中的元素是一个元组，第一个是key，第二个是value。比较好用的方法。

5、 iteritems:返回的是一个迭代器。如果想要迭代这个字典，iteritems会比items更高效一点。

6、 iterkeys则返回的是key的迭代器。keys返回的是key的list。

7、 values返回值的列表，itervalues返回的是vlaue的迭代器

8、 popitem会随机弹出（同时删除）一个项，则对于想要处理所有的元素，并且删除所有的元素是有帮助的。但是，如果没用元素的话，会抛出异常。

9、 viewitems，viewkeys，viewvalues：这三个函数返回的是一个view对象。这个类似于视图。分别表示（key, value）pair的列表，key的列表，value的列表。一个优点是，如果字典发生变化，view会同步发生变化。在迭代过程中，字典不允许改变，否则会报异常。而且，viewitems的顺序是不定的。

一个替代的方案是：

l = [1,2,3,4,5,6,7]

def yfun():

while True:

for i in l:

print(i)

yield

g = yfun()

列表在迭代的过程中，如果改变，是可以同步的。

10、字典的键值比较规则：如果是内置类型（int，str，tuple）,则是以他们的值作为键值；如果是自定义对象，则是以对象的地址作为键值。——这一点没有完全证实。——最新的发现：对象的比较，内置类型，是因为他们都重写了默认的object的__eq__等方法，所以可以比较内容。自定义对象，没有重写，所以，他们的比较可能会不一样。object默认的比较是什么？目前还不明确，后面再补充吧。可能就是地址（或者对象的唯一标识），而不是对象的内容。涉及到字典，它不是使用的单纯的比较，而是使用的__hash__，它返回的是一个hash值，字典就是根据这个hash只来散布对象的。

集合的使用：

1、集合内部使用hash算法。而有不是kv方式。某种情况下可能会方便。

2、集合很方便的合并：

c = a | b

取差：c =

3、

列表的使用：

1、列表的删除：不可以在遍历的过程中删除链表，这样会得到不可预知的后果。可以使用列表的过滤，来获得新的列表。

2、列表的过滤：

def filterFun(node):#这个函数做了两个事情哎。

node.cycleCount = node.cycleCount -1

return node.cycleCount < 0

timeoutList = filter(filterFun, timerList)

对timerList中的每个节点执行函数filterFun，根据filterFun返回的结果，为真的项组成一个新的列表。

3、 list的pop是删除的最后一个元素。pop参数的默认值是-1且pop的对象不可以为空列表。

4、 map: kvlist = map(lambda x:x.strip(), kvlist)。同时，map可以接受多个列表，这个时候，函数也会接受多个参数，分别表示列表的每一个元素:

kvlist = map(lambda x,y:x+y, [1,2,3], [4,5,6])

如果函数为None，则相当于函数zip：

zip([1,2,3],[4,5,6])

[(1,4),(2,5),(3,6)]

5、生成器表达式：l = [node for node in xrange(5) if node - 3 < 0]:这个的这个方法一定程度上可以替代过滤器和map。

生成器表达式定义：

[expr foriter_var in iterable if cond_expr]

l = [2 for x inxrange(5)]#结果是生成一个含有5个2的列表

一个特殊的用法，条件可以由多个：

[str(i) for i in xrange(8) if i != 5 if i != 4]

6、 print(reduce(lambda x,y: x*y, [2 for x in xrange(38)]))

上面的这个语句是计算2的38次方的值。它用到的是二元函数reduce。它第一次调用是将第一个和第二个元素做入参，后面用他们的结果做x，新的元素做y，最后返回值。

另外，在获取一个38个2的列表也可以使用：[2] * 38。这可能更可读一点。

7、 enumerate:对列表处理，返回的是列表的索引以及节点。

for index, node in enumerate(timerList):

if timerId == node.timerId and timerEvent ==node.timerEvent:

del timerList[index]

8、列表的分片：[1,2,3,4]，l[1:-1]表示从索引从1到倒数第一个，不包含倒数第一个。如果要从某位置到最后，则应该：[1:]

9、 l[i:j:k]:表示切片，从i到j，步长为k。

10、l[i:j]:表示从i到j，不包括索引j。

11、如何在列表的迭代过程中删除元素：

如果在迭代过程中删除，会遍历不完全：

l = [1,2,3,4,5,6]

for i in l:

print(i)

if i%2 ==0:

l.remove(i)

这是一个方案，是通过切片操作获取一个新的元素。

for x in a[:]:

    if x < 0: a.remove(x)

条件表达式

1、 if 1 :print('------------')：这种方式也是可以的。

2、 return 1 if False else 100：这样返回的是100

3、 (fun1 if 1 else fun)()：选择不同的调用函数。

4、

5、条件表达式类似于c语言的三元表达式：C?X:Y。

6、条件表达式的语法：X if C else y.如果C成立，这是X，否则是Y。注意：else必须有，否则编译不过；不可以是elif。

7、用法1-赋值：

x , y = 3, 4

min = xif x < y else y

print(min)

8、用法2-函数调用：

def fun():

print('fun')

def fun2():

print('fun2')

(fun if 0 else fun2)()

其实就是所有可以使用表达式的地方。

排序

1、 list自己提供了排序的函数：sort。

2、 sort的参数：

a) cmp是一个比较函数，输入两个元素，比较大小，返回值为-1，0，1.

b) key也是一个函数，入参为一个元素，返回这个元素的关键字。

c) reverse是一个标志位，表示升序还是降序。默认False是升序，True表示降序。

3、使用key和reverse的性能，优于cmp函数。时间是cmp函数的一半。

迭代的使用：

1、迭代比直接使用列表遍历效率根据高。比如字典的keys函数返回的列表，以及iterkeys返回的迭代器。

2、 reversed() 内建函数将返回一个反序访问的迭代器.参数必须为序列。

3、 enumerate：返回一个迭代器：有索引值。

4、 for eachLine in myFile 替换 for eachLine in myFile.readlines() :

5、注意：在迭代的过程中不可以更改序列，否则会引发问题，导致迭代出错。

6、可以自己定义一个类，可以迭代使用。不过需要定义方法：__iter__，next。

7、 filter(function, iterable)：可以对迭代使用过滤器。

生成器的使用：

1、 yield关键字可以阻塞住函数的执行，并且保存当前的执行环境，整个包被称为生成器。

2、生成器可以通过调用生成器函数来创建。生成器函数是指包含关键字yield的函数。

3、生成器可以通过.next()来执行。每调用一次，就执行代码，直到遇到yield关键字停止，并且返回yield关键字后面的表达式的值。

4、可以通过调用send()函数来发送消息到生成器中。a = yield l：表示将send的入参赋值给a。

5、 throw：允许客户端传入要抛出的任何异常。

6、和throw相同，只不过是要抛出一个特定的异常：GeneratorExit。

7、 send只接受一个参数，但是可以通过传递元组的方式传递多个参数。

8、类的方法也可以返回生成器，因为他本质上就是一个函数。

9、在生成器使用的时候，如何获取它自身的send和nex函数？通过send二次传入是有些风险的，非常可能造成交叉引用，无法垃圾回收造成内存泄露。

10、第一次，必须调用next来启动生成器。

11、

a) def fun():

b) print(1)

c) yield

d) print(2)

e) yield

g) g = fun()

h) cb = g.next

i) print('-----')

j) cb()

k) print('-----')

l) cb()

m) print('-----')

上面的输出：

n) -----

o) 1

p) -----

q) 2

r) -----

说明：调用第一个next函数后，才会进入函数执行，直到遇到yield为止。然后再调用下一个next的时候，执行到下一个yield。如果没有yield了，则触发一个异常。

12、

装饰器的使用：

1、装饰器本质上来说就是函数（或者是可调用对象），他们接受函数对象。装饰器仅仅用来装饰或者修饰函数的包装，返回一个修改后的函数对象，并将其赋值原来的标示符，并永久失去对原有函数的访问。

2、什么是带参数的装饰器？其实就是一个函数，这个函数可以返回一个装饰器，同时这个函数可以接受参数。

3、不带参数的装饰器要返回一个函数，这个函数就是用来替换原有的标示符的。

def decofun(fun):

def _mydeco(*args,**kwargs):

print('before fun!')

ret =fun(*args, **kwargs)

print('after fun', ret)

return ret

return _mydeco#新的函数，用于替换原有标示符

@decofun

def funtest():#funtest被替换为decofun

print('now in funtest!')

return 1

funtest()

4、装饰器是可以重叠的，那么他们的顺序怎么样：

a) @decofun2

b) @decofun

c) def funtest():

d) print('now in funtest!')

e) return 1

f) 原理是，funtest首先被decofun包装，然后再被decofun2包装。也就是，调用的时候，首先调用的是最上面的装饰器（也就是decofun2）的函数前面部分，然后再调用decofun的函数前面部分，之后再调用funtest。funtest返回后，首先调用的是decofun的函数后面部分，再调用decofun2后面部分。类似于一个栈的结构。

5、装饰器不要滥用。如果一个装饰器只用了一次，要考虑他存在的必要了。

6、携带参数的装饰器：

7、def decoarg(arg):

a) def decofun3(fun):

b) def _mydeco(*args, **kwargs):

c) print('decoargbefore fun!', arg)

d) ret = fun(*args, **kwargs)

e) print('decoargafter fun', ret)

f) return ret

g) return _mydeco

h) return decofun3

8、装饰器用到的一个最重要的技术，就是闭包。装饰器函数返回的其实就是一个闭包。

9、装饰器也可以修饰类的__方法：

class testc:

def __init__(self):

self.i= 1

@decoarg(1)

@decofun2

@decofun

def __call__(self):

print('i is %d' % self.i)

注意：装饰器修饰类方法是无法被子类继承的（或者说子类的方法是没有被修饰的）。因为他本质上就是一个函数。

10、装饰器也可以使对象，比如：

a) class obj:

b) def __init__(self,fun):

c) self.fun =fun

e) def __call__(self,*args, **kwargs):

f) print('decofun before fun!', args, kwargs)

g) ret = self.fun(*args,**kwargs)

h) print('decofunafter fun', ret)

i) return ret

j) @objdeco

k) def funtest(a, b=2):

l) print('funtest1a , b =', a, b)

a) 这种方法看起来复杂了，但是可能会在有时候会比较有用。

11、装饰器可以修饰类。这个时候装饰器接收的是一个类名，而返回的也是这个类名。它可以为这个类添加一些属性或者进行一些操作。

协程的使用：

1、协程（coroutine）是一个可以挂起，回复，并且有多个进入点的函数。

2、

XML的使用：

1、处理xml消息包比较好用的模块是xml.etree.ElementTree。

2、 Element执行xml的根节点。

3、 elem.find(path):查找根节点下面路径为path的子节点。

4、 elem.findall(path):同样的子节点可能有多个，这里会返回一个列表。

5、 elem.findtext(path):获取指定路径子节点的内容，这个我们会经常使用。

6、 elem.get(key);获取属性的值。

7、上面如果没用，则返回none

8、 elem.append:添加自节点。

9、 elem.tag：返回tag值，也就是name。

10、 elem.text:返回内容。

11、 elem.attrib:返回属性的字典。

12、 SubElement：生成一个节点，自动添加为父节点的子节点。

13、 tostring：转化为xml文本字符串。但是不包括xml头。如果编码方式为UTF-8或者GB2312,gb2312都会产生xml头；如果是utf-8,则不会产生xml头

14、 fromstring：从字符串转化为ElementTree对象。和XML同样的功能。

15、 elem.set();设置属性值

time的使用：

1、 time.sleep()函数函数具有c下sleep函数功能，单位为秒，但是可以接受浮点数。这样可以表示毫秒。

2、 ti = datetime.datetime.now()可以显示当前的时间，包括当前的微秒也可以显示出来。两个的差值可以表示时间的间隔：microsecondLong = timeLong.seconds *1000000 + timeLong.microseconds。差值的成员是seconds和microseconds

3、

OO的使用：

1、如果不想让成员变量或者方法被外部使用（也就是private特性），可以以__双下划线开通。

2、属性不但可以定义在init中，也可以定义在任意的方法中通过self定义。不过最好在init中定义。

3、 Python也可以实现抽象基类，也就是接口：

注意：不可以对私有属性和方法执行@abstractmethod。否则会失败。因为，私有的无法被重写，所以，无法生成被实例化。

4、 __str__属性可以将对象转换为字符串，也就是调用print(object)是会打印的字符串。

5、 __call__(魔法方法)可以将对象作为函数来调用。给它一个入参就可以。:

def __call__(self, protoVer):

return api.protoModules[protoVer].TimeTicks(

(time.time()-self.birthday)*100

)

它的作用：比较常用的是作为回调，因为他可以保存状态信息。它和闭包类似，可能比闭包的可读性要好一点。

6、对象实例是否可以删除？

7、 Python参考手册要好好看一下。

8、 python的static方法使用的是装饰器语法：@staticmethod.

9、对类的调用还有一个方法：CALSS.method(object)。

10、子类中，如果想调用父类的方法，可以通过：

parent.method(self).

不过还有更好的方法：

super(child, self).foo()//注意：这里是根据子类的类型获取父类的方法。它的好处是不用明显给出基类的类型。

11、 cls：类方法的第一个参数。通常表示类的类型，可以通过cls()来生成实例。

a) @classmethod

b) def spawn(cls, *args, **kwargs):

c) """Return a new :class:`Greenlet` object, scheduled tostart.

e) The arguments are passed to:meth:`Greenlet.__init__`.

f) """

g) g = cls(*args, **kwargs)

h) g.start()

i) return g

12、继承，如果子类定义了__init__函数，子类的init函数不会默认调用父类的init函数，需要手动调用：parent.__init__。这一点是和c++有区别的。如果子类没有定义__init__，则子类会调用父类的__init__。这里可以发现，其实，子类如果定义了init函数，是对父类的init的一个覆盖。

13、 super注意：！！！它只能用在新式的类定义中。什么是新式的？原来只是基类定义时继承object！！！。

14、继承如何继承方法：只要继承一个类，就会继承这个类所有的方法，包括__init__,__del__。但是如果子类重写某方法，就会覆盖父类的方法，不会再调用父类的方法了。如果想调用父类的方法，可以通过super的方式调用。

15、继承如何继承属性：只要不覆盖父类__init__方法，或者调用了父类的__init__方法，就会继承父类__init__属性的方法。继承后也可以更改这些属性。

16、父类如何防止被继承：方法或者属性以__开头，则可以防止被继承。

17、根据我的经验，其实可以以一种本质的方式理解Python的继承：Python的类就是一些方法的集合，继承一个类就是继承这个类的所有的方法。如果在子类中定义一个方法，其实是更改了这个类的符号。而属性，则可以在所有的方法中定义，只要调用了定义属性的方法，调用父类，则是继承父类的属性，调用子类定义属性的方法，则是定义子类的方法。

18、 property：

a) class c(object):

b) def __init__(self):

c) self._num = 1

d) @property

e) def num(self):

f) return self._num * 10

g) @num.setter

h) def num(self,v):

i) self._num = v

j) @num.deleter

k) def num(self):

l) pass

m) o = c()

n) print(o.num)

o) o.num = 20

p) print(o.num)

q) 这样的好处是，可以在操作属性时，不用显示为方法调用，更加可读。同时又可以统一入口。：注意，它也必须继承object才可以。

19、 OO中的垃圾回收：Python的垃圾回收使用的是符号引用计数。那么，如果在一个函数中申请一个对象，然后返回它的一个属性或者方法，这个时候对象的符号引用已经去掉，对象是否会释放？

a) class child(parent):

b) def __init__(self):

c) self.i = 8888

e) def foo(self):

f) print('-----------------------')

h) def __del__(self):

i) print('now in del child')

j) super(child, self).__del__()

第一种情况，返回的是属性

k) def refun():

l) o = child()

m) return o.i

n) I = refun()

o) 这个时候，对象o会马上释放。因为o.i其实就是一个对象的引用，和o没有关系

第二种情况，返回的是方法

a) def refun():

b) o = child()

c) return o.foo

d) foo = refun()

e) 这个时候，对象o要等到foo释放的时候再释放，因为foo中包含了o的引用（foo的入参self）

20、对于对象的属性，如果属性是可读写的，则第一步没有必要用@property修饰。可以直接使用。后面如果有需要，在进行修饰。这样既减少了工作，修改时，也不会对原有代码进行改动。

21、子类无法继承父类中以“__”开始的成员。

模块的使用：

1、如果不想将模块的某些函数和变量被别的模块使用，可以以单下划线开头。这样import *是没有的，但是使用importmode，然后mode._fun仍然可以调用。在class中是以双下划线开头的。

2、使用from。。。import导入的符号，应该是本地符号，更改的话，无法更改模块中的值。可以通过mode.name=来修改。

3、 __init__.py的作用：可以这样理解：包也是一个对象，这个py就是这个包的构造函数。导入这个包，就会自动的执行__init__.py。如果在这个py中导入其他符号，import 这个包并且加*也会导入这个符号。

4、 import *无法导入模块中以_开头的符号。但是，不用*是可以的。

5、 import的本质也是创建一个符号，指向一个对象的引用。这个符号和被import的模块的符号是没有关系的。和c的extern不一样。extern可以更改变量的值，但是，这在Python中是不可以的。

from srctest import itest, outitest,setitest

import srctest

# itest = 9#这个地方其实改变的是本模块中符号的引用，无法更改srctest中对应符号。

#srctest.itest = 9#这个可以更改srctest中的itest

setitest(9)#这个可以更改srctest中的itest，但是改变不了当前模块的itest，也就是，这种设置是无法同步的。

print(itest)#打印当前模块的itest

printitest()#打印srctest中的itest

Python的设计哲学：看似不方便的背后，其实有Python的设计哲学。便捷性很多时候都是模块性的大敌。在软件开发中，模块间的最短路径未必是最合理路径，而且往往是最不合理路径。它会破坏软件原有的交互原则。

Python这样设计的理由应该是，尽量将数据和对数据的操作放在一起。如果数据会扩散，那么，就将数据设计为只读的。这样有助于提高程序模块的内聚性（全局变量是内聚性的大敌），降低耦合性。降低程序的复杂性（数据只读，调试根据方便）。

srctest.itest是可以改变itest的值的，说明我们可以通过改变这个对象的属性来改变对象（模块也是对象）。

可能有一点小题大做。

6、两个模块不可以双向import。那万一两个模块都要互相调用对方怎么办？Python的设计哲学告诉你，这不是一个好的实践，所以这样不行。应该怎么弄？一个模块调用另外一个模块，如果被调用模块想调用调用模块的方法，通过回调的形式。这样可以保证，模块间的连接都是单向的。

7、模块间相互引用全局变量：如果采用：from mode import vlaue的格式，引用的全局变量将会是一个新的符号，如果这个被模块的变量重新复制，引用模块中的变量不会同步更新的。这个是用可以使用import mode 的格式，然后使用mode.value形式引用。当然，不推荐模块间相互引用全局变量。会增加模块间的耦合。可以使用函数代替。

日志的使用：

1、日志的标准模块logging基本可以满足我的工作。

2、设置log的初始化工作：

logging.basicConfig(

filename = "test.log",

format = "[%(asctime)s-%(levelname)s] %(message)s[%(filename)s,%(lineno)d]",

level = logging.INFO,

datefmt = "%F %T")

3、除此之外，一个比较强大的功能就是过滤功能：可以针对级别，文件，行号等等很多的东西进行过滤。

4、自己写了一个简单的日志模块。遇到一个问题，如何获得log的文件名和行号。

看了loging模块的实现，它用了sys模块：

def fun():

f =sys._getframe(0)

print(f.f_back)

co = f.f_code

print(co.co_filename,f.f_lineno, co.co_name)

def fun1():

fun()

fun1()

上面的代码，sys._getframe就是获取栈信息。参数0表示获取的当前函数的栈。1表示获取调用fun函数的地方。2表示调用fun1的地方。3的话会报错，没有足够的调用深度。

可以从f.f_code中获得文件名，行号，函数名。

f.f_back获取上一层的栈。

最后，这个函数可以获取上层函数的调用文件名和行号，函数：

def findCaler():

f =sys._getframe(2)

co = f.f_code

return co.co_filename,f.f_lineno, co.co_name

5、 ilog(traceback.format_exc())：这句代码有问题，如果，如果traceback.format_exc()返回的字符串中包含百分号，则会导致异常。

自省的使用：

1、 type()可以查看对象的类型。这就是自省。也就是可以看看自己是什么类型。这个功能在动态语言中非常有用。

2、 getattr函数：这是个非常有用的函数，它可以根据字符串，从模块，类，对象实例中获取属性和方法的应用并且调用。这个功能非常类似于c语言的函数指针，以及c++中的成员函数的指针。

1）从模块中获取函数和成员

import testfun

tf = getattr(testfun, 'test')

tstr = getattr(testfun, 'str')

2）从类中获取属性和方法

class test():

tst = 2

def __init__(self):

self.abc= 1

def method(self):

print('in test.method', self)

def __test(self):

print('in test')

tm = getattr(test, 'method’)#获取类方法method函数指针。因为没有实例，所以调用必须用下面的方法：

t =test()

tm(t)#申请一个实例，并且作为第一个参数传进去。

tm = getattr(test, '__test’)#这里会报错，也就是无法获取私有方法。

tabc = getattr(test, 'abc’)#这是错误的。无法获取。

ttst = getattr(test, 'tst’)#这是可以的。。

3）从对象实例中获取属性和方法

t =test()

tm = getattr(t, 'method')

tm()#可以这样调用，而不用传入t实例。

tabc = getattr(test, 'abc’)#可以获取实例的属性。

3、 callable：函数表示某个对象是否可以调用。它和getattr结合起来，可以获取一个对象中的所有的method列表：

methods = [methodfor method in dir[object] if callable(getattr(object, method))]

4、自省也叫放射。

5、 exec(‘print “test”‘)：可以执行字符串代码。这个特性有助于动态执行代码，可以用于机器学习，自动生成代码。

exec的参数可以使一个打开的文件对象，string，code object。

code object可以通过函数

类似的方法：execfile(filename[, globals[, locals]])。

6、可以更改类的方法，将它指向一个新的方法。如下：

a) class ctest():

b) def test(self):

c) print('c test test')

d) def testfun():

e) print('test fun !')

f) c = ctest()

g) c.test = testfun

h) c.test()

对象c的方法test被替换为新的方法：testfun。这个特性有助于根据动态的代码实现，但是往往会增加代码的透明性。

类似的，setattr也可以实现这样的功能。delattr可以删除属性。

setattr(c, 'test', testfun)

delattr(c, 'test')

c.test()#这里调用的其实就是ctest的test方法。也就是说，delattr会首先删除setattr设置的属性，如果在调用一次delattr，才会删除c的test方法。但是如果多调用几次setattr，也只要调用一次delattr即可删除。所以，要删除一个方法，最多调用两次delattr。

这个特性可以用于动态更改代码。也可用于补丁。

setattr无法对Python的c扩展模块进行操作。

7、如何判断一个变量是否存在：

‘v’ in dir()

‘v’ in locals()

配置文件读取的使用：

1、使用模块ConfigParser。实例如下：

conf = ConfigParser()

conf.read("snmp_agent.ini")

print(conf.get("main", "log_level"))

print(conf.getint("main", "ne_agent_port"))

print(conf.get("main", "ne_agent_qip"))

异常的使用：

1、尽量少用。它会使程序难以理解，而且还会发生不可预知的情况，比如异常的发生使程序的状态变为一个未知状态。

2、可以寻找替代方案。

3、程序非常重要，不可以停止，可以在主循环包装在异常处理中运行。

4、打印出异常的信息，供后面的定位：log.error(traceback.format_exc())

5、 raise在引发异常的时候，可以传递引发一场的额外数据。形式如下：

raise Exception,1

捕获方法：

except CallExit,e:

e就是那个额外数据1。（但是奇怪的是它的类型不是1）

6、如何捕获一个异常，进行处理，然后在把它抛出：

except :

for flet in fletList:

flet.throw()

info = sys.exc_info()

raise info[0], info[1], info[2]

7、如何使用异常才是Pythonic的做法？这个要看一下。

8、

9、 xcept (Exc1[, Exc2[, ... ExcN]])[, reason]: 可以处理多个异常

suite_for_exceptions_Exc1_to_ExcN

10、捕获所有异常

try:

except Exception, e:

# error occurred, log 'e', etc.

11、先捕获指定，再捕获所有

try:

except (KeyboardInterupt, SystemExit):

# user wants to quit

raise # reraise back to caller

except Exception:

# handle real errors

12、 KeyboardInterrupt 和 SystemExit 被从 Exception 里移出, 和 Exception 平级。

a) try:

b) :

c) except (KeyboardInterupt,SystemExit):

d) # user wants to quit

e) raise # reraise back to caller

f) except Exception:

g) # handle real errors

13、在 try 范围中没有异常被检测到时,执行 else 子句

a) try:

b) 3rd_party_module.function()

c) except:

d) log.write("*** caught exception inmodule\n")

e) else:

f) log.write("*** no exceptionscaught\n")

14、 finally 子句是无论异常是否发生,是否捕捉都会执行的一段代码.你可以将 finally 仅仅配合try一起使用,也可以和try-except(else也是可选的)一起使用.

15、 .try-finally语句 try 中是否有异常触发,finally 代码段都会被执行

a) try-except-else-finally:

b) with语句：

c) with context_expr [as var]:

d) with_suite

16、 raise [SomeException [, args [, traceback]]] 。args 可以使一个元组。如果是一个对象，则它会把它封装成一个元组。

try:

raise Exception, 1

except Exception, e:

print(e)

if e == 1://这是不可以的。e的类型是一个特殊的对象。正确的应该是:if e[0] == 1

print('\n222222222')

17、标准异常：

18、

19、

类型系统

1、类型也是对象。比如：inttype = int,然后，n = inttype(‘256’)，这样可以把字符串转化为int值。

2、另外，是否可以把字符串转化为关键字，或者对象？比如，一个变量，abc,是否可以通过’abc’来引用？

OS的使用

os中有很多可以直接利用的东西，比如，判断文件是否存在，删除文件等。这样可以不用再执行shell命令。

os.rremove(path):删除文件

os.system(‘ls’);执行shell命令

文件的使用

1、打开使用函数open，模式和linux c类似。有一个不同的地方时，可以选择，直接操作磁盘还是操作内存。

2、 readline可以读取一个文件的一行。

3、 readlines：返回每一个列的列表。对应writelines。

4、文件迭代器：

f = open(‘fliename’)

for line in f:

process(line)

f.close()

或者更简洁的：

forline in open(filename):

process(line)

5、文件迭代器的使用：

如果文件很大，readlines可能会占用过多的内存。所以，Python提出一种类似于惰性求值的惰性迭代。

有两种方案：fileinput和文件迭代器：

import fileinput

for line infileinput.input(filename)

process(line)

文件迭代器：

f =open(filename)

for line in f:

process(line)

6、如何判断文件是否存在：

import os

os.path.isfile('/home/keepshell')

os.path.exists('/home/keepshell')

7、如何判断目录是否存在：

import os

os.path.isdir('/home')

os.path.exists('/home')

8、遍历目录路径：os.listdir(‘/home’)，返回值是一个列表。

9、 basename:去掉目录名，返回文件名；dirname:去掉文件名，返回目录名。

数据库的使用

1、数据库中的字段使用的utf8格式编码，但是读取出来却是问号。这个问题的解决可以通过在查询的时候指定编码方式来解决，只要执行sql语句：Query_Execsql(pdb,"SET NAMES 'utf8'");

注意，这个需要在连接后马上进行。并且，在其他的操作中，会一直使用这种编码。除非再次更改。

2、 fetchone()：返回一条记录。fetchall()：返回所有的记录。

3、可以使用一个简单的方法获取所有的记录：

cur.execute(sql)

for tel, name, pwd in cur:

print tel, name, pwd

FTP的使用

Python的标准模块ftplib就可以支持FTP。

几个函数：

FTP(host='', user='', passwd='', acct='', timeout=_GLOBAL_DEFAULT_TIMEOUT)：如果参数中有user，则Connect();如果同时也有user，则login()。如果没用这些参数，后要自己调用connect和login。

connect(self, host='', port=0,timeout=-999):如果端口不是标准端口，则要手动调用connect。

pwd():获得当前的工作路径。

cwd(path):更改当前的工作路径。

dir(path,cb):显示目录中的内容。cb为文件的处理函数。会传递给retrlines。这个函数可以获取一个目录下的所有的内容。

retrlines(self, cmd, callback =None):下载文本文件。cmd的形式为“RETR FILENAME”，callback是一个函数，要处理文本文件的每一个行。这里一个问题，如果直接用file的write方法，则会丢失换行符。而又没有writeline函数。

retrbinary(self, cmd, callback,blocksize=8192, rest=None):下载二进制文件，cmd的形式为“RETR FILENAME”，callback是一个函数，要处理文本文件的每一个块。默认大小事8k，但是可以更改。

storlines(self, cmd, fp,callback=None):上传文本文件。cmd的形式为“STOR FILENAME”。fp是一个文件对象，必须有readline方法。callback：每传送一行，就会调用这个函数。

storbinary(self, cmd, fp,blocksize=8192, callback=None, rest=None): 上传二进制文件。cmd的形式为“STOR FILENAME”。fp是一个文件对象，必须有read(num_bytes)方法。默认大小事8k，但是可以更改。

quit():退出。

字节的使用

1、 ord：可以见字符转化为int类型的值。

2、 chr：ord的方向操作。可以见int类型值转换为字符。

处理二进制

1、由字符串转化为字节流：bytes = struct.pack('!2B2s2B2s2B2s', 3, 1, '11', 3, 1, '22', 3, 1,'22')

2、处理后的字节流也可以使用字符串处理函数。

3、

字符编码的使用

1、 encode是将Unicode转化为str，decode是将字符串转化为Unicode。所以，一个字符串要转化为另一种格式可以：

s = ‘中文’

s.decode(fromcodec).encode(tocodec)

也可以直接使用：s.encode(tocodec)。这个时候，相当于默认调用了decode，并且使用的是默认的编码方式。

2、直接对一个Unicode文本调用str()函数的时候可能会报错：ASCII不支持等等。原因是默认的编码方式ASCII，不支持多字节。可以通过更改默认的编码方式来解决：

reload(sys)

sys.setdefaultencoding('gb2312')

3、新的内建函数unicode()和unichar()可以看成Unicode版本的str()和chr().Unicode()函数可以把任何 Python 的数据类型转换成一个 Unicode 字符串

4、核心编程中的建议。核心编程这本书不错，要好好看看。

a) 程序中出现字符串时一定要加个前缀u.

b) 不要用 str()函数，用 unicode()代替.

c) 不要用过时的 string 模块 -- 如果传给它的是非 ASCII 字符，它会把一切搞砸。

d) 不到必须时不要在你的程序里面编解码 Unicod 字符.只在你要写入文件或数据库或者

e) 网络时，才调用encode()函数;相应地，只在你需要把数据读回来的时候才调用decode()

f) 函数.

5、 epoll.register函数中的event需要使用“|”来将多个事件并联起来。它应该是使用的其中的一位。

6、 epoll.poll函数返回套接字，事件。这个事件中可能含有多个事件，是以位的形式表示的。所以判断是否有某个事件，需要使用：event & select.EPOLLOUT。

7、

源码安全与发布

1、 Python代码如果直接发布，可能会暴露源码。

2、一个方法是利用c扩展Python，来代替核心模块。

3、另一个折中的方法就是对源码进行编译，生成pyc或者pyo文件。这些事字节码文件。可能会被反编译。所以，可能需要研究一下Python的pyo生成和加载方式，来生成更安全的Python字节码。网上说可以修改Python源码的opcode。没有研究过。

4、命令：python -m compileall。

5、也可以在Python中使用：

a) import compileall

c) compileall._dir('Lib/',force=True)

e) # Perform same compilation, excluding files in .svn directories.

f) import re

g) compileall._dir('Lib/',rx=re.compile('/[.]svn'), force=True)

6、程序发布：可以使用zip对所有的源文件进行打包。zip包中需要有一个入口文件：__main__.py，然后就可以使用Pythontest.zip来执行程序。

GC

1、 OO中的垃圾回收：Python的垃圾回收使用的是符号引用计数。那么，如果在一个函数中申请一个对象，然后返回它的一个属性或者方法，这个时候对象的符号引用已经去掉，对象是否会释放？

a) class child(parent):

b) def __init__(self):

c) self.i = 8888

e) def foo(self):

f) print('-----------------------')

h) def __del__(self):

i) print('now in del child')

j) super(child, self).__del__()

第一种情况，返回的是属性

k) def refun():

l) o = child()

m) return o.i

n) I = refun()

o) 这个时候，对象o会马上释放。因为o.i其实就是一个对象的引用，和o没有关系

第二种情况，返回的是方法

f) def refun():

g) o = child()

h) return o.foo

i) foo = refun()

j) 这个时候，对象o要等到foo释放的时候再释放，因为foo中包含了o的引用（foo的入参self）

2、如果两个对象交叉引用，是否会自动回收？不会。同样，如果一个对象把生成的对象赋值给它自身的一个属性，那么它也不会自动回收。

3、

c扩展

1、可以使用swig来创建c 的扩展程序，非常方便。目前没有时间研究内部机制，先暂时使用，后面在研究吧。

2、 swig使用步骤：为库的头文件建立.i文件：

#include"code.h"

#include"sip.h"

%include"code.h"

%include"sip.h"

3、使用swig命令生成py脚本及对应的C文件：swig –python sip.i。

4、将生成的c源文件放到c扩展库中进行编译。

5、这里有一个要注意：生成的动态链接库，必须是_sip.so，否则无法调用。swig是写死的。_sip.so需要拷贝到：/usr/local/lib/python2.7/site-packages/路径下。

6、 Makefile文件中，对于库引用的其他的库，必须显示的指出，否则Python无法找到对应的库。

7、如何在c的扩展库中调用Python的函数：

swig是不支持直接在c的扩展库中调用Python函数的。它只支持将C的接口作为回调函数设置给c的库。

实现这个功能需要利用Python的c API和ctypes来实现。

Python c 的api包含一系列的函数：

PyCallable_Check：检查对象是否可调用；

PyArg_ParseTuple：解析参数列表，将Python参数解析为c；

PyEval_CallObject：调用对象；

Py_BuildValue：将c变量打包为Python的参数对象。

好了，有这些就足够了。

假设c库中有一个设置回调函数接口：

void set_callback_fun(void(*fun)(int, int , int))

{

}

下面是c扩展库中要添加的代码：

//全局变量，保存Python中要回调的可调用对象。

static PyObject*gCallbackFun = NULL;

//调用上面函数设置的python脚本函数

//Python可调用对象的转换函数，转化为C的调用方式

static voidcallbacfun(int type,int chn,int dataType)

{

PyObject* pArgs = NULL;

PyObject* pRetVal = NULL;

int nRetVal = 0;

pArgs = Py_BuildValue("(i, i,i)", type, chn, dataType);//将c的参数转化为Python的参数对象

pRetVal = PyEval_CallObject(gCallbackFun,pArgs);//调用Python的可调用对象。

Py_DECREF(pArgs);

Py_DECREF(pRetVal);

}

/// set_callback_fun函数的包装函数

static PyObject*wrap_set_callback_fun(PyObject *dummy, PyObject *args)

{

PyObject *temp = NULL;

if (PyArg_ParseTuple(args, "O:set_callback_fun",&temp)) {//获取Python对象

if (!PyCallable_Check(temp)) {//检查对象是否可以调用

PyErr_SetString(PyExc_TypeError,"parameter must be callable");

}

Py_XINCREF(temp);

Py_XDECREF(gCallbackFun);

gCallbackFun = temp;

}

set_callback_fun(callbacfun);//注意，这里掉一下包，用一个C的函数注册到c库中。

return Py_BuildValue("i",(gCallbackFun == NULL) ? 0 : 1);

}

注意：如果对象不可调用，会段错误。后面要解决一下。

Python代码：

CBFUNC =CFUNCTYPE(c_int, c_int, c_int, c_int)//创建一个c函数类型的对象工厂，该函数返回值为int，有三个入参，都为int。

callbakFunc = CBFUNC(pyFun)//根据Python可调用对象生成函数。

set_callback_fun(callbakFunc)//设置回调函数

注意：pyFun必须要有返回值。否则会报异常。

另外，我发现，不用CFUNCTYPE来生产c回调函数，直接用pyFun，也是可以的。至于区别，后面在研究一下吧，要写代码了。

几个异常问题：1、一个可以使用CFUNCTYPE，但是一个一使用它就段错误。2、回调函数可以不返回值，也是可以的。但是一个不返回就不可以。

在Python中使用c扩展时向C传递数组：

8、如果一个函数的参数是一个数组（指针），Python如何传递？下面的方法是可以直接传递列表。把这个加到.i文件中。

static intconvert_darray(PyObject *input, int *ptr, int size) {

int i;

if (!PySequence_Check(input)) {

PyErr_SetString(PyExc_TypeError,"Expecting a sequence");

return 0;

}

if (PyObject_Length(input) != size) {

PyErr_SetString(PyExc_ValueError,"Sequence size mismatch");

return 0;

}

for (i =0; i < size; i++) {

PyObject *o =PySequence_GetItem(input,i);

if (!PyFloat_Check(o)) {

Py_XDECREF(o);

PyErr_SetString(PyExc_ValueError,"Expecting a sequence offloats");

return 0;

}

ptr[i] = PyFloat_AsDouble(o);

Py_DECREF(o);

}

return 1;

}

%typemap(in) int[ANY](int temp[$1_dim0]) {

if (!convert_darray($input,temp,$1_dim0)) {

return NULL;

}

$1 = &temp[0];

}

9、如果一个结构体中有一个int类型数组，应该如何赋值？

在.i中增加下面代码：

%include"carrays.i"

%array_class(int,intArray);

在Python中申请数组：

a = intArray(10)，将A复制给数组成员即可。

代码错误检查

1、今天遇到两个问题：

a) 类中方法：class_registerEvent(notifyEvent): def _sendRegRsp(self, voiceres, reqId, result,reason,status):，调用时参数个数少一个：self._sendRegRsp(voiceres,reqId, 'success', 'normal') 。结果是没有任何提示，并且，不知道调用了什么函数。这个问题有点匪夷所思。后面好好查看一下。

b) 抽取函数后，有时忘了返回值，当时却用到了返回值：

i. def createWirelessSdp(voiceRtpPort, voiceTbcpPort):

ii. voicesdp = SIP_SDP()

iii. voicesdp.a_use = 1

iv. sdp = createWirelessSdp(1000,2000)

v. 结果也是没有任何提示，sdp为None。

2、总结：写Python代码，需要使用代码检查工具，比如，pylint等。后面引进一下。

程序运行

1、如何获取命令行参数：

a) import sys

c) print(sys.argv[1])

d) sys.argv[1]就是第一个参数。0是脚本的名称。

代码调试

1、自己摸索的一个方法：

1、gdbpython

2、run

3、importtest.py

这里注意一下，这个脚本是主流程脚本。没有if __name__ == "__main__".

关于性能

1、 timeit：可以统计程序的运行时间。目前没有时间，抽时间好好看看。

timeit(cut1,number=10000)：cut1是函数名，number是执行次数。

2、 pypy可以将Python代码翻译为可执行程序，它的效率可以提高4倍左右。但是，内存的占用可能会很大。（没有试过。）

3、使用字典代替列表：字典内部使用哈希，比列表的迭代更快。

4、使用set集合代替列表：set内部也使用哈希，而且set的求差集交集也非常快。

5、字符串优化：

a) join比+要快。

b) 当对字符串可以使用正则表达式或者内置函数来处理的时候，选择内置函数。如str.isalpha()，str.isdigit()，str.startswith((‘x’, ‘yz’))，str.endswith((‘x’, ‘yz’))

c) 对字符串格式化比直接串联格式化要快。

6、列表解析比使用循环构造一个列表根据高效。

7、生成器表达式则是在2.4中引入的新内容，语法和列表解析类似，但是在大数据量处理时，生成器表达式的优势较为明显，它并不创建一个列表，只是返回一个生成器，因此效率较高。它的语法是：（a for a in xrang(100) if a != 1）

8、如果需要交换两个变量的值使用a,b=b,a而不是借助中间变量t=a;a=b;b=t；

9、使用xrange而不是range。

10、避免使用global关键字，访问全局变量要比访问局部变量慢很多。

11、 if done is not None比语句if done!=None更快。if done is noe 比 if done == None更快。

12、在耗时较多的循环中，可以把函数的调用改为内联的方式；

13、使用级联比较 “x < y < z”而不是“x < y and y < z”；

14、 while 1要比while True更快（当然后者的可读性更好）；

15、 build in函数通常较快，add(a,b)要优于a+b。

16、 Python内置了丰富的性能分析工具，如profile,cProfile与hotshot。

17、 Python的性能优化工具：Psyco，Pypy，Cython，Pyrex。

18、 from a import b 引用b比a.b引用b要快。

优化的原则是，首先找到整个系统的瓶颈（源于80/20原则）。然后使用优化工具进行优化。有两个比较看好，分别是Cython（可以用来写Python的c扩展）和pypy（一个新的解释器）。

pypy目前不支持cpython的c扩展。如果使用纯Python是可以使用pypy的。但是如果使用了c扩展，则可能要使用cython来优化。

切忌：不要提前优化，这是万恶之源。

如果知道了上面这几条是“为什么”，那我对Python的认识就又提高一个层次了。下一阶段的目标。

其他：

1、脚本语言的进程名称显示为：python ，如果一个服务器上有多个进程，那么将不易发现那个进程是哪个程序。可以使用第三方开源的库来解决这个问题：setproctitle.

from setproctitle import setproctitle,getproctitle

print('当前的进程名：%s' % getproctitle())

setproctitle('proctitle')

print('设置后的的进程名：%s' % getproctitle())

2、 with语法：with open(‘file’, ‘r’)as f:

code

可以是try的另一种形式。

可以执行with操作的类型：

file

decimal.Context

thread.LockType

threading.Lock

threading.RLock

threading.Condition

threading.Semaphore

threading.BoundedSemaphore

3、产生随机数：random.randint(100000, 999999)。choice会返回序列的一个随机元素。

4、回调函数的使用：设置回调函数的时候，很多时候要使用闭包。避免闭包的一个方法是：

a) def setCancelFun(cancelFun, *args, **kwargs):

b) '''如果为None表示删除取消函数, 后面跟的是cancel函数的参数。这样可以避免上面创建闭包。'''

c) global _cancelFun,_cancelArgs,_cancelKwargs

d) _cancelFun = cancelFun

e) _cancelArgs = args

f) _cancelKwargs = kwargs

h) def __execCancelFun():

i) '执行取消操作。因为在throw和kill的时候会执行此函数，所以，暂时没有看到会在外面调用此函数。屏蔽后，接口的简单性会提高'

j) global _cancelFun,_cancelArgs,_cancelKwargs

k) if callable(_cancelFun):

l) _cancelFun(*_cancelArgs,**_cancelKwargs)

m) _cancelFun = None#防止重复调用

o) def test(a,b, c):

p) print('--------test:', a,b,c)

r) setCancelFun(test, 1, 2, 3)

s) __execCancelFun()

也就是增加可变参数。

Python：一切皆符号？

python开发总结六——c程序员python之路

前言

套接字编程：

字符串的使用：

正则表达式

函数的使用：

函数式编程：

闭包的使用：

字典的使用：

集合的使用：

列表的使用：

条件表达式

排序

迭代的使用：

生成器的使用：

装饰器的使用：

协程的使用：

XML的使用：

time的使用：

OO的使用：

模块的使用：

日志的使用：

自省的使用：

配置文件读取的使用：

异常的使用：

类型系统

OS的使用

文件的使用

数据库的使用

FTP的使用

字节的使用

处理二进制

字符编码的使用

源码安全与发布

GC

c扩展

代码错误检查

程序运行

代码调试

关于性能

其他：

继续阅读