这些常见的python编码习惯，你都会吗

2024-01-09 10:20 由华为云开发者联盟发表于 #后端开发

简介

语言在发展和变化，编码习惯也在发生改变。这里简单聊聊 17个python中常见的编码习惯或者风格。

1,可变数据结构：注意在函数变量不要使用它

def foo(x=[]):
    x.append(1)
    print(x)
            
>>>foo()
[1]

>>>foo()
[1,1]

>>>foo()

[1,1,1]

def foo(p=None):
    if p is None:
        p = []
    p.append(1)
    print(p)
            
foo()
[1]
foo([2,3,4])
[2,3,4,1]

1.1模块的循环导入

我们定义一个老王模块，再定义一个小李模块，相互导入时，将报错

# laowang.py
import xiaoli
count =4
def main():
    wilma.pr('Hello')
if __name__ == '__main__':
    main()
            
# xiaoli.py
import laowang
def pr(str):
    print(str*fired.count)
if __name__== '__main__':
    pr("Ok")

导入问题，如果在使用其他语言比如 shell 脚本引用 python代码时，需要将python项目加入 linux环境变量。 <=python2.7

export PYTON_PATH=$PYTHON_PATH:/xxx/xxx/XXXProject

或者编辑 python虚拟环境，添加 setup.py, 然后执行 python install -e .

1.2 基础规则

该次执行不缓存sys.stdout,直接输出控制台

@参数 -u unbuffered

执行时带参数m，以Script方式执行py模块

@参数 -m

跳过py模块第一行，允许使用非unix形式

@参数 -x

实体具体选项(set implementation-specific option)

@参数 -X

程序读取文件内容并执行

file

程序从stdin 读取

@参数 -

python3 --help # 显示所有参数

2, 内存管理

python 内存回收基于引用计数和分级回收。

2.1 小的整数和短小字符，python将缓存以便重复使用

并且is关键字，用于判断两个引用所指对象是否相同

    >>> a = 'gd'
>>> b = 'gd'
>>> a is b
True

== 只判断值是否相同

    a2 = []
b2 = []
>>> a2 is b2
False
>>> b2 == a2
True

2.2 对象引用时python基本构成方式

赋值的本质 a=1，实际上时修改globals()字典的值，局部变量值的修改locals()的访问和修改

>>> a1
    very good man
>>> globals()['a1'] = 'bad good mm'
>>> globals()

2.3 引用对象reference count

sys.getrefcount() 查看对象的引用计数，sys.getrefcount()在查看某个引用时将创建一个临时引用，所以引用计数将多1

    >>> c=[1,2,3]

getrefcount© #这里c只有一次引用，但是计数时2，因为当前查询有一次临时引用

引用计数的减少和增加

   >>> d=c

getrefcount© # 增加引用d，计数3

del d #删除引用d，c的引用计数又重新为2

2.4 垃圾回收机制 garbage collection

垃圾回收时py 独占进行的，大大降低py效率，特定条件下自动启动垃圾回收。

手工回收 gc.collect()

py 运行时分配对象obj allocation 和取消分配对象 deallocation次数被记录，高于垃圾回收阈值，启动垃圾回收

gc.get_threshold()查看该阈值，gc.set)threshold()重新设置该阈值

(700, 10, 10) 700表示启动垃圾回收阈值，10，10表示分别回收的阈值

2.4.1 垃圾回收分代策略 generation，基本假设如下

存活时间越久，越不可能在后面程序中变为垃圾。这样所有对象分为0,1,2三代，所有新建对象都是0代。某一对象经历垃圾回收，仍然存活，那么它就被归入下一代对象。

垃圾回收时，一定扫描0代对象，如果0代经过一定次数垃圾回收，下一次对0代和1代扫描清理，

当1代也经历一次次数垃圾回收，这启动0，1，2所有对象的扫描

以上gc.get_threshold()返回（700,10,10）两个表示每10次0代垃圾回收，将配置1次1代垃圾回收，每10次1代垃圾回收，才有1次2代垃圾回收。

2.4.2 两个对象相互引用，

相互引用构成引用环 reference cycle，该引用环将给上一节2.4.1的垃圾回收带来困难，

引用环可能构成一些无法使用但引用计数不为0的对象为了回收该引用环对象，

py复制了每个对象的引用计数为 gc_ref 遍历所有对象，将每个对象引用的对象相应的gc_ref减1，遍历结束后，

gc_ref不为0的对象和这些对象的引用对象，以及继续更新下游引用对象，被爆了，其他对象被回收。

参考内存管理，函数默认参数，动态类型

2.4.3 迭代

可迭代对象 iter

迭代器 iter + next

生成器特殊迭代器 yield

          def yd():
        a = 100
        yield a
        yield a*8
        yield 8000

2.4.4 抽象方法*(函数)

对象方法(self.对象方法)，类方法(@classmethod),静态方法(@staticmethod)

抽象方法需要子类实现的方法用@abc.abstractmethod以及 metaclass = abc.ABCMeta
使得任何继承自父类的子类必须覆盖实现抽象方法，否则抛出异常

3，其他概念

闭包 closure

闭包指的是难以读取其他函数内部遍历的函数

实现：定义在函数内的内部函数可以读取外层函数变量，从而实现闭包

4，惯例

1,判定dict的key是否存在，使用key in dict而不用 has_key

2,not的位置，使用key not in dict 而不用 no key in dict

3, 使用 dict.get(key[,default])如果key存在，返回，否则返回default

4, 数组字典初始化

 dic = {}
 for k,v in data:
     group = dic.setdefault(key,[])  #如果存在，返回dic[key],不存在把dic[key]设为defalut并返回
     group.append(v)
 from collections import defaultdic
     dic = defalutdic(list)
     for (k,v) in data:
         dic[key].append(v)  #所有key都有一个默认值

迭代一个数组，使用for i,e in enumerate(array) 而不是 for i in range(len(array))

  enumerate 还有第二个参数

5，py3元组unpack

    first, second,*rest, last = range(10)
    0    1    2~8        9

6, 函数参数传入

    def foo(x,y):
        print(x,y)
    adict = {'x':1, 'y':2}

foo(**adict) #字典key作为参数名传入参数值

  alist=[1,2]
 foo(*alist)

7, 字符串连接

    name = "Wang" "Hone"  # WangHong

8, 解释器中的

上一次接收器的返回值

9，嵌套列表推导式

 [(i,j) for i in range(3) for j in range(i)]

10, print重定向

print >>open('a.txt', 'w+'), 'hello,world'

11,反射

#检查是否某个自定的类

        isinstance(obj, class)

12，Picking是Python数据结构的序列化过程

存储一个对象，稍后再取出读取

如何pickle 已存在的对象类型到文件

    json = {'name':'jack', 'age':100}
json_file = open('json pkl', 'rb')
pickle.dump(json.json_file)
json_file.dump(json,json_file)
json_file.close()

取出

data=pickle.load(json_file)
print(data)
json_file.close()

pickler内建类型和外部方法

类自定义行为

    __getinitargs__(self)  #
    __getnewargs__(self)

Slate 记住它曾经是什么，以及什么时候赋值给它？

 __slate__

为对象类提供限制，只能赋予固定的属性名称

13，对象模型Python3和Python2.x之间的主要区别

Python3的string和unicode区别不复存在，因此__unicode__被取消 __bytes__加入进来(与

python2.7的__str__和__unicode__行为类似)，用于心的创建字节数组的内建方法

py3默认除法变成了true除法，因此__div__取消

__coerce__被取消，因为与其他魔法方法有功能重复
cmp 取消，与其他魔法方法功能重复
__nonzero__被重命名为

bool

14,断点

6.1， 断点设置后，代码执行到该位置，程序挂起检查程序行为
6.2， 异常断点，到达断点后要执行的操作
6.3,  断点属性，达到断点时要执行的操作
      挂起策略，用于定义在遇到断点时是否必须挂起应用程序
      对其他断点的依赖，
      何时必须击中断点
6.4   消息记录
    断点命中消息，命中断点时，控制输出一条日志消息
    堆栈跟踪 断点的堆栈跟踪将命中打印到控制台

6.5 断点工具
    pdb 交互式代码调试，功能包括
        设置断点，单步调试，进入函数调试，查看当前代码，查看栈片段，动态改变变量的值
        进入pdb交互界面
    命令
        break 或b设置断点     
        continue 或c   继续执行
        list或l        查看当前代码段
        step或s        进入函数
        return或r      执行代码直到当前函数返回
        exit或q           中止并退出
        next或n         执行下一行
        pp             打印变量的值

15, 依赖问题

pycurl 需要contos 7安装python3-devel
具体过程pycurl-centos7

16, py编译发布流程

1，编译生成pyc文件，建议增加-O优选项

python3 -O -m compileall -b .

2, 删除py文件

   find . -name "*.py"|xargs rm -rf

3, 删除__pycache__目录

   find . -name "__pycache__" |xargs rm -rf

4, 打包 tar包

    cd ..
tar -cjvf xxx.1.1.00.tar.bz2 xxx

5, 或git push到仓库

  git push origin master:master

16 常用内置魔法函数

iter # 在类中实现，可以直接对类进行迭代类似于如下形式

            obj.next 或  next(obj)

call # 在对象直接进行调用

            obj()

、slate 为对象类提供限制，只能赋予固定的属性名称

__qualname__  # 查看类和当前函数名

>>> D.f.__qualname__
 >>>   D.f#返回类和函数

通过类字典返回函数，不会返回函数名

    >>> D.__dict__['f']
    <function D.f at 0x000001F6C6224670

通过类实例的点运算查看函数将直接返回函数

>>> d = D()
>>> d.f    
    <bound method D.f of <__main__.D object at 0x000001F6C5F42070>>

查看实例的函数对象

>>> d.f.__func__
<function D.f at 0x000001F6C6224670>
>>> d.f.__self__
<__main__.D object at 0x000001F6C5F42070>

17 内置函数二进制运算

chr
    返回整数 i 的字符串格式，如 chr(97) 返回字符 'a' 是 ord的逆运算
    chr('8364') （欧元符号）返回  €
ord
    返回代表单个Unicode字符的 码点的整数，例如 ord('a')返回整数 97
    ord('€') （欧元符号）返回 8364

点击关注，第一时间了解华为云新鲜技术~

简介

1,可变数据结构： 注意在函数变量不要使用它