YAML是專門用來寫配置檔案的語言,遠比JSON格式友善。
YAML語言的設計目标,就是友善人類讀寫。
YAML是一種比XML和JSON更輕的檔案格式,也更簡單更強大,它可以通過縮進來表示結構,是不是聽起來就和Python很搭?
顧名思義,用語言編寫的檔案就可以稱之為YAML檔案。PyYaml是Python的一個專門針對YAML檔案操作的子產品,使用起來非常簡單。
1.yaml檔案格式簡介
基本規則:
- 大小寫敏感
- 使用縮進表示層級關系
- 縮進時不允許使用Tab鍵,隻允許使用空格。
- 縮進的空格數目不重要,隻要相同層級的元素左側對齊即可
- 使用#表示注釋
- 字元串可以不用引号标注
yaml 支援的資料結構有三種:
- 對象:鍵值對的集合,又稱為映射(mapping)/ 哈希(hashes) / 字典(dictionary)
- 數組:一組按次序排列的值,又稱為序列(sequence) / 清單(list)
- 純量(scalars):單個的、不可再分的值。字元串、布爾值、整數、浮點數、Null、時間、日期
1.1 對象
user: admin
pwd: 123
job:
- teacher
- nurese
#輸出
{'user': 'admin',
'pwd': 123,
'job': ['teacher', 'nurese']}
1.2 數組序列
- admin1: 123456
- admin2: 111111
- admin3: 222222
#輸出:
[{'admin1': 123456},
{'admin2': 111111},
{'admin3': 222222}]
1.3 純量
n1: 52.10
---------------------------------------------------------------
n2: true
n3: false #不區分大小寫
---------------------------------------------------------------
#None用~表示
n4: ~
輸出:{'n1': 52.1}
---------------------------------------------------------------
輸出:{'n2': True, 'n3': False}
---------------------------------------------------------------
輸出:{'n4': None}
1.4 混合使用
1.list嵌套dict
- user: admin1
psw: '123456'
- user: admin2
psw: '111111'
- user: admin3
psw: '222222'
用python讀取出來的結果:
[{'user': 'admin1', 'psw': '123456'},
{'user': 'admin2', 'psw': '111111'},
{'user': 'admin3', 'psw': '222222'}]
2.dict嵌套list
nub1:
- admin1
- '123456'
nb2:
- admin2
- '111111'
nb3:
- admin3
- '222222'
用python讀取出來的結果:
{'nub1': ['admin1', '123456'],
'nb2': ['admin2', '111111'],
2.Yaml文法詳解
2.1 基本規則
- 大小寫敏感
- 使用縮進表示層級關系
- 縮進時不允許使用Tab鍵,隻允許使用空格。
- 縮進的空格數目不重要,隻要相同層級的元素左側對齊即可
- 使用#表示注釋
- 字元串可以不用引号标注
2.2 yaml轉字典
yaml中支援映射或字典的表示,如下:
# 下面格式讀到Python裡會是個dict
name: 灰藍
age: 0
job: Tester
輸出:
{'name': '灰藍', 'age': 0, 'job': 'Tester'}
2.3 yaml轉清單
yaml中支援清單或數組的表示,如下:
# 下面格式讀到Python裡會是個list
- 灰藍
- 0
- Tester
輸出:
['灰藍', 0, 'Tester']
2.4 複合結構
字典和清單可以複合起來使用,如下:
# 下面格式讀到Python裡是個list裡包含dict
- name: 灰藍
age: 0
job: Tester
- name: James
age: 30
輸出:
[{'name': '灰藍', 'age': 0, 'job': 'Tester'}, {'name': 'James', 'age': 30}]
2.5 基本類型
yaml中有以下基本類型:
- 字元串
- 整型
- 浮點型
- 布爾型
- null
- 時間
- 日期
我們寫個例子來看下:
# 這個例子輸出一個字典,其中value包括所有基本類型
str: "Hello World!"
int: 110
float: 3.141
boolean: true # or false
None: null # 也可以用 ~ 号來表示 null
time: 2016-09-22t11:43:30.20+08:00 # ISO8601,寫法百度
date: 2016-09-22 # 同樣ISO8601
輸出:
{'str': 'Hello World!', 'int': 110, 'float': 3.141, 'boolean': True, 'None': None, 'time': datetime.datetime(2016, 9, 22, 3, 43, 30, 200000), 'date': datetime.date(2016, 9, 22)}
如果字元串沒有空格或特殊字元,不需要加引号,但如果其中有空格或特殊字元,則需要加引号了
str: 灰藍
str1: "Hello World"
str2: "Hello\nWorld"
輸出:
{'str': '灰藍', 'str1': 'Hello World', 'str2': 'Hello\nWorld'}
這裡要注意單引号和雙引号的差別,單引号中的特殊字元轉到Python會被轉義,也就是到最後是原樣輸出了,雙引号不會被Python轉義,到最後是輸出了特殊字元;如:
str1: 'Hello\nWorld'
str2: "Hello\nWorld"
輸出:
{'str1': 'Hello\\nWorld', 'str2': 'Hello\nWorld'}
可以看到,單引号中的’\n’最後是輸出了,雙引号中的’\n’最後是轉義成了回車
2.6 引用
& 和 * 用于引用
name: &name 灰藍
tester: *name
這個相當于一下腳本:
name: 灰藍
tester: 灰藍
輸出:
{'name': '灰藍', 'tester': '灰藍'}
2.7 強制轉換
yaml是可以進行強制轉換的,用 !! 實作,如下:
str: !!str 3.14
int: !!int "123"
輸出:
{'int': 123, 'str': '3.14'}
明顯能夠看出123被強轉成了int類型,而float型的3.14則被強轉成了str型。
2.8 分段
在同一個yaml檔案中,可以用 — 來分段,這樣可以将多個文檔寫在一個檔案中
---
name: James
age: 20
---
name: Lily
age: 19
3.構造器(constructors)、表示器(representers)、解析器(resolvers )
3.1 yaml.YAMLObject
yaml.YAMLObject用元類來注冊一個構造器(也就是代碼裡的 init() 方法),讓你把yaml節點轉為Python對象執行個體,用表示器(也就是代碼裡的 repr() 函數)來讓你把Python對象轉為yaml節點,看代碼:
import yaml
class Person(yaml.YAMLObject):
yaml_tag = '!person'
def __init__(self, name, age):
self.name = name
self.age = age
def __repr__(self):
return '%s(name=%s, age=%d)' % (self.__class__.__name__, self.name, self.age)
james = Person('James', 20)
print (yaml.dump(james)) # Python對象執行個體轉為yaml
lily = yaml.load('!person {name: Lily, age: 19}')
print (lily) # yaml轉為Python對象執行個體
#輸出:
!person {age: 20, name: James}
Person(name=Lily, age=19)
3.2 yaml.add_constructor 和 yaml.add_representer
你可能在使用過程中并不想通過上面這種元類的方式,而是想定義正常的類,那麼,可以用這兩種方法
import yaml
class Person(object):
def __init__(self, name, age):
self.name = name
self.age = age
def __repr__(self):
return 'Person(%s, %s)' % (self.name, self.age)
james = Person('James', 20)
print (yaml.dump(james)) # 沒加表示器之前
def person_repr(dumper, data):
return dumper.represent_mapping(u'!person', {"name": data.name, "age": data.age}) # mapping表示器,用于dict
yaml.add_representer(Person, person_repr) # 用add_representer方法為對象添加表示器
print (yaml.dump(james)) # 加了表示器之後
def person_cons(loader, node):
value = loader.construct_mapping(node) # mapping構造器,用于dict
name = value['name']
age = value['age']
return Person(name, age)
yaml.add_constructor(u'!person', person_cons) # 用add_constructor方法為指定yaml标簽添加構造器
lily = yaml.load('!person {name: Lily, age: 19}')
print (lily)
#結果輸出
!!python/object:__main__.Person {age: 20, name: James}
!person {age: 20, name: James}
Person(Lily, 19)
第一行是沒加表示器之前,多醜!中間那行是加了表示器之後,變成了規範的格式,下面添加了構造器,能夠把 !person 标簽轉化為Person對象。
4.PyYaml使用執行個體
4.1 load() :傳回一個對象
我們先建立一個yml檔案,config.yml:
name: Tom Smith
age: 37
spouse:
name: Jane Smith
age: 25
children:
- name: Jimmy Smith
age: 15
- name1: Jenny Smith
age1: 12
讀取yml檔案:
import yaml
f = open(r'./config.yaml')
#y = yaml.load(f) #yaml5.1後廢棄這種方法
#由于Yaml 5.1版本後棄用了 yaml.load(file) 這個用法。Yaml 5.1版本之後就修改了需要指定Loader,通過預設加載器(FullLoader)禁止執行任意函數,使得此load函數的安全得到加強。
#下面三種方法都可以
# y=yaml.load(f,Loader=yaml.FullLoader)
# y=yaml.safe_load(f)
y=yaml.load(f, Loader=yaml.CLoader)
print (y)
#結果輸出
{'name': 'Tom Smith', 'age': 37, 'spouse': {'name': 'Jane Smith', 'age': 25}, 'children': [{'name': 'Jimmy Smith', 'age': 15}, {'name1': 'Jenny Smith', 'age1': 12}]}
4.2 load_all()生成一個疊代器
如果string或檔案包含幾塊yaml文檔,你可以使用yaml.load_all來解析全部的文檔。
import yaml
f = '''
---
name: James
age: 20
---
name: Lily
age: 19
'''
y = yaml.load_all(f,Loader=yaml.FullLoader)
for data in y:
print(data)
#結果輸出
{'name': 'James', 'age': 20}
{'name': 'Lily', 'age': 19}
4.3 yaml.dump 将一個python對象生成為yaml文檔
import yaml
aproject = {'name': 'Silenthand Olleander',
'race': 'Human',
'traits': ['ONE_HAND', 'ONE_EYE']
}
print(yaml.dump(aproject))
#結果輸出
name: Silenthand Olleander
race: Human
traits:
- ONE_HAND
- ONE_EYE
yaml.dump接收的第二個參數一定要是一個打開的文本檔案或二進制檔案,yaml.dump會把生成的yaml文檔寫到檔案裡
import yaml
aproject = {'name': 'Silenthand Olleander',
'race': 'Human',
'traits': ['ONE_HAND', 'ONE_EYE']
}
f = open(r'./config2.yaml','w')
print(yaml.dump(aproject,f))
檔案輸出

4.4 yaml.dump_all()将多個段輸出到一個檔案中
import yaml
obj1 = {"name": "James", "age": 20}
obj2 = ["Lily", 19]
with open(r'./config3.yaml', 'w') as f:
yaml.dump_all([obj1, obj2], f)
結果檔案輸出:
5.總結
看完這篇文章,可以看到,整個操作都是比較簡單的,但是是不是發現沒有增加,删除等操作呀?這個确實好像修改資料,好像隻有把資料全部取出來,然後修改,然後在存回去
官方連結:http://pyyaml.org/wiki/PyYAMLDocumentation