JSON進(jìn)階
Python的dict對(duì)象可以直接序列化為JSON的{},不過,很多時(shí)候,我們更喜歡用class表示對(duì)象,比如定義Student類,然后序列化:
1
2
3
4
5
6
7
8
9
10
|
import json class Student( object ): def __init__( self , name, age, score): self .name = name self .age = age self .score = score s = Student( 'Bob' , 20 , 88 ) print (json.dumps(s)) |
運(yùn)行代碼,毫不留情地得到一個(gè)TypeError:
1
2
3
|
Traceback (most recent call last): ... TypeError: <__main__.Student object at 0x10aabef50 > is not JSON serializable |
錯(cuò)誤的原因是Student對(duì)象不是一個(gè)可序列化為JSON的對(duì)象。
如果連class的實(shí)例對(duì)象都無法序列化為JSON,這肯定不合理!
別急,我們仔細(xì)看看dumps()方法的參數(shù)列表,可以發(fā)現(xiàn),除了第一個(gè)必須的obj參數(shù)外,dumps()方法還提供了一大堆的可選參數(shù):
https://docs.python.org/2/library/json.html#json.dumps
這些可選參數(shù)就是讓我們來定制JSON序列化。前面的代碼之所以無法把Student類實(shí)例序列化為JSON,是因?yàn)槟J(rèn)情況下,dumps()方法不知道如何將Student實(shí)例變?yōu)橐粋€(gè)JSON的{}對(duì)象。
可選參數(shù)default就是把任意一個(gè)對(duì)象變成一個(gè)可序列為JSON的對(duì)象,我們只需要為Student專門寫一個(gè)轉(zhuǎn)換函數(shù),再把函數(shù)傳進(jìn)去即可:
1
2
3
4
5
6
7
8
|
def student2dict(std): return { 'name' : std.name, 'age' : std.age, 'score' : std.score } print (json.dumps(s, default = student2dict)) |
這樣,Student實(shí)例首先被student2dict()函數(shù)轉(zhuǎn)換成dict,然后再被順利序列化為JSON。
不過,下次如果遇到一個(gè)Teacher類的實(shí)例,照樣無法序列化為JSON。我們可以偷個(gè)懶,把任意class的實(shí)例變?yōu)閐ict:
print(json.dumps(s, default=lambda obj: obj.__dict__))
因?yàn)橥ǔlass的實(shí)例都有一個(gè)__dict__屬性,它就是一個(gè)dict,用來存儲(chǔ)實(shí)例變量。也有少數(shù)例外,比如定義了__slots__的class。
同樣的道理,如果我們要把JSON反序列化為一個(gè)Student對(duì)象實(shí)例,loads()方法首先轉(zhuǎn)換出一個(gè)dict對(duì)象,然后,我們傳入的object_hook函數(shù)負(fù)責(zé)把dict轉(zhuǎn)換為Student實(shí)例:
1
2
3
4
5
|
def dict2student(d): return Student(d[ 'name' ], d[ 'age' ], d[ 'score' ]) json_str = '{"age": 20, "score": 88, "name": "Bob"}' print (json.loads(json_str, object_hook = dict2student)) |
運(yùn)行結(jié)果如下:
1
|
<__main__.Student object at 0x10cd3c190 > |
打印出的是反序列化的Student實(shí)例對(duì)象。
小結(jié)
Python語言特定的序列化模塊是pickle,但如果要把序列化搞得更通用、更符合Web標(biāo)準(zhǔn),就可以使用json模塊。
json模塊的dumps()和loads()函數(shù)是定義得非常好的接口的典范。當(dāng)我們使用時(shí),只需要傳入一個(gè)必須的參數(shù)。但是,當(dāng)默認(rèn)的序列化或反序列機(jī)制不滿足我們的要求時(shí),我們又可以傳入更多的參數(shù)來定制序列化或反序列化的規(guī)則,既做到了接口簡單易用,又做到了充分的擴(kuò)展性和靈活性。