Python 進階之路 (八) 最用心的推導式詳解 (附簡單實戰及原始碼)
什麼是推導式
大家好,今天為大家帶來問我最喜歡的Python推導式使用指南,讓我們先來看看定義~
推導式(comprehensions)是Python的一種獨有特性,推導式是可以從一個數據序列構建另一個新的資料序列的結構體。一般有三種使用最多的推導式:
- 列表推導式(list comprehensions)
- 字典推導式(dict comprehensions)
- 集合推導式(set comprehensions)
使用推導式可以簡化程式碼的同時提高效率,在我的個人使用場景中,用的最多的還是列表推導式,接下來我會一一介紹這三種常見的推導式,最後通過一個簡單實戰發現推導式的高效之處
列表推導式(list comprehensions)
模板
首先,讓我們看看使用列表推導式的基礎模板:
- [ expression for item in list if conditional ]
簡單來說,遍歷一個list,得到每一個元素item,我們相對item進行哪些操作,寫在expression裡就可以,如果對篩選有什麼條件,可以放在if後面
下面可以通過大量例項幫助大家理解
使用例項
先看第一個小栗子,在這裡我們用for迴圈常規遍歷一個字串‘human’,把每一字母作為元素放在一個叫h_letters的數組裡面:
h_letters = [] for letter in 'human': h_letters.append(letter) print(h_letters) Out:['h', 'u', 'm', 'a', 'n']
如果我們根據列表推導式的定義模板,可以簡化如下:
h_letters = [ letter for letter in 'human' ] print( h_letters) Out: ['h', 'u', 'm', 'a', 'n']
這樣的話便捷了很多,看上去也很容易理解,這裡我們在expression部分什麼都沒有些,只是提出了每個元素而已,執行時的python執行方式如下:
我們可以在expression的部分進行很多操作,比如:
h_letters = [ letter.upper() for letter in 'human' ] print( h_letters) Out: ['H', 'U', 'M', 'A', 'N']
這樣我們可以很容易的實現字母的大小寫轉化
同樣的,我們可以在if後面寫出篩選條件,比如這裡,我們想要提出從-20 ~ 20中所有能被3整除的正數:
result = [num for num in range(-20,20) if num %3==0 and num > 0] print(result)#多個條件可以用and連線 Out: [3, 6, 9, 12, 15, 18]
列表推導式的實際應用場景十分廣泛,它於lambda不同,是真正好理解,提成效率的python特性之一,這裡相信聰明的你已經想到了更多用法!
字典推導式(dict comprehensions)
模板
讓我們看先來看使用字典推導式的基礎模板:
- { key:value for key,value in existing_data_structure }
這裡和list有所不同,因位dict裡面有兩個關鍵的屬性,key和value,大同小異,我們現在的expression部分可以同時對key和value進行操作
下面來看最常見的應用
使用例項
首先最實用的功能莫過於可以實現一個dict的key,value值互換:
person = {'name':'xiaobai','city':'paris'} person_reverse = {v:k for k,v in person.items()}#簡單互換key和value的值即可 print(person_reverse) Out: {'xiaobai': 'name', 'paris': 'city'}
這裡就非常方便了用字典推導式,不然的話只能用for迴圈,會稍微麻煩一些。
讓我們再看下一個很巧的例子:
nums = {'a':10,'b':20,'A':5,'B':3,'d':4} num_frequency= {k.lower():nums.get(k.lower(),0) + nums.get(k.upper(),0) for k in nums.keys() } print(num_frequency) Out: {'a': 15, 'b': 23, 'd': 4}
這裡使用的就比較靈活,我們有一個數據,key是字母的大小寫混在一起,我們想統計同一個key(大小寫都包括)所對應的數字出現總和,所以在新建的num_frequency 字典用使用了推導式,這裡我們遍歷的是dict.keys()
配合dict.get()方法
再比如下面的例子:
fruit = ['apple','banana','organge','mango','peach'] fruit_len = {f:len(f) for f in fruit} print(fruit_len) Out:{'apple': 5, 'banana': 6, 'organge': 7, 'mango': 5, 'peach': 5}
我們有一個fruit的list,現在想要得到每一種水果的單詞長度,就可以通過圖中所示的方法實現,非常容易
最後再來看一個字典推導式配合列舉(enumerate)的例子:
fruit = ['apple','organge','banana','mango','peach'] fruit_positon = {v:i for i,v in enumerate(fruit)} print(fruit_positon) Out: {'apple': 0, 'organge': 1, 'banana': 2, 'mango': 3, 'peach': 4}
還是用剛才的list,這次我們得到的key是fruit的每個元素,value則是該元素在fruit所屬的index
集合推導式(Set comprehensions)
模板
讓我們看先來看使用集合推導式的基礎模板:
- { expression for item in Sequence if conditional }
其實集合推導式和list的推導式很像,但是既然是結合,肯定會配合利用Set的屬性來實現我們的目的,如果你還對Set這種資料結構不夠了解,可以參考我之前的文章: Python 進階之路 (四) 先立Flag, 社群最全的Set用法集錦
下面來看最常見的應用
使用例項
首先,我們來看一個根據Set值唯一的特性的例子,我們有一個list叫names,用來儲存名字,其中的資料很不規範,有大寫,小寫,還有重複的,我們想要去重並把名字的格式統一為首字母大寫,實現方法便是用Set推導式:
names = [ 'Bob', 'JOHN', 'alice', 'bob', 'ALICE', 'James', 'Bob','JAMES','jAMeS' ] names_standard = { n[0].upper()+n[1:].lower() for n in names} print(names_standard) Out: {'John', 'Bob', 'James', 'Alice'}
這裡就不再舉很多的其他例子了,因為使用的方式多種多樣,剩下的就靠廣大人民群眾的智慧自行開發即可!
簡單實戰
現在讓我們來看一個比較綜合的例子!我們現在手裡有一個英文字典的dictionary.txt檔案,包含從A~Z的單詞
具體需求:我們想要找到長度大於5的正反拼寫都具有實際含義的單詞
我們現在會通過各種推導式來實現這個目標,我會在文章最後把txt檔案及Python檔案下載連結附上,這樣大家如果先要練習可以自行下載
首先,我們的初始目錄結構如下:
這裡我新建了一個test資料夾,把dictionary.txt 檔案和python檔案放在一起方便讀取,開始之前,先大概看下txt檔案長什麼樣子:
第一步:讀取dictionary.txt中的單詞,選出長度大於5的
import os print(os.getcwd()) with open('dictionary.txt') as dictionary_file: words = (line.rstrip() for line in dictionary_file) words_over_five_letters = [w for w in words if len(w)>5 ]
這裡通過列表推導式words_over_five_letters 用來儲存所有長度大於5的單詞
第二步:將上一步選出的單詞全部倒序存貯
reversed_words ={ word[::-1] for word in words_over_five_letters }
通過set推導式非常容易的實現
第三步:通過if條件篩選得出結果
reversible_words = [ word for word in words_over_five_letters if word in reversed_words ] for word in reversible_words[0:20]: print(word) Out: abrood agenes amaroid amunam animal animes bruted darter decart decurt deedeed deflow degami degener degged deified deifier deliver denier
這裡最後共有203個結果,我們只看了前20個,驗證方法就是隻要長度大於5的單詞同時存在於reversed_words和words_over_five_letters即可
完整程式碼如下:
import os print(os.getcwd()) with open('dictionary.txt') as dictionary_file: words = (line.rstrip() for line in dictionary_file) words_over_five_letters = [w for w in words if len(w)>5 ] reversed_words ={ word[::-1] for word in words_over_five_letters } reversible_words = [ word for word in words_over_five_letters if word in reversed_words ] for word in reversible_words[0:20]: print(word)
資料下載
總結
這次為大家總結了python裡面常見的三種推導式相關用法以及最後的小實戰環節,希望大家喜歡,雙擊666點個贊吧!!