30 個 Python 的最佳實踐、小貼士和技巧

csdn 發佈 2020-01-11T10:23:13+00:00

如果不指定,則會使用如下默認值:start:0end:字符串的結尾step:1示例如下:#We can easily create a new list from # the first two elements of a list:first_two = [1, 2, 3, 4

作者 | Erik-Jan van Baaren

譯者 | 彎月,責編 | 屠敏

以下為譯文:

元旦過完了,我們都紛紛回到了各自的工作崗位。新的一年新氣象,我想借本文為大家獻上 Python 語言的30個最佳實踐、小貼士和技巧,希望能對各位勤勞的程式設計師有所幫助,並希望大家工作順利!

1. Python 版本

在此想提醒各位:自2020年1月1日起,Python 官方不再支持 Python 2。本文中的很多示例只能在 Python 3 中運行。如果你仍在使用 Python 2.7,請立即升級。

2. 檢查 Python 的最低版本

你可以在代碼中檢查 Python 的版本,以確保你的用戶沒有在不兼容的版本中運行腳本。檢查方式如下:

if not sys.version_info > (2, 7):
# berate your user for running a 10 year
# python version
elif not sys.version_info >= (3, 5):
# Kindly tell your user (s)he needs to upgrade
# because you're using 3.5 features

3. IPython

IPython 本質上就是一個增強版的shell。就衝著自動補齊就值得一試,而且它的功能還不止於此,它還有很多令我愛不釋手的命令,例如:

  • %cd:改變當前的工作目錄

  • %edit:打開編輯器,並關閉編輯器後執行鍵入的代碼

  • %env:顯示當前環境變量

  • %pip install [pkgs]:無需離開交互式shell,就可以安裝軟體包

  • %time 和 %timeit:測量執行Python代碼的時間

完整的命令列表,請點擊此處查看(https://ipython.readthedocs.io/en/stable/interactive/magics.html)。

還有一個非常實用的功能:引用上一個命令的輸出。In 和 Out 是實際的對象。你可以通過 Out[3] 的形式使用第三個命令的輸出。

IPython 的安裝命令如下:

pip3 install ipython

4. 列表推導式

你可以利用列表推導式,避免使用循環填充列表時的繁瑣。列表推導式的基本語法如下:

[ expression for item in list if conditional ]

舉一個基本的例子:用一組有序數字填充一個列表:

mylist = [i for i in range(10)]
print(mylist)
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

由於可以使用表達式,所以你也可以做一些算術運算:

squares = [x**2 for x in range(10)]
print(squares)
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

甚至可以調用外部函數:

def some_function(a):
return (a + 5) / 2

my_formula = [some_function(i) for i in range(10)]
print(my_formula)
# [2, 3, 3, 4, 4, 5, 5, 6, 6, 7]

最後,你還可以使用 『if』 來過濾列表。在如下示例中,我們只保留能被2整除的數字:

filtered = [i for i in range(20) if i%2==0]
print(filtered)
# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

5. 檢查對象使用內存的狀況

你可以利用 sys.getsizeof 來檢查對象使用內存的狀況:

import sys

mylist = range(0, 10000)
print(sys.getsizeof(mylist))
# 48

等等,為什麼這個巨大的列表僅包含48個字節?

因為這裡的 range 函數返回了一個類,只不過它的行為就像一個列表。在使用內存方面,range 遠比實際的數字列表更加高效。

你可以試試看使用列表推導式創建一個範圍相同的數字列表:

import sys

myreallist = [x for x in range(0, 10000)]
print(sys.getsizeof(myreallist))
# 87632

6. 返回多個值

Python 中的函數可以返回一個以上的變量,而且還無需使用字典、列表或類。如下所示:

def get_user(id):
# fetch user from database
# ....
return name, birthdate

name, birthdate = get_user(4)

如果返回值的數量有限當然沒問題。但是,如果返回值的數量超過3個,那麼你就應該將返回值放入一個(數據)類中。

7. 使用數據類

Python從版本3.7開始提供數據類。與常規類或其他方法(比如返回多個值或字典)相比,數據類有幾個明顯的優勢:

  • 數據類的代碼量較少

  • 你可以比較數據類,因為數據類提供了 __eq__ 方法

  • 調試的時候,你可以輕鬆地輸出數據類,因為數據類還提供了 __repr__ 方法

  • 數據類需要類型提示,因此可以減少Bug的發生幾率

數據類的示例如下:

from dataclasses import dataclass

@dataclass
class Card:
rank: str
suit: str

card = Card("Q", "hearts")

print(card == card)
# True

print(card.rank)
# 'Q'

print(card)
Card(rank='Q', suit='hearts')

詳細的使用指南請點擊這裡(https://realpython.com/python-data-classes/)。

8. 交換變量

如下的小技巧很巧妙,可以為你節省多行代碼:

a = 1
b = 2
a, b = b, a
print (a)
# 2
print (b)
# 1

9. 合併字典(Python 3.5以上的版本)

從Python 3.5開始,合併字典的操作更加簡單了:

dict1 = { 'a': 1, 'b': 2 }
dict2 = { 'b': 3, 'c': 4 }
merged = { **dict1, **dict2 }
print (merged)
# {'a': 1, 'b': 3, 'c': 4}

如果 key 重複,那麼第一個字典中的 key 會被覆蓋。

10. 字符串的首字母大寫

如下技巧真是一個小可愛:

mystring = "10 awesome python tricks"
print(mystring.title)
'10 Awesome Python Tricks'

11. 將字符串分割成列表

你可以將字符串分割成一個字符串列表。在如下示例中,我們利用空格分割各個單詞:

mystring = "The quick brown fox"
mylist = mystring.split(' ')
print(mylist)
# ['The', 'quick', 'brown', 'fox']

12. 根據字符串列表創建字符串

與上述技巧相反,我們可以根據字符串列表創建字符串,然後在各個單詞之間加入空格:

mylist = ['The', 'quick', 'brown', 'fox']
mystring = " ".join(mylist)
print(mystring)
# 'The quick brown fox'

你可能會問為什麼不是 mylist.join(" "),這是個好問題!

根本原因在於,函數 String.join 不僅可以聯接列表,而且還可以聯接任何可疊代對象。將其放在String中是為了避免在多個地方重複實現同一個功能。

13. 表情符

有些人非常喜歡錶情符,而有些人則深惡痛絕。我在此鄭重聲明:在分析社交媒體數據時,表情符可以派上大用場。

首先,我們來安裝表情符模塊:

pip3 install emoji

安裝完成後,你可以按照如下方式使用:

import emoji
result = emoji.emojize('Python is :thumbs_up:')
print(result)
# 'Python is '

# You can also reverse this:
result = emoji.demojize('Python is ')
print(result)
# 'Python is :thumbs_up:'

更多有關表情符的示例和文檔,請點擊此處(https://pypi.org/project/emoji/)。

14. 列表切片

列表切片的基本語法如下:

a[start:stop:step]

start、stop 和 step 都是可選項。如果不指定,則會使用如下默認值:

  • start:0

  • end:字符串的結尾

  • step:1

示例如下:

# We can easily create a new list from 
# the first two elements of a list:
first_two = [1, 2, 3, 4, 5][0:2]
print(first_two)
# [1, 2]

# And if we use a step value of 2,
# we can skip over every second number
# like this:
steps = [1, 2, 3, 4, 5][0:5:2]
print(steps)
# [1, 3, 5]

# This works on strings too. In Python,
# you can treat a string like a list of
# letters:
mystring = "abcdefdn nimt"[::2]
print(mystring)
# 'aced it'

15. 反轉字符串和列表

你可以利用如上切片的方法來反轉字符串或列表。只需指定 step 為 -1,就可以反轉其中的元素:

revstring = "abcdefg"[::-1]
print(revstring)
# 'gfedcba'

revarray = [1, 2, 3, 4, 5][::-1]
print(revarray)
# [5, 4, 3, 2, 1]

16. 顯示貓貓

我終於找到了一個充分的藉口可以在我的文章中顯示貓貓了,哈哈!當然,你也可以利用它來顯示圖片。首先你需要安裝 Pillow,這是一個 Python 圖片庫的分支:

pip3 install Pillow

接下來,你可以將如下圖片下載到一個名叫 kittens.jpg 的文件中:

然後,你就可以通過如下 Python 代碼顯示上面的圖片:

from PIL import Image

im = Image.open("kittens.jpg")
im.show
print(im.format, im.size, im.mode)
# JPEG (1920, 1357) RGB

Pillow 還有很多顯示該圖片之外的功能。它可以分析、調整大小、過濾、增強、變形等等。完整的文檔,請點擊這裡(https://pillow.readthedocs.io/en/stable/)。

17. map

Python 有一個自帶的函數叫做 map,語法如下:

map(function, something_iterable)

所以,你需要指定一個函數來執行,或者一些東西來執行。任何可疊代對象都可以。在如下示例中,我指定了一個列表:

def upper(s):
return s.upper

mylist = list(map(upper, ['sentence', 'fragment']))
print(mylist)
# ['SENTENCE', 'FRAGMENT']

# Convert a string representation of
# a number into a list of ints.
list_of_ints = list(map(int, "1234567")))
print(list_of_ints)
# [1, 2, 3, 4, 5, 6, 7]

你可以仔細看看自己的代碼,看看能不能用 map 替代某處的循環。

18. 獲取列表或字符串中的唯一元素

如果你利用函數 set 創建一個集合,就可以獲取某個列表或類似於列表的對象的唯一元素:

mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
print (set(mylist))
# {1, 2, 3, 4, 5, 6}

# And since a string can be treated like a
# list of letters, you can also get the
# unique letters from a string this way:
print (set("aaabbbcccdddeeefff"))
# {'a', 'b', 'c', 'd', 'e', 'f'}

19. 查找出現頻率最高的值

你可以通過如下方法查找出現頻率最高的值:

test = [1, 2, 3, 4, 2, 2, 3, 1, 4, 4, 4]
print(max(set(test), key = test.count))
# 4

你能看懂上述代碼嗎?想法搞明白上述代碼再往下讀。

沒看懂?我來告訴你吧:

  • max 會返回列表的最大值。參數 key 會接受一個參數函數來自定義排序,在本例中為 test.count。該函數會應用於疊代對象的每一項。

  • test.count 是 list 的內置函數。它接受一個參數,而且還會計算該參數的出現次數。因此,test.count(1) 將返回2,而 test.count(4) 將返回4。

  • set(test) 將返回 test 中所有的唯一值,也就是 {1, 2, 3, 4}。

因此,這一行代碼完成的操作是:首先獲取 test 所有的唯一值,即{1, 2, 3, 4};然後,max 會針對每一個值執行 list.count,並返回最大值。

這一行代碼可不是我個人的發明。

20. 創建一個進度條

你可以創建自己的進度條,聽起來很有意思。但是,更簡單的方法是使用 progress 包:

pip3 install progress

接下來,你就可以輕鬆地創建進度條了:

from progress.bar import Bar

bar = Bar('Processing', max=20)
for i in range(20):
# Do some work
bar.next
bar.finish

21. 在交互式shell中使用_(下劃線運算符)

你可以通過下劃線運算符獲取上一個表達式的結果,例如在 IPython 中,你可以這樣操作:

In [1]: 3 * 3
Out[1]: 9In [2]: _ + 3
Out[2]: 12

Python Shell 中也可以這樣使用。另外,在 IPython shell 中,你還可以通過 Out[n] 獲取表達式 In[n] 的值。例如,在如上示例中,Out[1] 將返回數字9。

22. 快速創建Web伺服器

你可以快速啟動一個Web服務,並提供當前目錄的內容:

python3 -m http.server

當你想與同事共享某個文件,或測試某個簡單的HTML網站時,就可以考慮這個方法。

23. 多行字符串

雖然你可以用三重引號將代碼中的多行字符串括起來,但是這種做法並不理想。所有放在三重引號之間的內容都會成為字符串,包括代碼的格式,如下所示。

我更喜歡另一種方法,這種方法不僅可以將多行字符串連接在一起,而且還可以保證代碼的整潔。唯一的缺點是你需要明確指定換行符。

s1 = """Multi line strings can be put
between triple quotes. It's not ideal
when formatting your code though"""

print (s1)
# Multi line strings can be put
# between triple quotes. It's not ideal
# when formatting your code though

s2 = ("You can also concatenate multiple\n" +
"strings this way, but you'll have to\n"
"explicitly put in the newlines")

print(s2)
# You can also concatenate multiple
# strings this way, but you'll have to
# explicitly put in the newlines

24. 條件賦值中的三元運算符

這種方法可以讓代碼更簡潔,同時又可以保證代碼的可讀性:

[on_true] if [expression] else [on_false]

示例如下:

x = "Success!" if (y == 2) else "Failed!"

25. 統計元素的出現次數

你可以使用集合庫中的 Counter 來獲取列表中所有唯一元素的出現次數,Counter 會返回一個字典:

from collections import Counter

mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
c = Counter(mylist)
print(c)
# Counter({1: 2, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})

# And it works on strings too:
print(Counter("aaaaabbbbbccccc"))
# Counter({'a': 5, 'b': 5, 'c': 5})

26. 比較運算符的連結

你可以在 Python 中將多個比較運算符連結到一起,如此就可以創建更易讀、更簡潔的代碼:

x = 10

# Instead of:
if x > 5 and x < 15:
print("Yes")
# yes

# You can also write:
if 5 < x < 15:
print("Yes")
# Yes

27. 添加顏色

你可以通過 Colorama,設置終端的顯示顏色:

from colorama import Fore, Back, Style

print(Fore.RED + 'some red text')
print(Back.GREEN + 'and with a green background')
print(Style.DIM + 'and in dim text')
print(Style.RESET_ALL)
print('back to normal now')

28. 日期的處理

python-dateutil 模塊作為標準日期模塊的補充,提供了非常強大的擴展,你可以通過如下命令安裝:

pip3 install python-dateutil 

你可以利用該庫完成很多神奇的操作。在此我只舉一個例子:模糊分析日誌文件中的日期:

from dateutil.parser import parse

logline = 'INFO 2020-01-01T00:00:01 Happy new year, human.'
timestamp = parse(log_line, fuzzy=True)
print(timestamp)
# 2020-01-01 00:00:01

你只需記住:當遇到常規 Python 日期時間功能無法解決的問題時,就可以考慮 python-dateutil !

29.整數除法

在 Python 2 中,除法運算符(/)默認為整數除法,除非其中一個操作數是浮點數。因此,你可以這麼寫:

# Python 2
5 / 2 = 2
5 / 2.0 = 2.5

在 Python 3 中,除法運算符(/)默認為浮點除法,而整數除法的運算符為 //。因此,你需要這麼寫:

Python 3
5 / 2 = 2.5
5 // 2 = 2

這項變更背後的動機,請參閱 PEP-0238(https://www.python.org/dev/peps/pep-0238/)。

30. 通過chardet 來檢測字符集

你可以使用 chardet 模塊來檢測文件的字符集。在分析大量隨機文本時,這個模塊十分實用。安裝方法如下:

pip install chardet

安裝完成後,你就可以使用命令行工具 chardetect 了,使用方法如下:

chardetect somefile.txt
somefile.txt: ascii with confidence 1.0

你也可以在編程中使用該庫,完整的文檔請點擊這裡(https://chardet.readthedocs.io/en/latest/usage.html)。

如上就是我為各位奉上的新年禮物,希望各位喜歡!如果你有其他的技巧、貼士和實踐,請在下方留言!

原文:https://towardsdatascience.com/30-python-best-practices-tips-and-tricks-caefb9f8c5f5

本文為 CSDN 翻譯,轉載請註明來源出處。

關鍵字: