天天看點

如何在一場面試中展現你對Python的coding能力?

如果你已經通過了招聘人員的電話面試,那麼下面正是該展現你代碼能力的時候了。無論是練習,作業,還是現場白闆面試,這都是你證明自己的代碼技巧的時刻。

我們知道面試官常常會出一些題讓你來解決,作為一名程式員,除了需要具備解決問題的思路以外,代碼的品質和簡潔性也很關鍵。因為從一個人的代碼可以直接看出你的基本功。對于Python而言,這就意味着你需要對Python的内置功能和庫有很深入的了解。

本篇給大家介紹一些很強大的功能,它們能讓面試官眼前一亮,覺得你很進階,這可以很大程度上給你加分。對于這些功能,我們從Python内置函數開始,然後是Python對資料結構的天然支援,最後是Python強大的标準庫。

選擇正确的内置功能

Python有一個大型标準庫,但隻有一個内置函數的小型庫,這些函數總是可用的,不需要導入。它們每一個都值得我們仔細研究,但是在研究前,我還是給大家一些小的提示,尤其是在其中一些函數的情況下,可以用什麼替代更好。

1. 使用enumerate()而不是range()進行疊代

在面試中,這種情況可能比任何其他情況都要多:您有一個元素清單,您需要周遊清單,同時通路索引和值。

有一個名為FizzBuzz的經典編碼面試問題可以通過疊代索引和值來解決。在FizzBuzz中,你将獲得一個整數清單,任務是執行以下操作:

用“fizz”替換所有可被3整除的整數

用“buzz”替換所有可被5整除的整數

将所有可被3和5整除的整數替換為“fizzbuzz”

通常,開發人員将使用range()解決此問題:

>>> numbers = [45, 22, 14, 65, 97, 72]

>>> for i in range(len(numbers)):

...    if numbers[i] % 3 == 0 and numbers[i] % 5 == 0:

...        numbers[i] = 'fizzbuzz'

...    elif numbers[i] % 3 == 0:

...        numbers[i] = 'fizz'

...    elif numbers[i] % 5 == 0:

...        numbers[i] = 'buzz'

...

>>> numbers

['fizzbuzz', 22, 14, 'buzz', 97, 'fizz']

Range允許你通過索引通路數字元素,并且對于某些特殊情況也是一個很有用的工具。但在這種情況下,我們希望同時擷取每個元素的索引和值,更優雅的解決方案使用enumerate():

>>> for i, num in enumerate(numbers):

...    if num % 3 == 0 and num % 5 == 0:

...    elif num % 3 == 0:

...    elif num % 5 == 0:

對于每個元素,enumerate()傳回一個計數器和元素值。計數器預設為0,也是元素的索引。不想在0開始你的計數?隻需使用可選的start參數來設定偏移量:

>>> for i, num in enumerate(numbers, start=52):

...    print(i, num)

52 45

53 22

54 14

55 65

56 97

57 72

通過使用start參數,我們通路所有相同的元素,從第一個索引開始,但現在我們的計數從指定的整數值開始。

2. 使用遞推式構造清單而不是map()和filter() 

“我認為删除filter()和map()是非常有争議的。”  - Guido van Rossum,Python的創造者 

一般使用者可能錯誤地認為它沒有争議,但Guido有充分的理由想要從Python中删除map()和filter()。一個原因是Python支援遞推式構造清單,它通常更容易閱讀并支援與map()和filter()相同的功能。 

讓我們首先看看我們如何構造對map()的調用以及等效的遞推構造清單:

>>> numbers = [4, 2, 1, 6, 9, 7]

>>> def square(x):

...    return x*x

>>> list(map(square, numbers))

[16, 4, 1, 36, 81, 49]

>>> [square(x) for x in numbers]

使用map()和清單推導的兩種方法都傳回相同的值,但清單推導更容易閱讀和了解。下面我們可以對filter()及其等效的清單推導做同樣的事情:

>>> def is_odd(x):

...   return bool(x % 2)

>>> list(filter(is_odd, numbers))

[1, 9, 7]

>>> [x for x in numbers if is_odd(x)]

就像我們在map中看到的那樣,filter和清單推導方法傳回相同的值,但清單推導更容易了解。 

來自其他語言的開發人員可能不同意構造清單比map和filter更容易閱讀,但根據我的經驗,初學者能夠更直覺地寫出清單推導。但無論哪種方式,在編碼面試中使用清單推導很少會出錯,因為它會讓你知道Python中最常見的是什麼。

3. 使用斷點breakpoint()調試而不是print()

你可能通過在代碼中添加print并檢視列印出的内容來調試一個小問題。這種方法起初效果很好,但很快變得很麻煩。另外,在編碼面試設定中,你幾乎不希望在整個代碼中調用print()。 

相反,你應該使用調試器。對于不是很瑣碎的錯誤,它幾乎總是比使用print()更快,并且鑒于調試是編寫軟體的重要部分,它表明你知道如何使用可以在工作中快速開發的工具。 

如果你使用的是Python 3.7,則無需導入任何内容,隻需在代碼中要放入調試器的位置調用breakpoint():

# Some complicated code with bugs

breakpoint()

調用breakpoint()會将你帶入pdb,這是預設的Python調試器。在Python 3.6及更早版本中,你可以通過顯式導入pdb來執行相同的操作:

像breakpoint()一樣,pdb.set_trace()會将你帶入pdb調試器。它不是那麼簡潔,而且需要記住的多一點。你可能想要嘗試其他調試器,但pdb是标準庫的一部分,是以它始終可用。無論你喜歡哪種調試器,在進行編碼面試設定之前,都值得嘗試使用它們來适應工作流程。

4. 使用f-Strings格式化字元串 

Python有很多不同的方法來處理字元串格式化,有時候不知道使用哪個。在coding的面試中,如果使用Python 3.6+,建議的格式化方法是Python的f-strings。 

f-strings支援使用字元串格式化迷你語言,以及強大的字元串插值。這些功能允許你添加變量甚至有效的Python表達式,并在添加到字元串之前在運作時對它們進行評估:

>>> def get_name_and_decades(name, age):

...    return f"My name is {name} and I'm {age / 10:.5f} decades old."

>>> get_name_and_decades("Maria", 31)

My name is Maria and I'm 3.10000 decades old.

f-string允許你将Maria放入字元串中,并在一個簡潔的操作中添加具有所需格式的年齡。需要注意的一個風險是,如果你輸出使用者生成的值,那麼可能會帶來安全風險,在這種情況下,模闆字元串可能是更安全的選擇。

5. 使用sorted()對複雜清單進行排序

大量的編碼面試問題需要進行某種排序,并且有多種有效的方法可以進行排序。除非面試官希望你實作自己的排序算法,否則通常最好使用sorted()。你可能已經看到了排序的最簡單用法,例如按升序或降序排序數字或字元串清單:

>>> sorted([6,5,3,7,2,4,1])

[1, 2, 3, 4, 5, 6, 7]

>>> sorted(['cat', 'dog', 'cheetah', 'rhino', 'bear'], reverse=True)

['rhino', 'dog', 'cheetah', 'cat', 'bear]

預設情況下,sorted()已按升序對輸入進行排序,而reverse關鍵字參數則按降序排序。

值得了解的是可選關鍵字key,它允許你在排序之前指定将在每個元素上調用的函數。添加函數允許自定義排序規則,如果要對更複雜的資料類型進行排序,這些規則特别有用:

>>> animals = [

...    {'type': 'penguin', 'name': 'Stephanie', 'age': 8},

...    {'type': 'elephant', 'name': 'Devon', 'age': 3},

...    {'type': 'puma', 'name': 'Moe', 'age': 5},

... ]

>>> sorted(animals, key=lambda animal: animal['age'])

[

   {'type': 'elephant', 'name': 'Devon', 'age': 3},

   {'type': 'puma', 'name': 'Moe', 'age': 5},

   {'type': 'penguin', 'name': 'Stephanie, 'age': 8},

]

通過傳入一個傳回每個元素年齡的lambda函數,可以輕松地按每個字典的單個值對字典清單進行排序。在這種情況下,字典現在按年齡按升序排序。

有效利用資料結構

算法在面試中得到了很多關注,但資料結構可能更為重要。在coding面試環境中,選擇正确的資料結構會對性能産生重大影響。除了理論資料結構之外,Python還在其标準資料結構實作中内置了強大而友善的功能。這些資料結構在面試中非常有用,因為它們預設為你提供了許多功能,讓你可以将時間集中在問題的其他部分。

1. 使用set存儲唯一值

我們通常需要從現有資料集中删除重複元素。新的開發人員有時會在清單應該使用集合時執行此操作,這會強制執行所有元素的唯一性。

假裝你有一個名為get_random_word()的函數。它将始終從一小組單詞中傳回一個随機選擇:

你應該重複調用get_random_word()以擷取1000個随機單詞,然後傳回包含每個唯一單詞的資料結構。以下是兩種常見的次優方法和一種好的方法。

糟糕的方法

get_unique_words()将值存儲在清單中,然後将清單轉換為集合:

>>> def get_unique_words():

...    words = []

...    for _ in range(1000):

...        words.append(get_random_word())

...    return set(words)

>>> get_unique_words()

{'world', 'all', 'the', 'words'}

這種方法并不可怕,但它不必要地建立了一個清單,然後将其轉換為集合。面試官幾乎總是注意到(并詢問)這種類型的設計選擇。

更糟糕的做法

為避免從清單轉換為集合,你現在可以在不使用任何其他資料結構的情況下将值存儲在清單中。然後,通過将新值與清單中目前的所有元素進行比較來測試唯一性:

這比第一種方法更糟糕,因為你必須将每個新單詞與清單中已有的每個單詞進行比較。這意味着随着單詞數量的增加,查找次數呈二次方式增長。換句話說,時間複雜度在O(N^2)的量級上增長。 

優秀的方法 

現在,你完全跳過使用清單,而是從頭開始使用一組:

...    words = set()

...        words.add(get_random_word())

...    return words

除了從頭開始使用集合之外,這可能與其他方法沒有太大的不同。如果你考慮.add()中發生了什麼,它甚至聽起來像第二種方法:得到單詞,檢查它是否已經在集合中,如果沒有,則将其添加到資料結構中。 

那麼為什麼使用與第二種方法不同的集合呢? 

它們是不同的,因為集合存儲元素的方式允許接近恒定時間檢查值是否在集合中,而不像需要線性時間查找的清單。查找時間的差異意味着添加到集合的時間複雜度以O(N)的速率增長,這在大多數情況下比第二種方法的O(N^2)好得多。

2. 使用生成器節省記憶體

前面提到,清單推導是友善的工具,但有時會導緻不必要的記憶體使用。想象一下,你被要求找到前1000個完美正方形的總和,從1開始。你知道清單推導,是以你快速編寫一個有效的解決方案:

>>> sum([i * i for i in range(1, 1001)])

333833500

解決方案會列出1到1,000,000之間的每個完美平方,并對值進行求和。你的代碼會傳回正确的答案,但随後您的面試官會開始增加您需要總和的完美正方形的數量。 

起初,你的功能不斷彈出正确的答案,但很快就開始放慢速度,直到最後這個過程似乎永遠持續下去。這不是你想要在面試中發生的一件事。 

這裡發生了什麼? 

它正在列出你要求的每個完美的方塊,并将它們全部加起來。具有1000個完美正方形的清單在計算機術語中可能不會很大,但是1億或10億是相當多的資訊,并且很容易占用計算機的可用記憶體資源。這就是這裡發生的事情。

值得慶幸的是,有一種解決記憶體問題的快捷方法。你隻需用括号替換方括号:

>>> sum((i * i for i in range(1, 1001)))

換出括号會将清單推導更改為生成器表達式。當你知道要從序列中檢索資料,但不需要同時通路所有資料的時候,生成器表達式非常适合。 

生成器表達式傳回生成器對象,而不是建立清單。該對象知道它在目前狀态中的位置(例如,i = 49)并且僅在被要求時計算下一個值。 

是以,當sum通過重複調用.__ next __()來疊代生成器對象時,生成器檢查i

等于多少,計算i * i,在内部遞增i,并将正确的值傳回到sum。該設計允許生成器用于大量資料序列,因為一次隻有一個元素存在于記憶體中。

3. 使用.get()和.setdefault()在字典中定義預設值 

最常見的程式設計任務之一涉及添加,修改或檢索可能在字典中或可能不在字典中的項。Python字典具有優雅的功能,可以使這些任務簡潔明了,但開發人員通常會在不需要時檢查值。 

想象一下,你有一個名為cowboy的字典,你想得到那個cowboy的名字。一種方法是使用條件顯式檢查key:

>>> cowboy = {'age': 32, 'horse': 'mustang', 'hat_size': 'large'}

>>> if 'name' in cowboy:

...    name = cowboy['name']

... else:

...    name = 'The Man with No Name'

>>> name

'The Man with No Name'

此方法首先檢查字典中是否存在name鍵,如果存在,則傳回相應的值。否則,它傳回預設值。 

雖然清楚地檢查key确實有效,但如果使用.get(),它可以很容易地用一行代替:

get()執行與第一種方法相同的操作,但現在它們會自動處理。如果key存在,則傳回适當的值。否則,将傳回預設值。 

但是,如果你想在仍然通路name的key時使用預設值更新字典呢? .get()在這裡沒有真正幫助你,是以你隻需要再次顯式檢查這個值:

>>> if 'name' not in cowboy:

...    cowboy['name'] = 'The Man with No Name'

>>> name = cowboy['name']

檢查values并設定預設值是一種有效的方法,并且易于閱讀,但Python再次使用.setdefault()提供了更優雅的方法:

.setdefault()完成與上面代碼片段完全相同的操作。它檢查cowboy中是否存在名稱,如果是,則傳回該值。否則,它将cowboy ['name']設定為The Man with No Name并傳回新值。

利用Python的标準庫

預設情況下,Python提供了許多功能,這些功能隻是一個導入語句。它本身就很強大,但知道如何利用标準庫可以增強你的編碼面試技巧。

從所有可用子產品中挑選最有用的部分很困難,是以本節将僅關注其實用功能的一小部分。希望這些對您在編碼訪談中有用,并且您希望了解更多有關這些和其他子產品的進階功能的資訊。

1. 使用collections.defaultdict()處理缺少的字典鍵 

當你為單個鍵設定預設值時,.get()和.setdefault()可以正常工作,但通常需要為所有可能的未設定鍵設定預設值,尤其是在面試環境中進行程式設計時。 

假裝你有一群學生,你需要記錄他們在家庭作業上的成績。輸入值是具有格式(student_name,grade)的元組清單,但是你希望輕松查找單個學生的所有成績而無需疊代清單。 

存儲成績資料的一種方法是使用将學生姓名映射到成績清單的字典:

>>> student_grades = {}

>>> grades = [

...    ('elliot', 91),

...    ('neelam', 98),

...    ('bianca', 81),

...    ('elliot', 88),

>>> for name, grade in grades:

...    if name not in student_grades:

...        student_grades[name] = []

...    student_grades[name].append(grade)

>>> student_grades

{'elliot': [91, 88], 'neelam': [98], 'bianca': [81]}

在這種方法中,你疊代學生并檢查他們的名字是否已經是字典中的屬性。如果沒有,則将它們添加到字典中,并将空清單作為預設值。然後将實際成績附加到該學生的成績清單中。

但是有一個更簡潔的方法,可以使用defaultdict,它擴充了标準的dict功能,允許你設定一個預設值,如果key不存在,它将按預設值操作:

>>> from collections import defaultdict

>>> student_grades = defaultdict(list)

在這種情況下,你将建立一個defaultdict,它使用不帶參數的list構造函數作為預設方法。沒有參數的list傳回一個空清單,是以如果名稱不存在則defaultdict調用list(),然後再把學生成績添加上。如果你想更炫一點,你也可以使用lambda函數作為值來傳回任意常量。

利用defaultdict可以使代碼更簡潔,因為你不必擔心key的預設值。相反,你可以在defaultdict裡處理它們一次,然後key就終存在了。

2. 使用collections.Counter計算Hashable對象 

假如你有一長串沒有标點符号或大寫字母的單詞,你想要計算每個單詞出現的次數。 

你可以使用字典或defaultdict增加計數,但collections.Counter提供了一種更清晰,更友善的方法。 Counter是dict的子類,它使用0作為任何缺失元素的預設值,并且更容易計算對象的出現次數:

>>> from collections import Counter

>>> words = "if there was there was but if \

... there was not there was not".split()

>>> counts = Counter(words)

>>> counts

Counter({'if': 2, 'there': 4, 'was': 4, 'not': 2, 'but': 1})

當你将單詞清單傳遞給Counter時,它會存儲每個單詞以及該單詞在清單中出現的次數。

如果你好奇兩個最常見的詞是什麼?隻需使用.most_common():

>>> counts.most_common(2)

[('there', 4), ('was', 4)]

.most-common()是一個友善的方法,隻需按計數傳回n個最頻繁的輸入。

3. 使用字元串常量通路公共字元串組

現在有一個瑣事需要判斷!‘A’>‘a’是真是假?

這是假的,因為A的ASCII代碼是65,但a是97,65不大于97。為什麼答案很重要?因為如果你想檢查一個字元是否是英語字母表的一部分,一種流行的方法是看它是否在A和Z之間(在ASCII圖表上是65和122)。

檢查ascii代碼是可行的,但是在面試時卻很笨拙,很容易弄亂,特别是當你記不清是小寫還是大寫的ascii字元排在第一位的時候。這時候,使用定義在字元串子產品中的常量要容易得多。

你可以使用is_upper(),它傳回字元串中的所有字元是否都是大寫字母:

>>> import string

>>> def is_upper(word):

...    for letter in word:

...        if letter not in string.ascii_uppercase:

...            return False

...    return True

>>> is_upper('Thanks Geir')

False

>>> is_upper('LOL')

True

is_upper()疊代word中的字母,并檢查字母是否為string.ascii_大寫字母的一部分。如果你列印出string.ascii_大寫,你會發現它隻是一個字元串,該值設定為文本“ABCDEFGHIJKLMNOPQRSTUVWXYZ”。

所有字元串常量都隻是經常引用的字元串值的字元串。其中包括以下内容:

<code>string.ascii_letters</code>

<code>string.ascii_uppercase</code>

<code>string.ascii_lowercase</code>

<code>string.digits</code>

<code>string.hexdigits</code>

<code>string.octdigits</code>

<code>string.punctuation</code>

<code>string.printable</code>

<code>string.whitespace</code>

這些更容易使用,更重要的是,更容易閱讀。

4. 使用Itertools生成排列群組合

面試官喜歡給出真實生活的場景,讓面試看起來不那麼吓人,是以這裡有一個人為的例子:你去遊樂園,決定找出每一對可能坐在過山車上的朋友。

除非生成這些配對是面試問題的主要目的,否則很可能生成所有可能的配對隻是朝着工作算法前進的一個乏味的步驟。你可以自己用嵌套for循環計算它們,也可以使用強大的itertools庫。

itertools有多個工具來生成可重複輸入資料序列,但現在我們隻關注兩個常見函數:itertools.permutations()和itertools.combinations()。

itertools.permutations()建構所有排列的清單,這意味着它是輸入值的每個可能分組的清單,其長度與count參數比對。r關鍵字參數允許我們指定每個分組中有多少值:

&gt;&gt;&gt; import itertools

&gt;&gt;&gt; friends = ['Monique', 'Ashish', 'Devon', 'Bernie']

&gt;&gt;&gt; list(itertools.permutations(friends, r=2))

[('Monique', 'Ashish'), ('Monique', 'Devon'), ('Monique', 'Bernie'),

('Ashish', 'Monique'), ('Ashish', 'Devon'), ('Ashish', 'Bernie'),

('Devon', 'Monique'), ('Devon', 'Ashish'), ('Devon', 'Bernie'),

('Bernie', 'Monique'), ('Bernie', 'Ashish'), ('Bernie', 'Devon')]

對于排列,元素的順序很重要,是以(“sam”、“devon”)表示與(“devon”、“sam”)不同的配對,這意味着它們都将包含在清單中。

itertools.combinations()生成組合。這些也是輸入值的可能分組,但現在值的順序無關緊要。因為(‘sam’、‘devon’)和(‘devon’、‘sam’)代表同一對,是以輸出清單中隻會包含它們中的一個:

&gt;&gt;&gt; list(itertools.combinations(friends, r=2))

('Ashish', 'Devon'), ('Ashish', 'Bernie'), ('Devon', 'Bernie')]

由于值的順序與組合有關,是以同一輸入清單的組合比排列少。同樣,因為我們将r設定為2,是以每個分組中都有兩個名稱。

.combinations和.permutations隻是強大庫的一個小例子,但是當你試圖快速解決算法問題時,即使這兩個函數也非常有用。

在下一次面試中,你可以放心地使用一些不太常見但功能更強大的标準特性。從整體上來說,要了解該語言有很多東西,但本文應該為大家提供一個起點,讓大家能夠更深入地了解該語言,同時在面試時更有效地使用Python。

原文:

https://realpython.com/python-coding-interview-tips/