天天看點

百度資料挖掘工程師實習生筆試面試題

筆試題:

一、簡答題30分

1. extern”c”{}的作用好應用場景;

2.寫出兩者你熟悉的設計模式,及應用場景,可以給出僞代碼;

3.tcp中time_wait是表示那種狀态,及應用場景,以及起好處和壞處;

二、算法題40分

1. 有一個任務執行機,任務數n<1000,該機器每次隻能執行一個任務,而任務之間存在依賴關系,

但是任務之間沒有循環依賴,請給出适當的任務執行順序。算法、僞代碼,并分析其時間複雜度和

空間複雜度。

2. 編寫函數,統計在某段英文文本中完整句子的數目,文本中隻包括大小寫字母,空格,點好(.),逗号(,)。

完整的句子必須包含至少一個字母并以點号,結束。

要求:完整的代碼,達到目标;高效;簡潔;

三、系統架構30分

有一個監控系統,有大量的資料記錄包括{url,使用者通路ip,時間},要對這個監控系統進行維護,并提供查詢。

設計一個能存儲和維護1000億條記錄,實時監控,并支援一下兩種查詢:

1. 指定任意一個時間段(精确到分鐘)和某個url,查處這個時間段内的所有url的通路總量。

2. 指定任意一個時間段(精确到分鐘)和某個ip,查詢這個時間段内的ip通路總量。

面試一

1.自我介紹;結合自己的履歷簡單地介紹一下。

2.項目介紹;結合自己做主要的項目,以及帶的項目介紹資料,互動式地講解;面試官關系的是機器學習相關的問題。

3.算法題;二叉樹的非遞歸實作前序周遊;

4. 算法設計題;如何去掉重複頁面;

面試二

1. 自我介紹;(同上)

2. 項目介紹;(同上)

3. 算法題;(略)問到了一個ttest;

4. 算法設計題;如何對query進行分類;

面試三

1. 自我介紹;

2. 項目介紹;

3. 算法題兩道;

1>一串首尾相連的珠子(m個),有n種顔色(n《=10),設計一個算法,取出其中一段,要求包含所有n中顔色,并使長度最短。并分析時間複雜度與空間複雜度。

2>從1到1億,所有出現的數字的和(125=1+2+5),手工計算機出來;

我的感受:

1. 是對這次實習招聘,并無準備,筆試能通過已經很意外了;

2. 自己的算法題的解答能力有待提高,面試的時候遇到的題目其實都很常見,估計在網上多看看就都能答得很好了;

3. 百度筆試+三面的流程,大緻和網上講的差不多,前二次面試是類似的,三面可能是補充,并且往往會問道一些你職業規劃上的一些問題;

繼續閱讀