途牛2019校招筆試-大資料

【不定項選擇】

本套試卷共一個部分，共20題，每題5分，總分100分。每題至少有1個正确選項，多選、少選或錯選不得分。

1.預設知識點多選題一般5分得分0分

MySQL 的binlog 日志格式不包含哪個

A: A. Statement

B: B. row

C: C. mixed

D: D. mixedlevel

正确答案：C

2.預設知識點多選題一般5分得分5分

下面對HBase的描述哪些是正确的？

A: A.不是開源的

B: B.是面向列的

C: C.是分布式的

D: D.是一種NoSQL資料庫

正确答案：B,C,D

3.預設知識點多選題一般5分得分5分

解壓.tar.gz結尾的HBase壓縮包使用的Linux指令是

A: A.tar -zxvf

B: B.tar -cf

C: C. tar -s

D: D.tar -nf

正确答案：A

4.預設知識點多選題一般5分得分5分

以下索引類型，哪個是MySQL資料庫的？

A: A.主鍵索引

B: B.全文索引

C: C.位圖索引

D: D.組合索引

正确答案：A,B,D

5.預設知識點多選題一般5分得分0分

下列屬于ORACLE的實體存儲結構的是

A: A.資料檔案

B: B.日志檔案

C: C.參數檔案

D: D.控制檔案

正确答案：A,B,D

6.預設知識點多選題一般5分得分0分

在SELECT語句的WHERE子句的條件表達式中，可以比對0個到多個字元的通配符是

A: A. *

B: B. %

C: C. _

D: D. ?

正确答案：B

7.預設知識點多選題一般5分得分5分

Oracle資料庫分區有哪些？

A: A.範圍分區

B: B.清單分區

C: C.散列分區

D: D.組合分區

正确答案：A,B,C,D

8.預設知識點多選題一般5分得分5分

資料庫事務有哪些特性？

A: A.原子性

B: B.一緻性

C: C.分離性

D: D.持久性

正确答案：A,B,C,D

9.預設知識點多選題一般5分得分5分

HDfS 中的 block 預設儲存幾份？

A: A.3 份

B: B.2 份

C: C.1 份

D: D.不确定

正确答案：A

10.預設知識點多選題一般5分得分5分

下列屬于ORACLE的邏輯結構的是

A: A.區

B: B.遊标

C: C.段

D: D.表空間

正确答案：A,C,D

11.數理邏輯多選題一般5分得分5分

畢業典禮後，某宿舍三位同學把自己的畢業帽扔了，随後每個人随機地拾起帽子，三個人中沒有人選到自己原來帶的帽子的機率是

A: A.1/2

B: B.1/3

C: C.1/4

D: D.1/6

正确答案：B

12.機器學習多選題一般5分得分0分

下面對內建學習模型中的弱學習者描述正确的是？

A: A. 他們經常不會過拟合

B: B. 他們通常帶有高偏差，是以其并不能解決複雜學習問題

C: C. 他們通常會過拟合

D: D.他們通常帶有低偏差，能解決複雜學習問題

正确答案：A,B

13.機器學習多選題一般5分得分5分

我們想要減少資料集中的特征數, 即降維. 選擇以下适合的方案 :

A: A. 使用前向特征選擇方法

B: B. 使用後向特征排除方法

C: C. 我們先把所有特征都使用, 去訓練一個模型, 得到測試集上的表現. 然後我們去掉一個特征, 再去訓練, 用交叉驗證看看測試集上的表現. 如果表現比原來還要好, 我們可以去除這個特征

D: D. 檢視相關性表, 去除相關性最高的一些特征

正确答案：A,B,C,D

14.機器學習多選題一般5分得分0分

下面關于L1範數和L2範數的說法正确的是

A: A. L1範數是對應參數向量絕對值之和

B: B. L2範數是對應參數向量的平方和，再求平方根

C: C. L2範式是為了防止機器學習的過拟合，提升模型的泛化能力

正确答案：A,B,C

15.機器學習多選題一般5分得分5分

對于随機森林和GradientBoosting Trees, 下面說法正确的是:

A: A. 在随機森林的單個樹中, 樹和樹之間是有依賴的, 而GradientBoosting Trees中的單個樹之間是沒有依賴的

B: B. 這兩個模型都使用随機特征子集, 來生成許多單個的樹

C: C. 我們可以并行地生成GradientBoosting Trees單個樹, 因為它們之間是沒有依賴的, GradientBoosting Trees訓練模型的表現總是比随機森林好

D: D. 以上都對

正确答案：B

16.機器學習多選題一般5分得分5分

影響聚類算法效果的主要原因有

A: 特征選取

B: 模式相似性測度

C: 分類準則

D: 已知類别的樣本品質

正确答案：A,B,C

17.機器學習多選題一般5分得分0分

以下哪些方法可以直接來對文本分類？

A: A. Kmeans

B: B. 決策樹

C: C. 支援向量機

D: D. KNN

正确答案：B,C,D

18.機器學習多選題容易5分得分5分

在一個線性回歸問題中，我們使用 R 平方（R-Squared）來判斷拟合度。此時，如果增加一個特征，模型不變，則下面說法正确的是？

A: 如果 R-Squared 增加，則這個特征有意義

B: 如果R-Squared 減小，則這個特征沒有意義

C: 僅看 R-Squared 單一變量，無法确定這個特征是否有意義。

D: 以上說法都不對

正确答案：C

19.預設知識點多選題較難5分得分5分

一句sql包含以下關鍵詞，(1):select (2):from (3):where (4):group by (5):having (6):order by,請問執行順序是怎麼樣的？

A: A.(2)(3)(1)(4)(5)(6)

B: B.(2)(1)(3)(4)(5)(6)

C: C.(2)(3)(1)(5)(4)(6)

D: D.(2)(3)(4)(5)(1)(6)

正确答案：D

20.機器學習多選題較難5分得分5分

以下說法正确的是

A: 判别模型對條件機率模組化

B: 生成模型對聯合機率分布模組化

C: 由生成模型可以得到判别模型

D: 由判别模型可以得到生成模型

正确答案：A,B,C

途牛2019校招筆試-大資料

繼續閱讀

iOS暑期面試總結最初的開始（iOS）

熱乎同花順筆試

程式員筆試之滴滴2021測試開發工程師程式設計題收集整理（七）

Find Median from Data Stream leetcode 295

STL學習--deque簡介特性面試題源碼（STL3.3）

vivo2021屆秋季校招線上程式設計[程式設計題]回文字元串

java中list和map的底層實作原理

力扣：146. LRU 緩存機制

實習生筆試

LeetCode 94 二叉樹中序周遊遞歸

樂鑫提前批數字IC設計筆試(西電宣講現場線下筆試2021/06/24)

機器學習/深度學習筆試面試——Logistics 回歸篇

12-字元個數統計

2019校招農行筆試範圍與經驗

2021年安全員-B證報名考試及安全員-B證模拟考試題庫

商湯科技2020筆試題