大資料：分享大資料之基礎文法

1 計算機理論介紹

2 程式設計基礎--進制分類、進制轉換

進制

就是進位制。指的是我們來表示一個數字的時候進位的制度。

進制分類

計算機中，常用的進制有以下幾種:

	描述	示例	備注
二進制	使用0和1來描述所有的自然數	0, 1, 10, 11, 100, 101	使用 `0b` 開頭
八進制	使用0-7來描述所有的自然數	4, 5, 6, 7, 10, 11, 12
十進制	使用0-9來描述所有的自然數	6, 7, 8, 9, 10, 11, 12
十六進制	使用0-9, a-f來描述所有的自然數	9, A, B, C, D, E, F, 10	`0x`

進制轉換

十進制轉其他進制
- 輾轉相除法，用數字除進制，再用商除進制，一直到商為零結束，最後将每一步得到的餘數倒着連接配接
其他進制轉十進制
- 每一位的數字乘進制的位數-1次方，再将所有的結果累加到一起
二進制與八進制之間的互相轉換
- 每一個八進制位可以等價替換成三個二進制位
- 每一個十六進制位可以等價替換成四個二進制位

原碼、反碼、補碼

正數	負數
原碼	由數字直接計算出的二進制表示形式	最高位表示符号位: 0代表正數, 1代表負數
反碼	與原碼相同	符号位不變, 其他位按位取反
補碼	與原碼、反碼相同	反碼 + 1

注意事項:

資料的存儲與運算都是以補碼的形式進行的
補碼與補碼運算的結果還是補碼
對補碼再求一次補, 可以得到原碼

3 什麼是Java

Java是一種面向對象的程式設計語言，可以使用這種語言編寫程式，實作我們想要的一些功能。主要分三塊:

J2SE: Java的标準版，用于标準的應用程式開發。

J2ME: Java的微型版，常用于移動端的開發。

J2EE: Java的企業版，用于企業級的應用服務開發。

Java程式的運作，需要先将.java源檔案編譯成.class位元組碼檔案，然後由jvm虛拟機将這些位元組碼檔案翻譯成機器語言，然後執行相應的操作。

常用名詞解釋

JDK: Java Development Kit, Java開發架構, 開發Java程式需要用到的各種工具包。

JRE: Java Runtime Envrioment, Java運作時環境。

JVM: Java Virtual Mechine, Java虛拟機, 能夠運作Java程式

1.2.4 常用DOS指令

cd: 切換到指定的路徑
dir: 列舉目前目錄下的所有檔案和檔案夾
mkdir: 建立檔案夾
rmdir: 删除檔案夾

1.2.5 JDK的安裝與環境變量的配置

JDK的安裝
- 找到對應的版本号, 直接安裝即可
- 安裝完成後, 在 jdk 的 bin 目錄下, 有編譯運作Java程式所需要的指令
環境變量的配置
- 為什麼要配置環境變量
  - 因為我們需要使用bin目錄下的javac和java指令來編譯和運作程式, 而使用這兩個程式的話, 就需要先用cd切到指定路徑下才能執行, 并且參數需要寫java檔案所在的目錄, 是以在編譯和運作程式的時候非常不友善。是以需要将bin目錄添加到環境變量, 這樣我們就可以在任意的路徑下使用javac和java指令,來對我們的程式進行編譯和運作。
- 怎麼配置環境變量
  - 我的電腦 -> 右鍵 -> 屬性 -> 進階系統設定 -> 環境變量
  - 選擇系統變量 -> Path -> 編輯
    - win10: 建立一個變量,将jdk下面的bin目錄粘貼進去,并上移到最上方
    - win7/8: 将jdk下面的bin目錄的路徑粘貼到所有路徑的最前方,然後添加一個路徑分隔符;
- 怎麼驗證環境變量是否配置成功
  - 建立一個DOS視窗, 輸入指令 javac, 如果沒有錯誤提示就是是成功

1.2.6 注釋

注釋是對代碼的描述, 是開發者寫給自己或者别人看的, 相當于我們記錄的一些筆記, 或者備忘錄。注釋部分的内容不會被編譯, 是以沒有文法上的要求。

注釋可以分為三類:

單行注釋: 以兩個 // 開頭, 後面的一行内容會被注釋
多行注釋: 以一個 / 開頭, 以一個 / 結尾。中間所有的内容都會被注釋
文檔注釋: 以 /* 開頭, / 結尾。文檔注釋中可以添加一些标簽,更友善的記錄程式的資訊

1.2.7 資料類型

在程式中, 我們需要操作各種各樣的資料, 這些資料都有各自不同的類型。

Java中, 所有的資料可以分為兩大類: 基本資料類型和引用資料類型

引用資料類型, 又叫做引用類型。在後面課程中具體說明。

基本資料類型, 又叫做值類型, 在Java中有以下分類:

整型
- 就是整數, 按照占用空間大小, 分為四種
- 位元組型: byte, 1byte, [-128, 127]
- 短整型: short, 2byte, [-2^15^, 2^15^-1]
- 整型: int, 4byte, [-2^31^, 2^31^-1]
- 長整型: long, 8byte, [-2^63^, 2^63^-1]
浮點型
- 就是小數, 按照占用空間大小, 分為兩種
- 單精度浮點型: float, 4byte
- 雙精度浮點型: double, 8byte
- 雙精度浮點型可以比單精度浮點型精确更多的小數點後面的位數
布爾型
- 用來描述程式中不是對的就是錯的, 不是真的就是假的資料
- boolean, 1byte
- 隻有兩個值: true / false
字元型
- 用來描述組成一個文本的最小單元
- char, 2byte
- 字元型的資料, 需要用單引号括起來, 單引号中隻能有一個字元, 不能多也不能少

1.2.8 辨別符

由若幹個字元組成的一個有序的序列, 用來描述程式中的一個資料

命名規則

隻能由字母、數字、下劃線和$符号組成
不能以數字作為開頭
不能與關鍵字和保留字同名
- 關鍵字: 系統占用的, 已經被賦予了特殊含義的字元序列
- 保留字: 系統占用的, 暫時還沒有特殊含義, 但是後續可能會用到的字元序列

命名規範

望文知意: 應該可以從辨別符的命名中看出想表述的資料含義
遵循駝峰命名法
- 大駝峰命名法: 所有的單詞首字母都大寫
- 小駝峰命名法: 首單詞除外, 從第二個單詞開始, 每個單詞的首字母都大寫

1.2.9 變量和常量

變量: 在程式運作的過程中, 數值可以發生改變的資料

常量: 在程式運作的過程中, 數值不可以發生改變的資料

在程式中的聲明

變量
- 資料類型辨別符;
- 資料類型辨別符 = 初始值;
- 資料類型辨別符1, 辨別符2, ...;
- 資料類型辨別符1 = 初始值, 辨別符2, 辨別符3 = 初始值, ...;
常量
- final 資料類型辨別符 = 初始值;
- final 資料類型辨別符; 辨別符 = 初始值;
- Java允許在聲明常量的時候不指派初始值, 可以延遲指派。但是指派隻能進行一次。

1.2.10 轉義字元

一個特殊的字元, 主要有兩個作用

可以将某些具有特殊含義的字元轉成普通字元
- 單引号, 用來比對一個字元的開始和結尾, 轉義字元可以使其成為一個普通的單引号
- 雙引号, 用來比對一個字元串的開始和結尾, 轉義字元可以使其成為一個普通的雙引号
可以配合某些普通字元使用, 使其沒有特殊含義
- n本身是一個普通字元, 配合轉義字元使用: n 表示換行
- t本身是一個普通字元, 配合轉義字元使用: t 表示tab
- r本身是一個普通字元, 配合轉義字元使用: r 表示return

1.2.11 資料類型轉換

一個變量聲明完成後, 在記憶體中已經開辟好了空間, 此時是不允許調整空間大小的, 也就是說這個變量的資料類型是不允許改變的。這裡說的資料類型轉換, 指的是聲明一個新的指定類型的變量, 将原來變量中的值拷貝到新的變量中。

資料類型轉換可以分為兩種:

自動類型轉換
- 又叫做隐式轉換, 一般是由取值範圍小的資料類型, 向取值範圍大的資料類型轉換
- 轉換過程不需要任何額外操作
- 轉換後, 沒有任何精度丢失情況
強制類型轉換
- 又叫做顯式轉換, 一般是由取值範圍大的資料類型, 向取值範圍小的資料類型轉換
- 轉換過程需要強制操作, 不能自動完成
- 轉換後, 可能會出現精度丢失的情況

java

byte a = 10;

int b = a; // 由 byte 類型轉型為 int 類型, 自動完成, 不需要任何額外操作

int c = 128;

byte d = (byte)c; // 由 int 類型轉型為 byte 類型, 強制操作, 會存在精度丢失

額外說明

byte, short, char 類型的資料在進行運算的時候, 會自動的轉型為int類型
浮點型轉整型, 會舍去小數點後面所有的内容, 隻保留整數部分

1.2.12 常用運算符

算術運算符

用來做基礎的算術計算, + - * / % ++ --

其中:

+ - * % 和數學計算中沒有差別
兩個整型的資料進行除法, 結果還是整型, 會将計算的浮點結果強轉成整型
自增運算符++, 用在變量前, 表示是前取變量值, 後對這個變量進行+1操作
自增運算符++, 用在變量後, 表示是先對這個變量進行+1操作, 然後再取變量值
自減同自增

int a = 10;

int b = a++; // b的值是10

int c = ++b; // c的值是11

指派運算符

=: 将等号右邊的值, 給左邊的變量進行指派

+=, -=, *=, /=, %=: 組合運算符, 對一個變量進行運算

a += 10; 等價于 a = a + 10

關系運算符

> < >= <= == !=

邏輯運算符

& : 與and

| : 或or

! : 非not

^ : 異或xor, 計算邏輯: 兩個相同為false, 兩個不同為true

&& :

短路與, 結果與邏輯與相同. 差別在于: 如果前面的結果可以決定整體的運算結果, 後面的表達式不參與運算

|| :

短路或, 結果與邏輯或相同. 差別在于: 如果前面的結果可以決定整體的運算結果, 後面的表達式不參與運算

位運算

位運算操作的是兩個整型的數字, 計算的邏輯就是将兩個整型的數字求出補碼, 再對補碼的每一位做類似于邏輯運算的操作, 其中 1 相當于 true, 0 相當于 false

三目運算符

condition ? expression1 : expression2

condition是一個boolean類型的變量, 或者一個boolean結果的表達式. 如果condition為true, 最終整體的結果取expression1, 否則, 結果取expression2

大資料：分享大資料之基礎文法

繼續閱讀

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method