粘包和半包問題是資料傳輸中比較常見的問題,所謂的粘包問題是指資料在傳輸時,在一條消息中讀取到了另一條消息的部分資料,這種現象就叫做粘包。 比如發送了兩條消息,分别為“ABC”和“DEF”,那麼正常情況下接收端也應該收到兩條消息“ABC”和“DEF”,但接收端卻收到的是“ABCD”,像這種情況就叫做粘包,如下圖所示:
半包問題是指接收端隻收到了部分資料,而非完整的資料的情況就叫做半包。比如發送了一條消息是“ABC”,而接收端卻收到的是“AB”和“C”兩條資訊,這種情況就叫做半包,如下圖所示:
PS:大部分情況下我們都把粘包問題和半包問題看成同一個問題,是以下文就用“粘包”問題來替代“粘包”和“半包”問題。
1.為什麼會有粘包問題?
粘包問題發生在 TCP/IP 協定中,因為 TCP 是面向連接配接的傳輸協定,它是以“流”的形式傳輸資料的,而“流”資料是沒有明确的開始和結尾邊界的,是以就會出現粘包問題。
2.粘包問題代碼示範
接下來我們用代碼來示範一下粘包和半包問題,為了示範的直覺性,我會設定兩個角色:
- 伺服器端用來接收消息;
- 用戶端用來發送一段固定的消息。
然後通過列印伺服器端接收到的資訊來觀察粘包問題。
伺服器端代碼實作如下:
/**
* 伺服器端(隻負責接收消息)
*/
class ServSocket {
// 位元組數組的長度
private static final int BYTE_LENGTH = 20;
public static void main(String[] args) throws IOException {
// 建立 Socket 伺服器
ServerSocket serverSocket = new ServerSocket(8888);
// 擷取用戶端連接配接
Socket clientSocket = serverSocket.accept();
// 得到用戶端發送的流對象
try (InputStream inputStream = clientSocket.getInputStream()) {
while (true) {
// 循環擷取用戶端發送的資訊
byte[] bytes = new byte[BYTE_LENGTH];
// 讀取用戶端發送的資訊
int count = inputStream.read(bytes, 0, BYTE_LENGTH);
if (count > 0) {
// 成功接收到有效消息并列印
System.out.println("接收到用戶端的資訊是:" + new String(bytes));
}
count = 0;
}
}
}
}
用戶端實作代碼如下:
/**
* 用戶端(隻負責發送消息)
*/
static class ClientSocket {
public static void main(String[] args) throws IOException {
// 建立 Socket 用戶端并嘗試連接配接伺服器端
Socket socket = new Socket("127.0.0.1", 8888);
// 發送的消息内容
final String message = "Hi,Java.";
// 使用輸出流發送消息
try (OutputStream outputStream = socket.getOutputStream()) {
// 給伺服器端發送 10 次消息
for (int i = 0; i < 10; i++) {
// 發送消息
outputStream.write(message.getBytes());
}
}
}
}
以上程式的執行結果如下圖所示:
通過上述結果我們可以看出,伺服器端發生了粘包問題,因為用戶端發送了 10 次固定的“Hi,Java.”的消息,正确的結果應該是伺服器端也接收到了 10 次固定消息“Hi,Java.”才對,但實際執行結果并非如此。
3.解決方案
粘包問題的常見解決方案有以下 3 種:
- 發送方和接收方固定發送資料的大小,當字元長度不夠時用空字元彌補,有了固定大小之後就知道每條消息的具體邊界了,這樣就沒有粘包的問題了;
- 在 TCP 協定的基礎上封裝一層自定義資料協定,在自定義資料協定中,包含資料頭(存儲資料的大小)和 資料的具體内容,這樣服務端得到資料之後,通過解析資料頭就可以知道資料的具體長度了,也就沒有粘包的問題了;
- 以特殊的字元結尾,比如以“\n”結尾,這樣我們就知道資料的具體邊界了,進而避免了粘包問題(推薦方案)。
解決方案1:固定資料大小
收、發固定大小的資料,伺服器端的實作代碼如下:
用戶端的實作代碼如下:/** * 伺服器端,改進版本一(隻負責接收消息) */ static class ServSocketV1 { private static final int BYTE_LENGTH = 1024; // 位元組數組長度(收消息用) public static void main(String[] args) throws IOException { ServerSocket serverSocket = new ServerSocket(9091); // 擷取到連接配接 Socket clientSocket = serverSocket.accept(); try (InputStream inputStream = clientSocket.getInputStream()) { while (true) { byte[] bytes = new byte[BYTE_LENGTH]; // 讀取用戶端發送的資訊 int count = inputStream.read(bytes, 0, BYTE_LENGTH); if (count > 0) { // 接收到消息列印 System.out.println("接收到用戶端的資訊是:" + new String(bytes).trim()); } count = 0; } } } }
以上代碼的執行結果如下圖所示:/** * 用戶端,改進版一(隻負責接收消息) */ static class ClientSocketV1 { private static final int BYTE_LENGTH = 1024; // 位元組長度 public static void main(String[] args) throws IOException { Socket socket = new Socket("127.0.0.1", 9091); final String message = "Hi,Java."; // 發送消息 try (OutputStream outputStream = socket.getOutputStream()) { // 将資料組裝成定長位元組數組 byte[] bytes = new byte[BYTE_LENGTH]; int idx = 0; for (byte b : message.getBytes()) { bytes[idx] = b; idx++; } // 給伺服器端發送 10 次消息 for (int i = 0; i < 10; i++) { outputStream.write(bytes, 0, BYTE_LENGTH); } } } }
優缺點分析
從以上代碼可以看出,雖然這種方式可以解決粘包問題,但這種固定資料大小的傳輸方式,當資料量比較小時會使用空字元來填充,是以會額外的增加網絡傳輸的負擔,是以不是理想的解決方案。解決方案2:自定義請求協定
這種解決方案的實作思路是将請求的資料封裝為兩部分:消息頭(發送的資料大小)+消息體(發送的具體資料),它的格式如下圖所示:
此解決方案的實作分為以下 3 部分:
- 編寫一個消息封裝類
- 編寫用戶端
- 編寫伺服器端
接下來我們一一來實作。
① 消息封裝類
消息的封裝類中提供了兩個方法:一個是将消息轉換成消息頭 + 消息體的方法,另一個是讀取消息頭的方法,具體實作代碼如下:
/**
* 消息封裝類
*/
class SocketPacket {
// 消息頭存儲的長度(占 8 位元組)
static final int HEAD_SIZE = 8;
/**
* 将協定封裝為:協定頭 + 協定體
* @param context 消息體(String 類型)
* @return byte[]
*/
public byte[] toBytes(String context) {
// 協定體 byte 數組
byte[] bodyByte = context.getBytes();
int bodyByteLength = bodyByte.length;
// 最終封裝對象
byte[] result = new byte[HEAD_SIZE + bodyByteLength];
// 借助 NumberFormat 将 int 轉換為 byte[]
NumberFormat numberFormat = NumberFormat.getNumberInstance();
numberFormat.setMinimumIntegerDigits(HEAD_SIZE);
numberFormat.setGroupingUsed(false);
// 協定頭 byte 數組
byte[] headByte = numberFormat.format(bodyByteLength).getBytes();
// 封裝協定頭
System.arraycopy(headByte, 0, result, 0, HEAD_SIZE);
// 封裝協定體
System.arraycopy(bodyByte, 0, result, HEAD_SIZE, bodyByteLength);
return result;
}
/**
* 擷取消息頭的内容(也就是消息體的長度)
* @param inputStream
* @return
*/
public int getHeader(InputStream inputStream) throws IOException {
int result = 0;
byte[] bytes = new byte[HEAD_SIZE];
inputStream.read(bytes, 0, HEAD_SIZE);
// 得到消息體的位元組長度
result = Integer.valueOf(new String(bytes));
return result;
}
}
② 用戶端
用戶端中我們添加一組待發送的消息,随機給伺服器端發送一個消息,實作代碼如下:
/**
* 用戶端
*/
class MySocketClient {
public static void main(String[] args) throws IOException {
// 啟動 Socket 并嘗試連接配接伺服器
Socket socket = new Socket("127.0.0.1", 9093);
// 發送消息合集(随機發送一條消息)
final String[] message = {"Hi,Java.", "Hi,SQL~", "關注公衆号|Java中文社群."};
// 建立協定封裝對象
SocketPacket socketPacket = new SocketPacket();
try (OutputStream outputStream = socket.getOutputStream()) {
// 給伺服器端發送 10 次消息
for (int i = 0; i < 10; i++) {
// 随機發送一條消息
String msg = message[new Random().nextInt(message.length)];
// 将内容封裝為:協定頭+協定體
byte[] bytes = socketPacket.toBytes(msg);
// 發送消息
outputStream.write(bytes, 0, bytes.length);
outputStream.flush();
}
}
}
}
③ 伺服器端
伺服器端使用線程池來處理每個用戶端的業務請求,實作代碼如下:
/**
* 伺服器端
*/
class MySocketServer {
public static void main(String[] args) throws IOException {
// 建立 Socket 伺服器端
ServerSocket serverSocket = new ServerSocket(9093);
// 擷取用戶端連接配接
Socket clientSocket = serverSocket.accept();
// 使用線程池處理更多的用戶端
ThreadPoolExecutor threadPool = new ThreadPoolExecutor(100, 150, 100,
TimeUnit.SECONDS, new LinkedBlockingQueue<>(1000));
threadPool.submit(() -> {
// 用戶端消息處理
processMessage(clientSocket);
});
}
/**
* 用戶端消息處理
* @param clientSocket
*/
private static void processMessage(Socket clientSocket) {
// Socket 封裝對象
SocketPacket socketPacket = new SocketPacket();
// 擷取用戶端發送的消息對象
try (InputStream inputStream = clientSocket.getInputStream()) {
while (true) {
// 擷取消息頭(也就是消息體的長度)
int bodyLength = socketPacket.getHeader(inputStream);
// 消息體 byte 數組
byte[] bodyByte = new byte[bodyLength];
// 每次實際讀取位元組數
int readCount = 0;
// 消息體指派下标
int bodyIndex = 0;
// 循環接收消息頭中定義的長度
while (bodyIndex <= (bodyLength - 1) &&
(readCount = inputStream.read(bodyByte, bodyIndex, bodyLength)) != -1) {
bodyIndex += readCount;
}
bodyIndex = 0;
// 成功接收到用戶端的消息并列印
System.out.println("接收到用戶端的資訊:" + new String(bodyByte));
}
} catch (IOException ioException) {
System.out.println(ioException.getMessage());
}
}
}
以上程式的執行結果如下:
從上述結果可以看出,消息通訊正常,用戶端和伺服器端的互動中并沒有出現粘包問題。
優缺點分析
此解決方案雖然可以解決粘包問題,但消息的設計和代碼的實作複雜度比較高,是以也不是理想的解決方案。
解決方案3:特殊字元結尾
以特殊字元結尾就可以知道流的邊界了,它的具體實作是:使用 Java 中自帶的
BufferedReader
和
BufferedWriter
,也就是帶緩沖區的輸入字元流和輸出字元流,通過寫入的時候加上
\n
來結尾,讀取的時候使用
readLine
按行來讀取資料,這樣就知道流的邊界了,進而解決了粘包的問題。
伺服器端實作代碼如下:
/**
* 伺服器端,改進版三(隻負責收消息)
*/
static class ServSocketV3 {
public static void main(String[] args) throws IOException {
// 建立 Socket 伺服器端
ServerSocket serverSocket = new ServerSocket(9092);
// 擷取用戶端連接配接
Socket clientSocket = serverSocket.accept();
// 使用線程池處理更多的用戶端
ThreadPoolExecutor threadPool = new ThreadPoolExecutor(100, 150, 100,
TimeUnit.SECONDS, new LinkedBlockingQueue<>(1000));
threadPool.submit(() -> {
// 消息處理
processMessage(clientSocket);
});
}
/**
* 消息處理
* @param clientSocket
*/
private static void processMessage(Socket clientSocket) {
// 擷取用戶端發送的消息流對象
try (BufferedReader bufferedReader = new BufferedReader(
new InputStreamReader(clientSocket.getInputStream()))) {
while (true) {
// 按行讀取用戶端發送的消息
String msg = bufferedReader.readLine();
if (msg != null) {
// 成功接收到用戶端的消息并列印
System.out.println("接收到用戶端的資訊:" + msg);
}
}
} catch (IOException ioException) {
ioException.printStackTrace();
}
}
}
PS:上述代碼使用了線程池來解決多個用戶端同時通路伺服器端的問題,進而實作了一對多的伺服器響應。
用戶端的實作代碼如下:
/**
* 用戶端,改進版三(隻負責發送消息)
*/
static class ClientSocketV3 {
public static void main(String[] args) throws IOException {
// 啟動 Socket 并嘗試連接配接伺服器
Socket socket = new Socket("127.0.0.1", 9092);
final String message = "Hi,Java."; // 發送消息
try (BufferedWriter bufferedWriter = new BufferedWriter(
new OutputStreamWriter(socket.getOutputStream()))) {
// 給伺服器端發送 10 次消息
for (int i = 0; i < 10; i++) {
// 注意:結尾的 \n 不能省略,它表示按行寫入
bufferedWriter.write(message + "\n");
// 重新整理緩沖區(此步驟不能省略)
bufferedWriter.flush();
}
}
}
}
以上代碼的執行結果如下圖所示:
優缺點分析
以特殊符号作為粘包的解決方案的最大優點是實作簡單,但存在一定的局限性,比如當一條消息中間如果出現了結束符就會造成半包的問題,是以如果是複雜的字元串要對内容進行編碼和解碼處理,這樣才能保證結束符的正确性。
總結
粘包和半包問題是資料傳輸中比較常見的問題,它的解決方案有很多,比較常見的解決方案有:設定固定的資料傳輸大小、自定義請求協定的封裝,在請求頭中加入傳輸資料的長度、使用特殊符号作為結束符等。
是非審之于己,毀譽聽之于人,得失安之于數。
公衆号:Java面試真題解析
面試合集:https://gitee.com/mydb/interview
關注下面二維碼,訂閱更多精彩内容。
關注公衆号(加好友):
作者:
王磊的部落格
出處:
http://vipstone.cnblogs.com/