天天看點

DELL R710伺服器當機案例(2)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

<code>我的部落格已遷移到xdoujiang.com請去那邊和我交流</code>

<code>May 10 10:54:29 sd 0: 2:0:0: megasas: RESET -936872901 cmd=2a</code>

<code>May 10 10:54:29 10.1.1.1 megasas: [ 0]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:34 10.1.1.1 megasas: [ 5]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:39 10.1.1.1 megasas: [10]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:44 10.1.1.1 megasas: [15]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:49 10.1.1.1 megasas: [20]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:54 10.1.1.1 megasas: [25]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:59 10.1.1.1 megasas: [30]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:04 10.1.1.1 megasas: [35]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:09 10.1.1.1 megasas: [40]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:14 10.1.1.1 megasas: [45]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:19 10.1.1.1 megasas: [50]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:24 10.1.1.1 megasas: [55]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:29 10.1.1.1 megasas: [60]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:34 10.1.1.1 megasas: [65]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:39 10.1.1.1 megasas: [70]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:44 10.1.1.1 megasas: [75]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:49 10.1.1.1 megasas: [80]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:54 10.1.1.1 megasas: [85]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:59 10.1.1.1 megasas: [90]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:04 10.1.1.1 megasas: [95]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:09 10.1.1.1 megasas: [100]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:14 10.1.1.1 megasas: [105]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:19 10.1.1.1 megasas: [110]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:24 10.1.1.1 megasas: [115]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:29 10.1.1.1 megasas: [120]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:34 10.1.1.1 megasas: [125]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:39 10.1.1.1 megasas: [130]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:44 10.1.1.1 megasas: [135]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:49 10.1.1.1 megasas: [140]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:54 10.1.1.1 megasas: [145]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:59 10.1.1.1 megasas: [150]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:04 10.1.1.1 megasas: [155]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:09 10.1.1.1 megasas: [160]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:15 10.1.1.1 megasas: [165]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:20 10.1.1.1 megasas: [170]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:25 10.1.1.1 megasas: [175]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:30 10.1.1.1 megasas: failed to </code><code>do</code> <code>reset</code>

<code>May 10 10:57:30 sd 0: 2:0:0: megasas: RESET -936872901 cmd=2a</code>

<code>May 10 10:57:30 10.1.1.1 megasas: cannot recover from previous reset failures</code>

<code>May 10 10:57:30 sd 0: 2:0:0: scsi: Device offlined - not ready after error recovery</code>

<code>May 10 10:57:30 sd 0: 2:0:0: SCSI error: </code><code>return</code> <code>code = 0x06000000</code>

<code>May 10 10:57:30 10.1.1.1 end_request: I</code><code>/O</code> <code>error, dev sda, sector 753410861</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 84894796</code>

<code>May 10 10:57:30 lost page write due to I</code><code>/O</code> <code>error on sda6</code>

<code>May 10 10:57:30 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6794075</code>

<code>May 10 10:57:30 lost page write due to I</code><code>/O</code> <code>error on sda1</code>

<code>May 10 10:57:30 Aborting journal on device sda1.</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6816387</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55100852</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55187141</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55200454</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55200455</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55229048</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 63269557</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 85296045</code>

<code>May 10 10:57:30 ext3_abort called. </code>

<code>May 10 10:57:30 EXT3-fs error (device sda1): ext3_journal_start_sb: Detected aborted journal</code>

<code>May 10 10:57:30 Remounting filesystem </code><code>read</code><code>-only</code>

<code>May 10 10:57:30 10.1.1.1 end_request: I</code><code>/O</code> <code>error, dev sda, sector 756620997</code>

<code>May 10 10:57:30 10.1.1.1 __journal_remove_journal_head: freeing b_committed_data</code>

<code>May 10 10:57:30 journal commit I</code><code>/O</code> <code>error</code>

<code>May 10 10:57:30 10.1.1.1 end_request: I</code><code>/O</code> <code>error, dev sda, sector 750704733</code>

<code>May 10 10:57:30 Aborting journal on device sda6.</code>

<code>May 10 10:57:30 EXT3-fs error (device sda6) </code><code>in</code> <code>ext3_ordered_commit_write: IO failure</code>

<code>May 10 10:57:30 10.1.1.1 __journal_remove_journal_head: freeing b_frozen_data</code>

<code>May 10 10:57:31 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:57:31 EXT3-fs error (device sda6): ext3_get_inode_loc: </code>

<code>May 10 10:57:31 unable to </code><code>read</code> <code>inode block - inode=21004483, block=84017166</code>

<code>May 10 10:57:31 10.1.1.1  </code>

<code>May 10 10:57:31 EXT3-fs error (device sda1): ext3_get_inode_loc: </code>

<code>May 10 10:57:31 unable to </code><code>read</code> <code>inode block - inode=680717, block=2719877</code>

<code>May 10 10:57:33 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:58:01 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:58:01 10.1.1.1 printk: 256 messages suppressed.</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750208</code>

<code>May 10 10:58:01 lost page write due to I</code><code>/O</code> <code>error on sda1</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750297</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750298</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750307</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6782976</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6790663</code>

<code>May 10 10:58:06 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:58:06 10.1.1.1 printk: 26 messages suppressed.</code>

<code>May 10 10:58:06 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 0</code>

<code>May 10 10:58:06 lost page write due to I</code><code>/O</code> <code>error on sda1</code>

<code>May 10 11:00:05 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 11:03:01 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 11:07:17 EXT3-fs error (device sda1): ext3_get_inode_loc: </code>

<code>May 10 11:07:17 unable to </code><code>read</code> <code>inode block - inode=1798783, block=7208965</code>

<code>May 10 11:07:17 10.1.1.1  </code>

<code>May 10 11:07:27 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 11:07:27 EXT3-fs error (device sda1): ext3_find_entry: </code>

<code>May 10 11:07:27 reading directory </code><code>#1275457 offset 0</code>

<code>May 10 11:07:27 10.1.1.1  </code>

<code>==============================================================================</code>

<code>DELL R710的機器 檢視日志發現是硬碟掉了 聯系機房工程師看了面闆 發現前面闆LCD上有報錯</code>

<code>資訊 分别是E171F E1211 E2022,最後解決辦法是将原來raid 5(8塊盤)拔下換到新的機器上。</code>

<code>注意的事需要導入raid資訊,之後就OK了。</code>

<code>E171F</code>

<code>PCIE Fatal Err B</code><code>## D## F##</code>

<code>PCIE Fatal Err Slot </code><code>#</code>

<code>系統 BIOS 已報告元件的 PCIe 緻命錯誤,該元件所在的 PCI 配置空間位于總線 </code><code>##,裝置 ##,功能 ##。</code>

<code>系統 BIOS 已報告元件的 PCIe 緻命錯誤,該元件位于插槽 </code><code>#。</code>

<code>卸下并重置 PCI 擴充卡。如果問題仍然存在,請參閱排除擴充卡故障。</code>

<code>如果問題仍然存在,則表示系統闆出現故障。請參閱獲得幫助。</code>

<code>E1211</code>

<code>ROMB Batt</code>

<code>RAID 電池丢失、損壞或因溫度問題而無法再充電。</code>

<code>重置 RAID 電池。請參閱更換 SAS RAID 控制器子卡電池和排除系統冷卻故障。</code>

<code>E2022</code>

<code>POST Fail</code>

<code>視訊後出現一般故障。</code>

<code>請檢視螢幕上的具體錯誤資訊。</code>

本文轉自 xdoujiang 51CTO部落格,原文連結:http://blog.51cto.com/7938217/1650775,如需轉載請自行聯系原作者

繼續閱讀