天天看点

DELL R710服务器宕机案例(2)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

<code>我的博客已迁移到xdoujiang.com请去那边和我交流</code>

<code>May 10 10:54:29 sd 0: 2:0:0: megasas: RESET -936872901 cmd=2a</code>

<code>May 10 10:54:29 10.1.1.1 megasas: [ 0]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:34 10.1.1.1 megasas: [ 5]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:39 10.1.1.1 megasas: [10]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:44 10.1.1.1 megasas: [15]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:49 10.1.1.1 megasas: [20]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:54 10.1.1.1 megasas: [25]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:54:59 10.1.1.1 megasas: [30]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:04 10.1.1.1 megasas: [35]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:09 10.1.1.1 megasas: [40]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:14 10.1.1.1 megasas: [45]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:19 10.1.1.1 megasas: [50]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:24 10.1.1.1 megasas: [55]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:29 10.1.1.1 megasas: [60]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:34 10.1.1.1 megasas: [65]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:39 10.1.1.1 megasas: [70]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:44 10.1.1.1 megasas: [75]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:49 10.1.1.1 megasas: [80]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:54 10.1.1.1 megasas: [85]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:55:59 10.1.1.1 megasas: [90]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:04 10.1.1.1 megasas: [95]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:09 10.1.1.1 megasas: [100]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:14 10.1.1.1 megasas: [105]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:19 10.1.1.1 megasas: [110]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:24 10.1.1.1 megasas: [115]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:29 10.1.1.1 megasas: [120]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:34 10.1.1.1 megasas: [125]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:39 10.1.1.1 megasas: [130]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:44 10.1.1.1 megasas: [135]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:49 10.1.1.1 megasas: [140]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:54 10.1.1.1 megasas: [145]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:56:59 10.1.1.1 megasas: [150]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:04 10.1.1.1 megasas: [155]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:09 10.1.1.1 megasas: [160]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:15 10.1.1.1 megasas: [165]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:20 10.1.1.1 megasas: [170]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:25 10.1.1.1 megasas: [175]waiting </code><code>for</code> <code>3 commands to complete</code>

<code>May 10 10:57:30 10.1.1.1 megasas: failed to </code><code>do</code> <code>reset</code>

<code>May 10 10:57:30 sd 0: 2:0:0: megasas: RESET -936872901 cmd=2a</code>

<code>May 10 10:57:30 10.1.1.1 megasas: cannot recover from previous reset failures</code>

<code>May 10 10:57:30 sd 0: 2:0:0: scsi: Device offlined - not ready after error recovery</code>

<code>May 10 10:57:30 sd 0: 2:0:0: SCSI error: </code><code>return</code> <code>code = 0x06000000</code>

<code>May 10 10:57:30 10.1.1.1 end_request: I</code><code>/O</code> <code>error, dev sda, sector 753410861</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 84894796</code>

<code>May 10 10:57:30 lost page write due to I</code><code>/O</code> <code>error on sda6</code>

<code>May 10 10:57:30 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6794075</code>

<code>May 10 10:57:30 lost page write due to I</code><code>/O</code> <code>error on sda1</code>

<code>May 10 10:57:30 Aborting journal on device sda1.</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6816387</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55100852</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55187141</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55200454</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55200455</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 55229048</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 63269557</code>

<code>May 10 10:57:30 Buffer I</code><code>/O</code> <code>error on device sda6, logical block 85296045</code>

<code>May 10 10:57:30 ext3_abort called. </code>

<code>May 10 10:57:30 EXT3-fs error (device sda1): ext3_journal_start_sb: Detected aborted journal</code>

<code>May 10 10:57:30 Remounting filesystem </code><code>read</code><code>-only</code>

<code>May 10 10:57:30 10.1.1.1 end_request: I</code><code>/O</code> <code>error, dev sda, sector 756620997</code>

<code>May 10 10:57:30 10.1.1.1 __journal_remove_journal_head: freeing b_committed_data</code>

<code>May 10 10:57:30 journal commit I</code><code>/O</code> <code>error</code>

<code>May 10 10:57:30 10.1.1.1 end_request: I</code><code>/O</code> <code>error, dev sda, sector 750704733</code>

<code>May 10 10:57:30 Aborting journal on device sda6.</code>

<code>May 10 10:57:30 EXT3-fs error (device sda6) </code><code>in</code> <code>ext3_ordered_commit_write: IO failure</code>

<code>May 10 10:57:30 10.1.1.1 __journal_remove_journal_head: freeing b_frozen_data</code>

<code>May 10 10:57:31 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:57:31 EXT3-fs error (device sda6): ext3_get_inode_loc: </code>

<code>May 10 10:57:31 unable to </code><code>read</code> <code>inode block - inode=21004483, block=84017166</code>

<code>May 10 10:57:31 10.1.1.1  </code>

<code>May 10 10:57:31 EXT3-fs error (device sda1): ext3_get_inode_loc: </code>

<code>May 10 10:57:31 unable to </code><code>read</code> <code>inode block - inode=680717, block=2719877</code>

<code>May 10 10:57:33 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:58:01 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:58:01 10.1.1.1 printk: 256 messages suppressed.</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750208</code>

<code>May 10 10:58:01 lost page write due to I</code><code>/O</code> <code>error on sda1</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750297</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750298</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6750307</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6782976</code>

<code>May 10 10:58:01 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 6790663</code>

<code>May 10 10:58:06 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 10:58:06 10.1.1.1 printk: 26 messages suppressed.</code>

<code>May 10 10:58:06 Buffer I</code><code>/O</code> <code>error on device sda1, logical block 0</code>

<code>May 10 10:58:06 lost page write due to I</code><code>/O</code> <code>error on sda1</code>

<code>May 10 11:00:05 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 11:03:01 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 11:07:17 EXT3-fs error (device sda1): ext3_get_inode_loc: </code>

<code>May 10 11:07:17 unable to </code><code>read</code> <code>inode block - inode=1798783, block=7208965</code>

<code>May 10 11:07:17 10.1.1.1  </code>

<code>May 10 11:07:27 sd 0: 2:0:0: rejecting I</code><code>/O</code> <code>to offline device</code>

<code>May 10 11:07:27 EXT3-fs error (device sda1): ext3_find_entry: </code>

<code>May 10 11:07:27 reading directory </code><code>#1275457 offset 0</code>

<code>May 10 11:07:27 10.1.1.1  </code>

<code>==============================================================================</code>

<code>DELL R710的机器 查看日志发现是硬盘掉了 联系机房工程师看了面板 发现前面板LCD上有报错</code>

<code>信息 分别是E171F E1211 E2022,最后解决办法是将原来raid 5(8块盘)拔下换到新的机器上。</code>

<code>注意的事需要导入raid信息,之后就OK了。</code>

<code>E171F</code>

<code>PCIE Fatal Err B</code><code>## D## F##</code>

<code>PCIE Fatal Err Slot </code><code>#</code>

<code>系统 BIOS 已报告组件的 PCIe 致命错误,该组件所在的 PCI 配置空间位于总线 </code><code>##,设备 ##,功能 ##。</code>

<code>系统 BIOS 已报告组件的 PCIe 致命错误,该组件位于插槽 </code><code>#。</code>

<code>卸下并重置 PCI 扩充卡。如果问题仍然存在,请参阅排除扩充卡故障。</code>

<code>如果问题仍然存在,则表示系统板出现故障。请参阅获得帮助。</code>

<code>E1211</code>

<code>ROMB Batt</code>

<code>RAID 电池丢失、损坏或因温度问题而无法再充电。</code>

<code>重置 RAID 电池。请参阅更换 SAS RAID 控制器子卡电池和排除系统冷却故障。</code>

<code>E2022</code>

<code>POST Fail</code>

<code>视频后出现一般故障。</code>

<code>请查看屏幕上的具体错误信息。</code>

本文转自 xdoujiang 51CTO博客,原文链接:http://blog.51cto.com/7938217/1650775,如需转载请自行联系原作者

继续阅读