天天看点

[转载]最近让ibm的processor folding给害了

最近让ibm的processor folding给害了

 ​

最近让ibm的processor folding给害了,分享一下,说不定有人用得上:

两套双节点的11.2.0.4RAC数据库,都是p7+shared_SMT_4+aix7.1+asm+emc

两套都是其中一个节点db实例反复被lmhb重启,lmhb报各种超时

心跳、负载、IO等方面都找不出毛病

SR反馈符合" Bug 18916477 : LMHB: TERMINATING THE INSTANCE DUE TO ERROR 29770" ,但 也说在11.2.0.4这个问题已修复,没招了,让改参数继续观察:

_lm_rcvr_hang_allow_time=180

_lm_rcvr_hang_kill =false

一改可好,毛病变了,开始节点驱逐了,更糟糕

最后改了两个与processor folding相关的参数,貌似好了,有待继续观察

vpm_fold_policy = 0

vpm_xvcpus = -1

这里关键在于shared processor分区模式,如果是dedicated模式,压根不会有这个问题,这俩 vpm_参数根本都不需要知道

继续阅读