ORA-27300故障解决实例


近期某客户反映其核心业务系统部分页面运行缓慢,生产数据库(双节点RAC环境)出现异常,登录BOSS数据库检查,发现数据库运行较慢,检查锁表情况发现大量锁表, 然后登录到数据库一节点服务器发现服务器运行缓慢,运行top发现系统资源已消耗殆尽,截图如下:

ORA-27300故障解决实例

登录数据库二节点服务器运行正常,可判断故障点在数据库RAC双机一节点上。服务器上sqlplus登录Oracle正常,未发现明显异常。查看Oracle告警日志发现如下报错信息:

ORA-27300故障解决实例

经过查询Oracle 官方网站MOS(详见ID 1252265.1 ORA-27300 ORA-27301 ORA-27302: failure occurred at: skgpalive1)发现命中Oracle BUG 10010310:

ORA-27300故障解决实例

ORA-27300,ORA-27301,ORA-27302事实上有很多报错原因,主要是数据库和操作系统交互时引起的报错,大部分为 bug,上述报错是由于bug 10010310引起的,所幸的是,Oracle在不同的版本上发布了针对这一bug的补丁,其大小为130KB左右:

补丁资料查询如下:

ORA-27300故障解决实例

此Oracle BUG一旦触发只能重新启动数据库实例,别无其他补救处理办法,数据库一节点上的实例一重启完成后,操作系统负载恢复正常范围,核心系统恢复正常。

相关内容