一个非典型的ORA-01555的解决

文章由LinuxBoy分享于2019-03-30 08:03:10热评（525）

一个非典型的ORA-01555的解决

ORA-01555:快照过旧。一个对于Oracle DBA来说最经典问题。
发生的根本原因：一致性读出了问题。

看到网上有个同学，举例说明，觉得不错，拿来用下：
假设有张表，叫table1，里面有5000万行数据，假设预计全表扫描1次需要1个小时，我们从过程来看：

1、在1点钟，有个用户A发出了select * from table1;此时不管将来table1怎么变化，正确的结果应该是用户A会看到在1点钟这个时刻的内容。这个是没有疑问的。
2、在1点30分，有个用户B执行了update命令，更新了table1表中的第4000万行的这条记录，这时，用户A的全表扫描还没有到达第4000万条。毫无疑问，这个时候，第4000万行的这条记录是被写到了回滚段里去了的，我假设是回滚段RBS1，如果用户A的全表扫描到达了第4000万行，是应该会正确的从回滚段RBS1中读取出1点钟时刻的内容的。
3、这时，用户B将他刚才做的操作commit了，但是这时，系统仍然可以给用户A提供正确的数据，因为那第4000万行记录的内容仍然还在回滚段RBS1里，系统可以根据SCN来到回滚段里找到正确的数据，但是大家注意到，这时记录在RBS1里的第4000万行记录已经发生了一点重大的改变：就是这个第4000万行的在回滚段RBS1里的数据有可能随时被覆盖掉，因为这条记录已经被提交了！！！
4、由于用户A的查询时间漫长，而业务在一直不断的进行，RBS1回滚段在被多个不同的tracnsaction使用着，这个回滚段里的extent循环到了第4000万行数据所在的extent，由于这条记录已经被标记提交了，所以这个extent是可以被其他transaction覆盖掉的！
5、到了1点40分，用户A的查询终于到了第4000万行，而这时已经出现了第4条说的情况，需要到回滚段RBS1去找数据，但是已经被覆盖掉了，于是01555就出现了。

这次出现的ORA-01555，引起的原因很特殊。
报错是回滚段SYSSMU1有问题.
所以断定的是，并不是因为大量的读写，造成的一致性读错误，而且因为回滚段的错误，使快照出现了问题。

首先观察下回滚段：
SQL> select segment_name,tablespace_name,status from dba_rollback_segs;
发现表空间UNDOTBS1的回滚段_SYSSMU1$-10$都是online。
发现表空间UNDOTBS2的回滚段SYSSMU1是竟然是needs recovery,其他都是offline。
最有趣的是这个数据库指定的UNDO是UNDOTBS1，UNDOTBS2实际已经被弃用了。

尝试把该回滚段offline后删除，但是提示非法。
重启数据库后该回滚段状态变成了availabe。
再次尝试offline后删除，还是提示正在使用。

用直接更新数据字典的方法
SQL>update undo$ set status$=2 where name='SYSSMU1';
发现该回滚段状态变更为offline，drop掉即可。
ORA-1555不再出现。

推荐文章：

一个非典型的ORA-01555的解决