Oracle 11g 中 Kill session 心得


我们知道,在Oracle数据库中,可以通过kill session的方式来终止一个进程,其基本语法结构为:

alter system kill session 'sid,serial#' ;

被kill掉的session,状态会被标记为killed,Oracle会在该用户下一次touch时清除该进程.


我们发现当一个session被kill掉以后,该session的paddr被修改,如果有多个session被kill,那么多个session
的paddr都被更改为相同的进程地址:

  1. SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null;  
  2.   
  3. SADDR           SID    SERIAL# PADDR    USERNAME                       STATUS  
  4. -------- ---------- ---------- -------- ------------------------------ --------   
  5. 542E0E6C         11        314 542B70E8 EYGLE                          INACTIVE  
  6. 542E5044         18        662 542B6D38 SYS                            ACTIVE  
  7.   
  8. SQL> alter system kill session '11,314';  
  9.   
  10. System altered.  
  11.   
  12. SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null;  
  13.   
  14. SADDR           SID    SERIAL# PADDR    USERNAME                       STATUS  
  15. -------- ---------- ---------- -------- ------------------------------ --------   
  16. 542E0E6C         11        314 542D6BD4 EYGLE                          KILLED  
  17. 542E5044         18        662 542B6D38 SYS                            ACTIVE  
  18.   
  19. SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null;  
  20.   
  21. SADDR           SID    SERIAL# PADDR    USERNAME                       STATUS  
  22. -------- ---------- ---------- -------- ------------------------------ --------   
  23. 542E0E6C         11        314 542D6BD4 EYGLE                          KILLED  
  24. 542E2AA4         14        397 542B7498 EQSP                           INACTIVE  
  25. 542E5044         18        662 542B6D38 SYS                            ACTIVE  
  26.   
  27. SQL> alter system kill session '14,397';  
  28.   
  29. System altered.  
  30.   
  31. SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null;  
  32.   
  33. SADDR           SID    SERIAL# PADDR    USERNAME                       STATUS  
  34. -------- ---------- ---------- -------- ------------------------------ --------   
  35. 542E0E6C         11        314 542D6BD4 EYGLE                          KILLED  
  36. 542E2AA4         14        397 542D6BD4 EQSP                           KILLED  
  37. 542E5044         18        662 542B6D38 SYS                            ACTIVE  

在这种情况下,很多时候,资源是无法释放的,我们需要查询spid,在操作系统级来kill这些进程.

但是由于此时v$session.paddr已经改变,我们无法通过v$session和v$process关联来获得spid

那还可以怎么办呢?

我们来看一下下面的查询:

  1.  SQL> SELECT s.username,s.status,  
  2.   2  x.ADDR,x.KSLLAPSC,x.KSLLAPSN,x.KSLLASPO,x.KSLLID1R,x.KSLLRTYP,  
  3.   3  decode(bitand (x.ksuprflg,2),0,null,1)  
  4.   4  FROM x$ksupr x,v$session s  
  5.   5  WHERE s.paddr(+)=x.addr  
  6.   6  and bitand(ksspaflg,1)!=0;  
  7.   
  8.   
  9. USERNAME                       STATUS   ADDR       KSLLAPSC   KSLLAPSN KSLLASPO       KSLLID1R KS D  
  10. ------------------------------ -------- -------- ---------- ---------- ------------ ---------- -- -   
  11.                                         542B44A8          0          0                       0  
  12.                                ACTIVE   542B4858          1         14 24069                 0    1  
  13.                                ACTIVE   542B4C08         26         16 15901                 0    1  
  14.                                ACTIVE   542B4FB8          7         46 24083                 0    1  
  15.                                ACTIVE   542B5368         12         15 24081                 0    1  
  16.                                ACTIVE   542B5718         15         46 24083                 0    1  
  17.                                ACTIVE   542B5AC8         79          4 15923                 0    1  
  18.                                ACTIVE   542B5E78         50         16 24085                 0    1  
  19.                                ACTIVE   542B6228        754         15 24081                 0    1  
  20.                                ACTIVE   542B65D8          1         14 24069                 0    1  
  21.                                ACTIVE   542B6988          2         30 14571                 0    1  
  22.   
  23. USERNAME                       STATUS   ADDR       KSLLAPSC   KSLLAPSN KSLLASPO       KSLLID1R KS D  
  24. ------------------------------ -------- -------- ---------- ---------- ------------ ---------- -- -   
  25. SYS                            ACTIVE   542B6D38          2          8 24071                 0  
  26.                                         542B70E8          1         15 24081               195 EV  
  27.                                         542B7498          1         15 24081               195 EV  
  28. SYS                            INACTIVE 542B7848          0          0                       0  
  29. SYS                            INACTIVE 542B7BF8          1         15 24081               195 EV  
  30.   
  31. 16 rows selected.  

我们注意,红字标出的部分就是被Kill掉的进程的进程地址.

简化一点,其实就是如下概念: 

  1. SQL> select p.addr from v$process p where pid <> 1  
  2.   2  minus  
  3.   3  select s.paddr from v$session s;  
  4.   
  5. ADDR   
  6. --------    
  7. 542B70E8   
  8. 542B7498  

Ok,现在我们获得了进程地址,就可以在v$process中找到spid,然后可以使用Kill或者orakill在系统级来杀掉这些进程.

实际上,我猜测:

当在Oracle中kill session以后, Oracle只是简单的把相关session的paddr 指向同一个虚拟地址.

此时v$process和v$session失去关联,进程就此中断.

然后Oracle就等待PMON去清除这些Session.所以通常等待一个被标记为Killed的Session退出需要花费很长的时间.

如果此时被Kill的process,重新尝试执行任务,那么马上会收到进程中断的提示,process退出,此时Oracle会立即启动PMON
来清除该session.这被作为一次异常中断处理.

-The End-

最后补充一点,在oracle 11g r2中,这条sql:

  1. select p.addr from v$process p where p.pid != 1 minus select s.paddr from v$session s;  
换成这样应该更合适:
  1. select p.addr from v$process p where p.pid != 1 and pname is null minus select s.paddr from v$session s;  

相关内容