SQL Server 下取中位数(中位值)的方法


  中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me表示。

  从中位数的定义可知,所研究的数据中有一半小于中位数,一半大于中位数。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。

  在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。在统计数据的处理和分析时,可结合使用中位数。

  将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值 ,或求出中间两个数的平均数作为中位数。

  在Excel中有函数MEDIAN来取中位数,但是在SQL Server中则没有该内置的函数,需要用以下方法求得。

  1. create table #tb(pid varchar(10),coadcladcon int)  
  2. insert into #tb  
  3.  select 'PRAA0370',1 union all  
  4.  select 'PRAA0370',2 union all  
  5.  select 'PRAA0370',3 union all  
  6.  select 'PRAA0370',4 union all  
  7.  select 'PRAA0370',5 union all  
  8.  select 'PRAA0370',6 union all  
  9.  select 'PRAA0371',1 union all  
  10.  select 'PRAA0371',2 union all  
  11.  select 'PRAA0371',3 union all  
  12.  select 'PRAA0371',4 union all  
  13.  select 'PRAA0371',5 union all  
  14.  select 'PRAA0371',6 union all  
  15.  select 'PRAA0371',7   
  16.   
  17. WITH OrdersRN AS  
  18. (  
  19.   SELECT pid, coadcladcon,  
  20.     ROW_NUMBER() OVER(PARTITION BY pid ORDER BY coadcladcon) AS RowNum,  
  21.     COUNT(*) OVER(PARTITION BY pid) AS Cnt  
  22.   FROM #tb  
  23. )  
  24. select pid,avg(coadcladcon) coadcladcon from (  
  25. SELECT pid,coadcladcon,RowNum,Cnt  
  26. FROM OrdersRN o  
  27. WHERE RowNum IN((Cnt + 1) / 2,(Cnt + 2) / 2)   
  28. )a  
  29. group by pid  

相关内容