首页 新闻 会员 周边

Oracle去重及关键字Distinct

0
[待解决问题]

oracle——去除重复记录

Distinct,用distinct关键字只能过滤查询字段中所有记录相同的(记录集相同)
(1)取一个字段,去除重复项。假设要id这个字段的值:
select distinct name from t1; --能消除重复记录,缺点:但只能取一个字段;distinct关键字会排序,效率很低
(2)取多个字段,去除重复项。假设要同时取id,name这2个字段的值:
select distinct id,name from t1; --可以取2个字段,但只能消除这2个字段值全部相同的记录

所以用distinct无法达到同时取多个字段并去重其中一个字段。用group by可以解决这个问题。
(3)取多个字段并去重其中一个字段。例如要显示的字段为A、B、C三个,而A字段的内容不能重复可以用下面的语句:
select A, min(B),min(C),count() from [table] where [条件] group by A having [条件] order by A desc;
为了字段名显示明了,可以把
select A, min(B),min(C),count(
)
换成
select A as A, min(B) as B,min(C) as C,count() as 重复次数
显示出来的字段和排序字段都要包括在group by 中
但显示出来的字段包有min,max,count,avg,sum等聚合函数时可以不在group by 中
如上句的min(B),min(C),count(
)
一般条件写在where 后面
有聚合函数的条件写在having 后面
如果在上句中having加 count()>1 就可以查出记录A的重复次数大于1的记录
如果在上句中having加 count(
)>2 就可以查出记录A的重复次数大于2的记录
☆如果在上句中having加 count()>=1 就可以查出所有的记录,但重复的只显示一条,并且后面有显示重复的次数
----这就是所需要的结果,而且语句可以通过hibernate
下面语句可以查询出那些数据是重复的:
select [字段1],[字段2],count(
) from [表名] group by [字段1],[字段2] having count() > 1;
将上面的>号改为=号就可以查询出没有重复的数据了。例如找出没有重复的gkrq字段值的记录:
select count(
) from (select gcmc,gkrq,count() from gczbxx_zhao t group by gcmc,gkrq having count()>=1 order by GKRQ);
推荐使用:
select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by gcmc ) order by gkrq desc;

例子2:
SELECT ROWID,EMPNO,JOB FROM EMP
WHERE ROWID!=(SELECT MAX(ROWID) FROM EMP D
WHERE EMP.JOB=D.JOB)
ORDER BY JOB;
举例解释:
假设现在EMP表有三条记录,分别为a(rowid=1),b(rowid=2),b(rowid=3)。(b存在重复)
那么where语句中,
对于记录a来说,只有一条记录,其rowid为1,而关联的D的max(rowid)也为1,由于1=1,所以条件不成立,记录a不会被检出;
对于记录b来说,由于存在2条记录,rowid分别为2和3,而关联的D的max(rowid)也为3(2小于3),所以rowid为2的记录满足条件(2<>3),rowid为2的b记录会被检出,rowid为3的记录不会被检出。
故对于以上,查询结果就是b(rowid=2)。

总结:此语句对于任何存在件数为n(n>=1)的记录来说,必将有n-1条记录被检出。

贺老爷的主页 贺老爷 | 菜鸟二级 | 园豆:202
提问于:2018-03-26 09:22
< >
分享
所有回答(1)
0

你这应该发表在博客,而不是博问,(滑稽)

但乱红尘熊 | 园豆:773 (小虾三级) | 2018-03-26 10:03
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册