欢迎来到天天文库
浏览记录
ID:39468454
大小:58.00 KB
页数:6页
时间:2019-07-04
《SQL查询重复数据和清除重复数据》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SQL查询重复数据和清除重复数据分类:SQL2008-05-2011:0334086人阅读评论(1)收藏举报sqlsqlserversunjoin选择重复,消除重复和选择出序列有例表:empemp_nonameage001Tom17002Sun14003Tom15004Tom16要求:列出所有名字重复的人的记录(1)最直观的思路:要知道所有名字有重复人资料,首先必须知道哪个名字重复了:selectnamefromempgroupbynamehavingcount(*)>1所有名字重复人的记录是:select*fromempwherenamein(selectnam
2、efromempgroupbynamehavingcount(*)>1)(2)稍微再聪明一点,就会想到,如果对每个名字都和原表进行比较,大于2个人名字与这条记录相同的就是合格的,就有select*fromempwhere(selectcount(*)fromempewheree.name=emp.name)>1注意一下这个>1,想下如果是=1,如果是=2如果是>2如果e是另外一张表而且是=0那结果就更好玩了:)这个过程是在判断工号为001的人的时候先取得001的名字(emp.name)然后和原表的名字进行比较e.name注意e是emp的一个别名。再稍微想得多一点,
3、就会想到,如果有另外一个名字相同的人工号不与她他相同那么这条记录符合要求:select*fromempwhereexists(select*fromempewheree.name=emp.nameande.emp_no<>emp.emp_no)此思路的join写法:selectemp.*fromemp,empewhereemp.name=e.nameandemp.emp_no<>e.emp_no/*这个语句较规范的join写法是selectemp.*fromempinnerjoinempeonemp.name=e.nameandemp.emp_no<>e.emp_
4、no但个人比较倾向于前一种写法,关键是更清晰*/b、有例表:empnameageTom16Sun14Tom16Tom16清除重复过滤掉所有多余的重复记录(1)我们知道distinct、groupby可以过滤重复,于是就有最直观的selectdistinct*fromemp或selectname,agefromempgroupbyname,age获得需要的数据,如果可以使用临时表就有解法:selectdistinct*into#tmpfromempdeletefromempinsertintoempselect*from#tmp(2)但是如果不可以使用临时表,那该怎
5、么办?我们观察到我们没办法区分数据(物理位置不一样,对SQLServer来说没有任何区别),思路自然是想办法把数据区分出来了,既然现在的所有的列都没办法区分数据,唯一的办法就是再加个列让它区分出来,加什么列好?最佳选择是identity列:altertableempaddchkintidentity(1,1)表示例:nameagechkTom161Sun142Tom163Tom164重复记录可以表示为:select*fromempwhere(selectcount(*)fromempewheree.name=emp.name)>1要删除的是:deletefrome
6、mpwhere(selectcount(*)fromempewheree.name=emp.nameande.chk>=emp.chk)>1再把添加的列删掉,出现结果。altertableempdropcolumnchk(3)另一个思路:视图selectmin(chk)fromempgroupbynamehavingcount(*)>1获得有重复的记录chk最小的值,于是可以deletefromempwherechknotin(selectmin(chk)fromempgroupbyname)写成join的形式也可以:(1)有例表:empemp_nonameage
7、001Tom17002Sun14003Tom15004Tom16要求生成序列号(1)最简单的方法,根据b问题的解法:altertableempaddchkintidentity(1,1)或select*,identity(int,1,1)chkinto#tmpfromemp如果需要控制顺序怎么办?selecttop100000*,identity(int,1,1)chkinto#tmpfromemporderbyage(2)假如不可以更改表结构,怎么办?如果不可以唯一区分每条记录是没有办法的,在可以唯一区分每条记录的时候,可以使用a中的count的思路解决这个问题
8、selec
此文档下载收益归作者所有