数据库中有一张表tb_student,大概有15W条数据,现在需要从中抽取500条数据,抽取的条件如下:
1.抽取的数据要包含13个地市的
2.包含各类高校(文,理,职,医,农)
3.抽取的数据要男女均衡
4.年龄要有一定跨度
现在不知道如何入手,请高手指点。
这个不是用SQL语句可以完成的,涉及到数据挖掘的相关技术,可以考虑使用SQLSERVER 的分析服务来解决。SQLSERVER 有一个比较完整的商业智能解决方案。
xuexi
像随机取样,却又不是,因为多了太多条件
这个SQL语句搞不定,写程序吧,不过估计写程序也不太容易做到所有条件,如果真的是想随机取样,那么就不应该在乎是否均衡、年龄跨度等,不然,还不如干脆指定某些记录呢