首页 新闻 搜索 专区 学院

内容相似识别或匹配

0
悬赏园豆:20 [待解决问题]

 数据库一张表 有一列是医院名称, 但又很多医院有不同的名字,都在这一列里面,

例如同仁医院,有北京同仁医院,首都医科大学附属同仁医院, 

这三个名字其实都是同一个医院,

有没有简单的方法 ,让程序(or sql)认为这是同一个医院呢?

 

这个例子 后面四个字相同, 是特例。

后缀名的主页 后缀名 | 初学一级 | 园豆:73
提问于:2016-02-29 14:02
< >
分享
所有回答(4)
0

加一个《同一个医院的不同名称》的关系表,然后人工判断医院名称

刘宏玺 | 园豆:14016 (专家六级) | 2016-02-29 14:25
0

人工识别是你能支付的成本。电脑AI你就别指望了,把你卖了也不够。

如果你连人工识别都觉得贵或者不可能的话,那就洗洗睡吧。

爱编程的大叔 | 园豆:30753 (高人七级) | 2016-02-29 14:29
0

非要在不改变表结构的前提下让电脑自动识别,这个有点像人工智能了,就算是人工智能也还得你给出识别的规则。

 

应该说是你选择解决问题的方式不太恰当,你的表里面应该有一个字段是每个医院的唯一标识,这个字段是不能重复的。

 

或者说在数据录入的时候就不应该允许同一个医院有不同的名称,若录入的数据源不是你能控制的,那只能先录入后再人工识别了,比如人工另建一个表(不同的名称和同一个医院编号的映射表),然后再基于这个表更新录入的数据,没有别的办法了。

脚本王子 | 园豆:779 (小虾三级) | 2016-02-29 16:15
0

先规范一下数据吧

BigLiang | 园豆:79 (初学一级) | 2016-03-01 09:05
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册