数据库一张表 有一列是医院名称, 但又很多医院有不同的名字,都在这一列里面,
例如同仁医院,有北京同仁医院,首都医科大学附属同仁医院,
这三个名字其实都是同一个医院,
有没有简单的方法 ,让程序(or sql)认为这是同一个医院呢?
这个例子 后面四个字相同, 是特例。
加一个《同一个医院的不同名称》的关系表,然后人工判断医院名称
人工识别是你能支付的成本。电脑AI你就别指望了,把你卖了也不够。
如果你连人工识别都觉得贵或者不可能的话,那就洗洗睡吧。
非要在不改变表结构的前提下让电脑自动识别,这个有点像人工智能了,就算是人工智能也还得你给出识别的规则。
应该说是你选择解决问题的方式不太恰当,你的表里面应该有一个字段是每个医院的唯一标识,这个字段是不能重复的。
或者说在数据录入的时候就不应该允许同一个医院有不同的名称,若录入的数据源不是你能控制的,那只能先录入后再人工识别了,比如人工另建一个表(不同的名称和同一个医院编号的映射表),然后再基于这个表更新录入的数据,没有别的办法了。
先规范一下数据吧