SOUNDEX
功能描述
在进行数据分析和处理时,有时候需要对字符串进行语音编码,即将字符串转换成与其发音类似的编码。函数SOUNDEX,可以计算字符串的语音编码。其所返回的语音编码,由四个字符构成,第一个字符为英文字母,后三个为数字。 通过比较两个字符串的语音编码,可以评估它们之间的发音相似度。因此,对于在拼音文字中有时会念但不能拼出正确字的情形,又或者特别是在做搜索引擎时面对用户传入的陌生英文字符串的场景,可用本函数做类似模糊比对的效果。例如:SELECT * FROM table_name WHERE SOUNDEX(column_name) = SOUNDEX('abc');
注意事项
该功能仅在数据库兼容模式为MySQL时支持(即数据库实例初始化时指定DBCOMPATIBILITY='B')。
返回值类型
text
示例
SELECT SOUNDEX('Hello');
由于上述两个字符串发音相同,因为返回结果均为:
soundex
---------
H400
(1 row)