我正在尝试从一段自由文本块中(列名为TEXT)隔离出一个电子邮件地址。
在自由文本字段中,存在许多不同的前导和后继字符变体,例如:
email me! john@smith.com
e:john@smith.com m:555-555-5555
john@smith.com--personal email
我尝试了各种
INSTR()
和SUBSTRING_INDEX()
的变化,首先隔离"@"
(可能是发现电子邮件中唯一可靠的常数...),并提取左侧字符(直到空格或类似"-"
或":"
的非资格字符),然后对跟随@
的文本执行相同的操作。
但是,到目前为止,我尝试的所有方法都没有过滤掉我需要的噪声。
显然,100%的准确性是不可能的,但是否有人能够尝试如何构造我的选择语句?