问题:我有一个来自Access数据库的地址字段,已转换为SQL Server 2005。这个字段将所有内容都放在一个字段中。我需要将地址的各个部分解析成其规范化表中相应的字段。我需要对大约4,000条记录执行此操作,并且需要可重复。
假设:
暂时假设地址位于美国
假设输入字符串有时会包含被寄信人(收件人)和/或第二个街道地址(即B套房)
州名可能会缩写
邮政编码可能是标准的5位数字或zip+4
有些情况下可能存在拼写错误
更新:回答的问题后,标准并不是普遍适用的;我需要存储单独的值,而不仅仅是地理编码和errors表示拼写错误(已更正)
示例数据:
A. P. Croll & Son 2299 Lewes-Georgetown Hwy, Georgetown, DE 19947
11522 Shawnee Road, Greenwood DE 19950
144 Kings Highway, S.W. Dover, DE 19901
Intergrated Const. Services 2 Penns Way Suite 405 New Castle, DE 19720
Humes Realty 33 Bridle Ridge Court, Lewes, DE 19958
Nichols Excavation 2742 Pulaski Hwy Newark, DE 19711
2284 Bryn Zion Road, Smyrna, DE 19904
VEI Dover Crossroads, LLC 1500 Serpentine Road, Suite 100 Baltimore MD 21
580 North Dupont Highway Dover, DE 19901
P.O. Box 778 Dover, DE 19903