我有成千上万行文本需要查找货币表示,例如:
Lorem ipsum dolor sit amet, 100.000,00 USD sadipscing elitr, sed diam nonumy eirmod
GBP 400 ut labore et dolore magna aliquyam erat, sed diam voluptua. At USD 20 eos et
accusam et justo duo dolores et 100,000.00 USD ea rebum. Stet 3,-- USD gubergren, no
Python脚本应该返回转换为美元的金额。(例如:100000USF、400 GBP -> USD等)
到目前为止,我手动创建了正则表达式以检索数字-货币组合的值,然后将货币与数据库进行比较并计算汇率。
然而,这既不高效也不具有未来性(例如,如果添加另一种货币)。因此,我想知道是否有一种高效的机器学习算法,我可以用一些示例“训练”它,然后它尝试找到这样的“价值-货币”组合?