我的输入数据已经使用UTF-8编码。
我在输入上应用了一个正则表达式,以查找逗号前的所有内容。
然而,我的正则表达式返回了None
,尽管我可以在视觉上看到逗号。
有什么问题吗?
我测试了MyString
中是否存在','
,这个测试结果是正常的。
以下是我的输入数据:
ID MyString
765427 Units G2 and G3, kings Drive
207162 Unit 5/165,Elizabeth Palace
47568 Unit 766 - 767 Gate 7,Jacks Way,
15498 Unit F, Himalayas Street,
根据我的正则表达式 -
re.search(r".*?,", s['MyString'])
,我期望输出为:
ID MyString
765427 Units G2 and G3,
207162 Unit 5/165,
47568 Unit 766 - 767 Gate 7,
15498 Unit F,
但我得到的是:
ID MyString
765427 Units G2 and G3,
207162 None
47568 Unit 766 - 767 Gate 7,
15498 None
请纠正我对正则表达式的理解,如果我理解不正确,请指出错误。我无法弄清楚这个问题的具体原因。
split
使用','作为参数,但是提供第二个参数给split
作为'maxsplit',这将只拆分该字符串那么多次。所以 ->s.split(',', maxsplit=1)
,然后您将得到一个列表,您只需要获取列表中的第一个元素即可。 - idjaw