提取浮点数/双精度值

32

如何使用正则表达式从字符串中提取一个双精度浮点数值。

import re

pattr = re.compile(???)    
x = pattr.match("4.5")      

你能否提供一些关于为什么不能使用float("4.5")的细节? - jfs
5个回答

62

来自perldoc perlretut的正则表达式:

import re
re_float = re.compile("""(?x)
   ^
      [+-]?\ *      # first, match an optional sign *and space*
      (             # then match integers or f.p. mantissas:
          \d+       # start out with a ...
          (
              \.\d* # mantissa of the form a.b or a.
          )?        # ? takes care of integers of the form a
         |\.\d+     # mantissa of the form .b
      )
      ([eE][+-]?\d+)?  # finally, optionally match an exponent
   $""")
m = re_float.match("4.5")
print m.group(0)
# -> 4.5
从较长的字符串中提取数字:

从较长的字符串中提取数字:

s = """4.5 abc -4.5 abc - 4.5 abc + .1e10 abc . abc 1.01e-2 abc 
       1.01e-.2 abc 123 abc .123"""
print re.findall(r"[+-]? *(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][+-]?\d+)?", s)
# -> ['4.5', '-4.5', '- 4.5', '+ .1e10', ' 1.01e-2',
#     '       1.01', '-.2', ' 123', ' .123']

请注意,这也匹配整数(这是预期的,因为每个整数也是浮点数)。 - Andre Holzner

23

这是一种简单的方法。不要使用正则表达式处理内置类型。

try:
    x = float( someString )
except ValueError, e:
    # someString was NOT floating-point, what now?

实际上,这也是最安全的方式。考虑到一些错误的输入,比如 0..10.0.02,对于正则表达式来识别它们非常困难。更糟糕的是,它会假装是正确的并产生一些错误的答案。 - dspjm
1
技术上是正确的,但问题明确指定了正则表达式。 - villasv

20

对于解析整数和浮点数(小数点分隔符)的值:

re.findall( r'\d+\.*\d*', 'some 12 12.3 0 any text 0.8' )

结果:

['12', '12.3', '0', '0.8']

如果您能提供一个获取int或float的过程,但不在字典或数组中,那将非常有帮助。 我所拥有的是 str1 =“BIOS:version 2.0.0” 我想要的是 2.0.0 没有任何逗号或括号。 - Gajendra D Ambi
1
你好,你可以使用以下代码:re.findall(r'[\d.]+', "BIOS: version 2.0.0") - iqmaker
更好的写法:re.findall(r'[\d.]{2,}|\d+', "BIOS: version 2.0.0") - iqmaker
simple and exact - sachin rathod

1

将浮点数作为正则表达式进行暴力破解。与 J.F. Sebastian 版本相比,存在较小的差异:

import re
if __name__ == '__main__':
  x = str(1.000e-123)
  reFloat = r'(^[+-]?\d+(?:\.\d+)?(?:[eE][+-]\d+)?$)'
  print re.match(reFloat,x)

>>> <_sre.SRE_Match object at 0x0054D3E0>

这与没有整数部分的浮点数不匹配,例如.123而不是0.123 - Martin Scharrer

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接