Python:从字符串中提取数字

问题:

我将提取字符串中包含的所有数字。哪个更适合于目的,正则表达式或isdigit()方法?
例:

line = "hello 12 hi 89"

结果:

[12, 89]

回答:

如果只想提取正整数,请尝试以下操作:

>>> str = "h3110 23 cat 444.4 rabbit 11 2 dog"
>>> [int(s) for s in str.split() if s.isdigit()]
[23, 11, 2]

我认为这比正则表达式更好,有三个原因。首先,你不需要另一个模块;其次,它更可读,因为您不需要解析正则表达式的迷你语言;第三,它更快(因此可能更多的是pythonic):

python -m timeit -s "str = 'h3110 23 cat 444.4 rabbit 11 2 dog' * 1000" "[s for s in str.split() if s.isdigit()]"
100 loops, best of 3: 2.84 msec per loop

python -m timeit -s "import re" "str = 'h3110 23 cat 444.4 rabbit 11 2 dog' * 1000" "re.findall('\\b\\d+\\b', str)"
100 loops, best of 3: 5.66 msec per loop

这不会以十六进制格式识别浮点数,负整数或整数。如果您不能接受这些限制,slim’s answer below将会做到这一点。

 
 
Code问答: http://codewenda.com/topics/python/
Stackoverflow: Python: Extract numbers from a string

*转载请注明本文链接以及stackoverflow的英文链接

发表评论

电子邮件地址不会被公开。 必填项已用*标注

8 + = 16