以Pythonic的方式将Excel或电子表格列字母转换为其数字

31

有没有更符合Python风格的方法将类似Excel的列转换为数字(从1开始)?

以下是适用于两个字母的工作代码:

def column_to_number(c):
    """Return number corresponding to excel-style column."""
    number=-25
    for l in c:
        if not l in string.ascii_letters:
            return False
        number+=ord(l.upper())-64+25
    return number

代码运行:

>>> column_to_number('2')
False
>>> column_to_number('A')
1
>>> column_to_number('AB')
28

三个字母无法使用。

>>> column_to_number('ABA')
54
>>> column_to_number('AAB')
54

参考资料:C#中的问题解答

17个回答

58

有一种更符合Python风格的方法(适用于三个或更多字母的单词,并且使用更少的魔法数字):

def col2num(col):
    num = 0
    for c in col:
        if c in string.ascii_letters:
            num = num * 26 + (ord(c.upper()) - ord('A')) + 1
    return num

并且可以使用reduce来编写一行代码(不检查输入,可读性较差,因此我不建议这样做):

col2num = lambda col: reduce(lambda x, y: x*26 + y, [ord(c.upper()) - ord('A') + 1 for c in col])

1
而如何返回另一种方式呢? - Russia Must Remove Putin
要返回另一种方式,请参见@Devon的答案。 - Eli_B
通过使用此函数:https://dev59.com/IWAg5IYBdhLWcg3wM4r_#23862195 - Tropicalrambler
1
这有点像从数字字符串计算整数值。只不过这里是基于26而不是10。 - Sylvain

21

在Python 2.7.1和3.5.2中测试的单行代码

excel_col_num = lambda a: 0 if a == '' else 1 + ord(a[-1]) - ord('A') + 26 * excel_col_num(a[:-1])

excel_col_name = lambda n: '' if n <= 0 else excel_col_name((n - 1) // 26) + chr((n - 1) % 26 + ord('A'))

多行情况同样适用

def excel_column_name(n):
    """Number to Excel-style column name, e.g., 1 = A, 26 = Z, 27 = AA, 703 = AAA."""
    name = ''
    while n > 0:
        n, r = divmod (n - 1, 26)
        name = chr(r + ord('A')) + name
    return name

def excel_column_number(name):
    """Excel-style column name to number, e.g., A = 1, Z = 26, AA = 27, AAA = 703."""
    n = 0
    for c in name:
        n = n * 26 + 1 + ord(c) - ord('A')
    return n

def test (name, number):
    for n in [0, 1, 2, 3, 24, 25, 26, 27, 702, 703, 704, 2708874, 1110829947]:
        a = name(n)
        n2 = number(a)
        a2 = name(n2)
        print ("%10d  %-9s  %s" % (n, a, "ok" if a == a2 and n == n2 else "error %d %s" % (n2, a2)))

test (excel_column_name, excel_column_number)
test (excel_col_name, excel_col_num)

所有的测试都打印输出

         0             ok
         1  A          ok
         2  B          ok
         3  C          ok
        24  X          ok
        25  Y          ok
        26  Z          ok
        27  AA         ok
       702  ZZ         ok
       703  AAA        ok
       704  AAB        ok
   2708874  EXCEL      ok
1110829947  COLUMNS    ok

12
你只需要在安装 openpyxl 模块后,将以下内容添加到控制台中即可:
>>> from openpyxl.utils import get_column_letter, column_index_from_string

>>> get_column_letter(1)
'A'
>>> column_index_from_string('A')
1

只需更改字母和数字以适应您的需求。


8
这是一种实现方法。它是在XlsxWriter模块中代码的变体:
def col_to_num(col_str):
    """ Convert base26 column string to number. """
    expn = 0
    col_num = 0
    for char in reversed(col_str):
        col_num += (ord(char) - ord('A') + 1) * (26 ** expn)
        expn += 1

    return col_num


>>> col_to_num('A')
1
>>> col_to_num('AB')
28
>>> col_to_num('ABA')
729
>>> col_to_num('AAB')
704

6

使用 openpyxl

import openpyxl
(column_string, row) = openpyxl.cell.coordinate_from_string(address)
column = openpyxl.cell.column_index_from_string(column_string) 

2

这段 VBA 代码可以实现您需要的功能:

Function columnNumber(colLetter As String) As Integer

    Dim colNumber As Integer
    Dim i As Integer

    colLetter = UCase(colLetter)
    colNumber = 0
    For i = 1 To Len(colLetter)
        colNumber = colNumber + (Asc(Mid(colLetter, Len(colLetter) - i + 1, 1)) - 64) * 26 ^ (i - 1)
    Next

    columnNumber = colNumber

End Function

您可以像使用Excel公式一样使用它-输入列,以字母形式表示(例如,“AA”),并且应该适用于任何列长度。

由于计数方式的原因,当处理三个字母时,您的代码会出现错误-您需要使用26进制。


1

你可以使用推导式和字符串的一行代码来实现,非常易于使用:

sum([string.ascii_lowercase.index(c) + 26 ** i for i,c in enumerate(col_letters)])

ZY 返回 76。应该返回 701。 - Ishvara

1
我制作了这个一行代码:


colNameToNum = lambda cn: sum([((ord(cn[-1-pos]) - 64) * 26 ** pos) for pos in range(len(cn))])

它通过反向迭代字母并乘以1、26、26 * 26等,然后求和列表来工作。这种方法也适用于更长的字母字符串。
我这样调用它: print(colNameToNum("AA")) # 27
或者 print(colNameToNum("XFD")) # 我相信这是允许的最高列。结果=16384

1
这是我使用的内容(在找到这个页面之前编写的):
def col_to_index(col):
    return sum((ord(c) - 64) * 26**i for i, c in enumerate(reversed(col))) - 1

还有一些运行:

>>> col_to_index('A')
1
>>> col_to_index('AB')
28
>>> col_to_index('ABCD')
19010

1
阅读后,我决定找到一种方法直接在Excel单元格中进行操作。它甚至可以处理Z列之后的列。
只需将此公式粘贴到任何行的任何列的单元格中,它就会给出相应的数字。
=IF(LEN(SUBSTITUTE(ADDRESS(ROW(),COLUMN(),4),ROW(),""))=2,
 CODE(LEFT(SUBSTITUTE(ADDRESS(ROW(),COLUMN(),4),ROW(),""),1))-64*26)+
 CODE(RIGHT(SUBSTITUTE(ADDRESS(ROW(),COLUMN(),4),ROW(),""),1)-64),
 CODE(SUBSTITUTE(ADDRESS(ROW(),COLUMN(),4),ROW(),""))-64)

这里的主题是获取列的字母,获取其 Code() 并减去 64,因为 ASCII 字符 A 的字符代码为 64。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接