print()函数中的end='...'参数是否线程安全?

5
使用以下代码,我尝试在jupyter-notebook上使用ThreadPoolExecutor并行打印多个内容。请注意,使用show()函数时,输出结果与通常预期的不同。
from concurrent.futures import ThreadPoolExecutor
import sys

items = ['A','B','C','D','E','F',
         'G','H','I','J','K','L',
         'M','N','O','P','Q','R',
         'S','T','U','V','W','X','Y','Z']

def show(name):
    print(name, end=' ')

with ThreadPoolExecutor(10) as executor:
    executor.map(show, items)

# This outputs
# AB  C D E F G H I J KLMNOP      QR STU VW    XY Z 

但是当我使用sys.stdout.write()时,我没有得到这种行为。

def show2(name):
    sys.stdout.write(name + ' ')

with ThreadPoolExecutor(10) as executor:
    executor.map(show2, items)

# This gives
# A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 

奇怪的是,我在jupyter笔记本和编写.py文件并运行它两种方式下都尝试了这个操作。但是,在后者中,我似乎没有遇到这个问题。我尝试搜索,但我得到的所有结果都是python-3.x中的print()是线程安全的。如果确实是线程安全的,有人能解释一下为什么会发生这种情况吗?


1
https://twitter.com/nedbat/status/194452404794691584?s=19 - Daniel Roseman
2
当你执行print("%s "%(name), end ='')时会发生什么?可能end=变量正在将名称和空格作为不同的操作输出,其中上下文切换可能会在它们之间发生。使用已附加空格的单个字符串(并且是空的end)进行打印可能会缓解这种情况。 - paxdiablo
如果你使用的是Python 3.3或更高版本,你可以尝试使用print(..., flush=True) - user9611000
1个回答

3
指定“end”实际上并不需要暴露这个问题;即使只是执行“print(name)”有时也会导致字母挨在一起。
A
B
C
D
EF
G

H
I

即使使用flush=True也无法解决这个问题。

print函数是在CPython这里实现的,并且是用C语言编写的。有趣的部分在于:

for (i = 0; i < nargs; i++) {
        if (i > 0) {
            if (sep == NULL)
                err = PyFile_WriteString(" ", file);
            else
                err = PyFile_WriteObject(sep, file,
                                         Py_PRINT_RAW);
            if (err)
                return NULL;
        }
        err = PyFile_WriteObject(args[i], file, Py_PRINT_RAW);
        if (err)
            return NULL;
    }

    if (end == NULL)
        err = PyFile_WriteString("\n", file);
    else
        err = PyFile_WriteObject(end, file, Py_PRINT_RAW);

您可以看到它为每个参数(如果指定,则包括sep)调用一次PyFile_WriteObject,然后再为end参数调用一次(PyFile_WriteString基本上只是一个包装器,它需要一个const char*而不是一个PyObject) - 我假设在这些调用之间最终有机会进行上下文切换。
每次调用PyFile_WriteString实际上就像在Python中调用sys.stdout.write一样,这就解释了为什么当执行sys.stdout.write(name + ' ')时您没有看到此内容; 如果您改为执行以下操作:
sys.stdout.write(name)
sys.stdout.write(" ")

这更像是print函数本身正在做的事情,这也解释了为什么使用print(name + " ", end="") 也可以起作用。


老实说,我不确定;也许这个问题的答案可以帮到你?这个答案似乎表明,一般来说,文件I/O不是线程安全的,这意味着print也不是线程安全的。 - ash

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接