Unix对单个文件的读写是否原子化序列化？

Question

Unix对单个文件的读写是否原子化序列化？

21

我想知道对于单个文件的写入是否是原子性的，即write("bla bla")和之后对同一文件的write("herp derp")永远不会交织在一起，例如"bla herp bla derp"。假设这些写入发生在不同的进程或线程中，是什么决定了哪一个会先执行？

另外，read()函数是否总是返回反映文件处于所有以前写入完全完成状态的数据（无论该数据是否实际写入磁盘）？例如，在write("herp derp")之后，所有随后的读取是否始终反映写入文件的全部数据，或者是否有时后续的读取只反映"herp"而不是"derp"（或者有时根本不反映任何数据）？如果读取和写入发生在不同的进程/线程中会发生什么？

我不关心并发文件访问策略。我只想知道read()和write()做了什么。

- Jegschemesch

你的问题很有趣，正是我想问的。哈哈... - Anthony

OP发布了一个后续问题每个Unix文件描述符都有自己的读/写缓冲区吗？ - Piotr Dobrogost

你可能会对Linux内核的线程感兴趣，该线程的标题是 Update of file offset on write() etc. is non-atomic with I/O ，这导致了此提交 - http://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/commit/?id=9c225f2655e36a470c4f58dbbc99244c5fc7f2d4 - Piotr Dobrogost

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- geekosaur · Accepted Answer

write()函数的多次调用将被逐个处理，而不是作为单个原子写事务处理。当多个进程/线程向同一文件中写入数据时，它们之间可能会交错执行。实际写操作的顺序由调度程序（包括内核进程调度程序以及“green”线程库的调度程序）确定。

除非另有规定（例如支持的情况下使用O_DIRECT open标志或类似方式），read()和write()操作都是在内核缓冲区上进行的。read()函数将优先使用已加载到内存中的缓冲区，而不是再次从磁盘读取。

请注意，这可能会受到本地文件缓存的影响。例如，stdio和iostreams将按块将文件数据读入到进程中的缓冲区中，这与内核缓冲区无关。因此，如果对已经缓存在stdio中的数据进行write()操作，则不会看到这些数据的变化。同样，在输出缓冲区存在的情况下，只有在刷新输出缓冲区后才会有任何实际的内核级输出，刷新可以自动发生，因为它已经填满，也可以手动通过使用fflush()或C ++的endl（它会隐式刷新输出缓冲区）。