如何读取git-ls-tree输出的模式字段

115
$ git ls-tree fb3a8bdd0ce
100644 blob 63c918c667fa005ff12ad89437f2fdc80926e21c    .gitignore
100644 blob 5529b198e8d14decbe4ad99db3f7fb632de0439d    .mailmap
100644 blob 6ff87c4664981e4397625791c8ea3bbb5f2279a3    COPYING
040000 tree 2fb783e477100ce076f6bf57e4a6f026013dc745    Documentation
100755 blob 3c0032cec592a765692234f1cba47dfdcc3a9200    GIT-VERSION-GEN
100644 blob 289b046a443c0647624607d471289b2c7dcd470b    INSTALL
100644 blob 4eb463797adc693dc168b926b6932ff53f17d0b1    Makefile
100644 blob 548142c327a6790ff8821d67c2ee1eff7a656b52    README
...

我知道文件的最后3个八进制数字代表文件的模式,但前面的3个数字代表什么呢?在Git用户手册中找不到答案。


2
Git太烂了...尝试使用类似chmod 0100755 <file>的命令重置权限,以使Git感到高兴。或者更有趣的是,git chmod <perm> <file>,因为Git的文件模式(它不存在)...还可以查看类似于如何从Git的未暂存更改中删除说“旧模式100755新模式100644”的文件?如何将文件权限恢复到Git“认为”应该是的状态?这样的问题。这个工具真是一个烂笑话... - jww
3个回答

154

来自Git的index-format.txt文件,关于模式(mode)的说明:

32-bit mode, split into (high to low bits)

    4-bit object type
      valid values in binary are 1000 (regular file), 1010 (symbolic link)
      and 1110 (gitlink)

    3-bit unused

    9-bit unix permission. Only 0755 and 0644 are valid for regular files.
    Symbolic links and gitlinks have value 0 in this field.

另外,根据fsck.c中的fsck_tree方法,目录对象类型(二进制0100)和组可写(0664权限)的常规文件也是允许的。 常规的不可执行的组可写文件是早期Git版本支持的非标准模式。

这使得有效的模式(以二进制和八进制表示)为:

  • 0100000000000000040000):目录
  • 1000000110100100100644):常规的不可执行文件
  • 1000000110110100100664):常规的不可执行组可写文件
  • 1000000111101101100755):可执行文件
  • 1010000000000000120000):符号链接
  • 1110000000000000160000):Git链接

2
目录模式无效,因为这种情况永远不会发生。Git 不跟踪目录,因为 Git 中的目录只存在于未被 忽略 的内容中。 - nemesis
3
@nemesis Git确实使用目录(040000)模式来表示目录。请参见链接的fsck.c代码,或在包含目录的Git存储库中执行git ls-tree HEAD - Go Dan
2
@Dan Cruz 如果只有16个二进制数字,为什么要写32位模式? - Sevastyan Savanyuk
3
@Sevastyan Git为内部使用保留了16位;请参见cache.h - Go Dan
2
稍作更正,我的上一条评论有误:Git曾经确实记录了组写权限,显然有一些存储库具有mode 100664树条目,因此git fsck允许它们避免声称这些非常古老的存储库是坏的。但是存储组写权限后来被证明效果不佳,代码已经修改以停止这样做。 - torek
显示剩余4条评论

67

这6个数字用经典UNIX符号表示文件的模式。

前两个数字表示文件类型,第三个数字涉及到set-uid/set-gid/sticky位,你知道最后三个数字表示什么。

以下是我的GNU/Linux系统上man 2 stat文档中的说明:

   The following flags are defined for the st_mode field:

       S_IFMT     0170000   bit mask for the file type bit fields
       S_IFSOCK   0140000   socket
       S_IFLNK    0120000   symbolic link
       S_IFREG    0100000   regular file
       S_IFBLK    0060000   block device
       S_IFDIR    0040000   directory
       S_IFCHR    0020000   character device
       S_IFIFO    0010000   FIFO
       S_ISUID    0004000   set UID bit
       S_ISGID    0002000   set-group-ID bit (see below)
       S_ISVTX    0001000   sticky bit (see below)
       S_IRWXU    00700     mask for file owner permissions
       S_IRUSR    00400     owner has read permission
       S_IWUSR    00200     owner has write permission
       S_IXUSR    00100     owner has execute permission
       S_IRWXG    00070     mask for group permissions
       S_IRGRP    00040     group has read permission
       S_IWGRP    00020     group has write permission
       S_IXGRP    00010     group has execute permission
       S_IRWXO    00007     mask for permissions for others (not in group)
       S_IROTH    00004     others have read permission           
       S_IWOTH    00002     others have write permission
       S_IXOTH    00001     others have execute permission

9
值得一提的是,子模块以文件模式160000和对象类型“commit”列出。 - Mark Longair
2
为什么顶部行的前导 0(例如 0170000 而不是 170000),既然所有行都是 0,为什么不省略它呢? - Ciro Santilli OurBigBook.com
15
以前在数字开头加0是表示八进制数的经典惯例。 - adl
8
这个回答是错误的:git并不使用所有这些文件状态标识,而是有一些特殊的标识符(例如子模块有160000)。 - mirabilos

2
为补充 Go Dan回答,Git 2.40(2023年第1季度)新增了以下内容:
commit 3a2ebae (2023年2月1日)由Glen Choo (chooglen) 提交。
(通过Junio C Hamano -- gitster --commit 2c91b13中合并,于2023年2月9日)

docs: document zero bits in index "mode"

Signed-off-by: Glen Choo

Documentation/gitformat-index.txt将“模式(mode)”描述为32位,但仅记录了16位。

文档说明缺失的16位并指定“未使用”的位必须为零。

gitformat-index现在在其手册页面中包含以下内容:

16位未使用,必须为零 ... 3位未使用,必须为零

这意味着格式实际上是:

  • 0(16x) 0100 000 000000000 (040000): 目录
  • 0(16x) 1000 000 110100100 (100644): 普通非可执行文件
  • 0(16x) 1000 000 110110100 (100664): 普通非可执行可组写文件
  • 0(16x) 1000 000 111101101 (100755): 可执行文件
  • 0(16x) 1010 000 000000000 (120000): 符号链接
  • 0(16x) 1110 000 000000000 (160000): Git链接
  • ^^^
  • 始终设为0

注意:代码中的数字为八进制,用括号内的十六进制表示。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接