我需要找出一个提交是否属于特定的git仓库。
我的想法是为每个我需要测试的仓库生成一个唯一的ID。 然后,我可以将此唯一ID与从已测试的提交计算出的ID进行比较。
例如,可以使用初始更改集的SHA。它能唯一地识别存储库吗?
我需要找出一个提交是否属于特定的git仓库。
我的想法是为每个我需要测试的仓库生成一个唯一的ID。 然后,我可以将此唯一ID与从已测试的提交计算出的ID进行比较。
例如,可以使用初始更改集的SHA。它能唯一地识别存储库吗?
(从评论中移动)
如果您的存储库中没有特定提交的父级(在这种情况下,您可以轻松回答问题),则不可能实现。虽然提交保留对父级的引用并以此方式维护整个树的完整性,但如果您没有该提交,则无法仅从哈希重建提交,因此您无法找到该父级的父级,直到找到实际位于您的存储库中的父级。
mercurial/treediscovery.py
(Mercurial存储库标识):base = list(base)
if base == [nullid]:
if force:
repo.ui.warn(_("warning: repository is unrelated\n"))
else:
raise util.Abort(_("repository is unrelated"))
base
变量存储两个仓库的最后公共部分。
Git在fetch/push时发出“warning: no common commits”的警告时有相同的假设。我只是没有搜索需要时间的Git源代码。
通过提供Mercurial push/pull检查的这个想法,我们可以假定如果两个仓库具有共同的根,则它们是相关的。对于Mercurial来说,这意味着从以下命令的哈希值:
$ hg log -r "roots(all())"
对于两个仓库,都必须有非空的插入语。
您不能通过精心制作仓库来欺骗根检查,因为构建两个仓库看起来像这样(具有共同部分但不同的根):
0 <--- SHA-256-XXX <--- SHA-256-YYY <--- SHA-256-ZZZ
0 <--- SHA-256-YYY <--- SHA-256-ZZZ
这是不可能的,因为这意味着你要反向计算SHA-256,而每个后续哈希都依赖于先前的值。这对Mercurial和Git都是正确的。
在Git中查看根目录的相应命令是:
$ git log --format=oneline --all --max-parents=0
你可以自己玩弄:
bash# md git
/home/user/tmp/git
bash# md one
/home/user/tmp/git/one
bash# git init
Initialized empty Git repository in /home/user/tmp/git/one/.git/
bash# echo x1 > x1
bash# git add x1
bash# git ci -m x1
[master (root-commit) 1208fb0] x1
bash# echo x2 > x2
bash# git add x2
bash# git ci -m x2
[master 1c3fe86] x2
bash# cd ..
bash# md two
/home/user/tmp/git/two
bash# git init
Initialized empty Git repository in /home/user/tmp/git/two/.git/
bash# echo y1 > y1
bash# git add y1
bash# git ci -m y1
[master (root-commit) ff56a8e] y1
bash# echo y2 > y2
bash# git add y2
bash# git ci -m y2
[master 18adff5] y2
bash# git fetch ../one/
warning: no common commits
remote: Counting objects: 6, done.
remote: Compressing objects: 100% (3/3), done.
remote: Total 6 (delta 0), reused 0 (delta 0)
Unpacking objects: 100% (6/6), done.
From ../one
* branch HEAD -> FETCH_HEAD
bash# git co --orphan one
Switched to a new branch 'one'
bash# git merge FETCH_HEAD
bash# git log --format=oneline --all
18adff541c7ce9f1a1f2be2804d6d0e5792ff086 y2
ff56a8e7e9145d2b1b5a760bbc9b12451927ab0c y1
1c3fe8665851e89d37f49633cd2478900217b91c x2
1208fb0f721005207c6afe6a549a9ed0dcc5b0a8 x1
bash# git log --format=oneline --all --max-parents=0
ff56a8e7e9145d2b1b5a760bbc9b12451927ab0c y1
1208fb0f721005207c6afe6a549a9ed0dcc5b0a8 x1
bash# git log --all --graph
* commit 18adff541c7ce9f1a1f2be2804d6d0e5792ff086
| y2
|
* commit ff56a8e7e9145d2b1b5a760bbc9b12451927ab0c
y1
* commit 1c3fe8665851e89d37f49633cd2478900217b91c
| x2
|
* commit 1208fb0f721005207c6afe6a549a9ed0dcc5b0a8
x1
注意 Git 允许部分检出。我没有针对 --max-parents=0
进行过此类检查。
git filter-branch
来寻找你要查找的提交记录。.gituuid
文件中很有用,该文件也会被提交:uuidgen > .gituuid
git add .gituuid
git commit -m "Add: git uuid" .gituuid
这个全局解决方案可以唯一地标识一个仓库,但是只有在您拥有写入权限时才相关。
注意:我还有其他脚本来跟踪这些 Git UUID,并允许我定位关联的仓库在我的文件系统中的位置。但这超出了本文的范围。
git rev-list --parents HEAD
输出的最后一个哈希值。
if git cat-file -e $thecommit; then the commit exists in the repo; fi
- jthill