如何创建GitHub仓库的完整离线存档?

7
我们有一些不再需要在GitHub上保留的存储库。如果我们使用GitHub的归档功能,这些存储库实际上仍然在线。相反,我们想要的是一种方法来下载给定存储库的所有内容(包括问题报告)的存档,将该存储库存档放入长期保存系统中,并从GitHub中删除该存储库。这不仅仅是备份存储库的意义上类似于Stack Overflow上其他类似问题的备份存储库,而更像是BackHub可以做到的。是否有工具或一组程序(超出git clone)可以让我做到这一点?

你可以使用Repo Restore来完成。它可以捕获所有的问题、发布等,并让你将其下载到本地机器上。 - Red-Tune-84
3个回答

4

python-github-backup 可以备份一个组织账户中的单个存储库,以及账户中的所有存储库。我已经在个别存储库上尝试过它,并且它按照期望的方式工作:使用其--all选项,它可以捕获问题、标签、里程碑、拉取请求和维基页面,以及存储库本身。

谷歌搜索“github-backup”会导致其他类似的工具,但大多数其他工具似乎比python-github-backup功能更少,或者已经很多年没有更新了。然而,我必须承认我没有非常仔细地探索其他选项。

提示:使用Google查找合适的工具的关键是要专门搜索“github”和“backup”这两个词,不要像我最初搜索时那样包含“archive”,甚至使用更复杂的搜索字符串,如“how make backup github repository”。


2

如果使用git clone --mirror,则更好,以获取完整的存储库历史记录,然后

  • git bundle --all 仅获取一个文件(比一组文件更容易存储)
  • 长期存储系统(例如 AWS S3

注意:


-2

使用您本地机器、谷歌云盘或 Dropbox 上的文件夹。对于非活动项目,无需使用 Github。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接