我有一个大小为120MB的大型文本数据文件(目前只有一个)。
将它放在代码仓库里是不是一个不好的做法?这会影响GitHub上的搜索功能吗?
看起来这是一个坏主意,因为整个源代码只有900行。
但不打算更新这个文件。
可以将其放在Dropbox或Google Docs中,但那样它就与代码仓库分离了。
如果不使用GitHub,是否有更好的管理/备份大型数据文件的方法?
我有一个大小为120MB的大型文本数据文件(目前只有一个)。
将它放在代码仓库里是不是一个不好的做法?这会影响GitHub上的搜索功能吗?
看起来这是一个坏主意,因为整个源代码只有900行。
但不打算更新这个文件。
可以将其放在Dropbox或Google Docs中,但那样它就与代码仓库分离了。
如果不使用GitHub,是否有更好的管理/备份大型数据文件的方法?
Git LFS大文件存储 允许您在同一个远程存储库中跟踪、提交和推送二进制文件、数据文件、图像等,如果克隆存储库,则无需拉取所有内容。
git-annex 使用它自己的命令,因此您将单独提交存储库和带有附加文件的文件。它看起来非常适合在任何远程上管理这些文件,如硬盘驱动器、S3、Google Drive 等。
有人在这里对比了git-annex和git lfs,而这篇文章则简短地比较了几种方法。
它们都很棒,目前git annex更加成熟,但我使用的是由github开发的git lfs。
.gitignore
这样的 git 文件包含链接,那就完美了。它可以是 .gitlinks
。每个文件都可以在仓库和远程服务器(如 S3)上有一个位置。一个 git 命令可以将它们下载到仓库中的相应位置。而且 git 会知道不要上传它们,因为它们实际上不是仓库的一部分。 - B Seven您可以将它放到GitHub上,但我建议将其放在另一个存储库中,并通过子模块链接到它。这将确保文件不会被传输/调整,除非您通过子模块命令明确执行。
pages.github.com不是正确的位置。
github:help非常清楚地回答了这个问题(我也在寻找它们)。
https://help.github.com/articles/what-is-my-disk-quota
大型媒体文件
二进制媒体文件与Git不太兼容。对于这些文件,通常最好使用专门为您使用的服务。
对于像视频和音乐这样的大型媒体文件,您应该自己托管文件或使用像Vimeo或Youtube这样的服务。
对于像PSD和3D模型这样的设计文件,Dropbox这样的服务通常非常适用。这就是GitHub的设计师用来保持同步的方式;只有最终的图像资产被提交到我们的存储库中。
和https://help.github.com//articles/distributing-large-binaries