存储库中的大型测试数据集

Question

存储库中的大型测试数据集

gittestingrepository

7

假设我正在开发一些开源软件，用解释性语言编写，管理为Git repo，并需要一个大型数据集（+300 MB）进行基本测试。

测试数据应该放在与源代码相同的存储库中，并使用compileToZipFile.sh脚本发布版本吗？还是将其存储为两个单独的存储库，即srcRepo和testRepo？

任何最佳实践/约定都将不胜感激。

- supyo

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Brian · Accepted Answer

我认为对这个问题最好的答案应该基于需求。

在我的工作中，我们按环境类型将代码/测试数据分离，例如：

测试
QA
暂存
生产

某些环境与生产环境具有相同的数据，而其他环境则具有较旧（或完全不同）的数据。这样做的好处是：

沙盒可以测试、实现和尝试新的想法/技术。
您不会影响到客户端所见的实时数据。
集成测试可以针对与主代码库无关的特定方面进行调整/聚焦。

现在，关于你的问题...正如我上面提到的那样，数据的分离使我们能够快速进行更改和实现新功能，因为我们使用的数据集中在我们正在测试的内容上。我们有三个主干，它们都有独立的测试数据，这些数据特定于需要测试的内容。当测试“View”时，我们有一组测试；当测试“Model”时，我们有另一组测试；当测试“Controller”时，我们有另一组测试。最后，在发布新版本时运行一组综合测试。除了最后一个测试外，其他所有测试都与它们所属的组件一起存在；但是，由于它们是综合测试，因此将它们与它们验证的三个部分分开保持独立是有意义的。

我认为你的想法很不错。