存储库中的大型测试数据集

7
假设我正在开发一些开源软件,用解释性语言编写,管理为Git repo,并需要一个大型数据集(+300 MB)进行基本测试。
测试数据应该放在与源代码相同的存储库中,并使用compileToZipFile.sh脚本发布版本吗?还是将其存储为两个单独的存储库,即srcRepotestRepo
任何最佳实践/约定都将不胜感激。
1个回答

1

我认为对这个问题最好的答案应该基于需求。

在我的工作中,我们按环境类型将代码/测试数据分离,例如:

  • 测试
  • QA
  • 暂存
  • 生产

某些环境与生产环境具有相同的数据,而其他环境则具有较旧(或完全不同)的数据。这样做的好处是:

  • 沙盒可以测试、实现和尝试新的想法/技术。
  • 您不会影响到客户端所见的实时数据。
  • 集成测试可以针对与主代码库无关的特定方面进行调整/聚焦。
现在,关于你的问题...正如我上面提到的那样,数据的分离使我们能够快速进行更改和实现新功能,因为我们使用的数据集中在我们正在测试的内容上。我们有三个主干,它们都有独立的测试数据,这些数据特定于需要测试的内容。当测试“View”时,我们有一组测试;当测试“Model”时,我们有另一组测试;当测试“Controller”时,我们有另一组测试。最后,在发布新版本时运行一组综合测试。除了最后一个测试外,其他所有测试都与它们所属的组件一起存在;但是,由于它们是综合测试,因此将它们与它们验证的三个部分分开保持独立是有意义的。
我认为你的想法很不错。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接