生成逼真随机/测试数据的数据集

8

如何获取用于生成随机或测试数据的数据集,例如具有分布的姓名/姓氏、地址数据、大学/学校名称、公司名称等?

我已经找到了英语名字和姓氏的列表,并记录了它们的数量(不幸的是我没有记下来从哪里得到的)。我从波兰得到了地址数据库。然而,其他国家的这些数据集对我也非常有用。同样,大学和学校的名称也很重要。

您需要哪些数据作为此类信息的来源?您能提供此类数据的链接吗?(当然,只有那些免费公开可用的)


我正在标记此问题,因为它不适合在Stack Overflow上发布。要求我们推荐或查找书籍、工具、软件库、教程或其他外部资源的问题都不适合在Stack Overflow上发布,因为它们往往会吸引主观的答案和垃圾邮件。相反,请描述问题以及已经采取的解决方案。 - AStopher
5个回答

4

第二个链接很不错,它包含了我需要的一些数据,但我仍然希望有更广泛的数据集。第一个是商业的,第二个则完全是随机的。 - Danubian Sailor

4

2

我一直在尝试,但是在那个页面上找不到下载链接。 - Danubian Sailor

2

试试http://www.mockaroo.com

你可以在CSV、tab分隔和SQL格式中生成高达100,000行的数据,保存和重用模式,并使用curl自动化测试数据生成。


1

http://randomprofile.com/api-for-developers/上有一个免费的API可用于生成测试用户资料,包括姓名、姓氏、地址、银行信息、信用卡号码、血型等。不确定是否包含学校信息,但如果你需要处理亚洲用户的数据,则非常有用。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接