我是Python的新手,仍在努力摆脱C++编程技术,因此如果这是一个微不足道的问题,请原谅我。我似乎找不到最Pythonic的方法来做到这一点。
我有两个字典列表。两个列表中的每个字典都可能包含嵌套的字典。(如果您感兴趣,实际上是一些Yelp数据。)第一个字典列表包含以下条目:
{business_id': 'JwUE5GmEO-sH1FuwJgKBlQ',
'categories': ['Restaurants'],
'type': 'business'
...}
第二个字典列表包含以下条目:
{'business_id': 'vcNAWiLM4dR7D2nwwJ7nCA',
'date': '2010-03-22',
'review_id': 'RF6UnRTtG7tWMcrO2GEoAg',
'stars': 2,
'text': "This is a basic review",
...}
我想要做的是从第二个列表中提取出与第一个列表中特定类别匹配的所有条目。例如,如果我对餐馆感兴趣,我只想要第二个列表中的条目,其中
business_id
与第一个列表中的business_id
匹配,并且单词Restaurants
出现在categories
值列表中。如果我在SQL中将这两个列表作为表格,我会在
business_id
属性上执行连接,然后只需简单过滤以获取所需行(其中Restaurants
IN categories
或类似内容)。这两个列表非常大,因此我遇到了效率和内存空间问题。在将所有内容放入SQL数据库之前,有人能给我一些指导吗?我已经使用Pandas进行了一些尝试,因此我在这方面有一些有限的经验。我在合并过程中遇到了一些问题。