一些背景,我有一些数据正在进行文本分析,我刚刚对它们进行了令牌化,并且我想将数据帧列中的所有列表合并以进行进一步处理。
我的数据框如下:
我想要将“text”列中的所有列表合并为一个列表,并删除开/关的引号。
就像这样:
我的数据框如下:
df = pd.DataFrame({'title': ['issue regarding app', 'graphics should be better'], 'text': [["'app'", "'load'", "'slowly'"], ["'interface'", "'need'", "'to'", "'look'", "'nicer'"]]})`
我想要将“text”列中的所有列表合并为一个列表,并删除开/关的引号。
就像这样:
lst = ['app', 'load', 'slowly', 'interface', 'need', 'to', 'look', 'nicer']`
感谢您的所有帮助!
sum
函数来展开一个列表的列表可能看起来很花哨,但是它是低效的(参见 https://dev59.com/Zp3ha4cB1Zd3GeqPQS0z)。 - mozway['[', '', 'a', 'p', 'p', '', ' ', 'l', 'o', 'a', 'd', '', ...]
- Qaaqq11282211