我在尝试使用.isin()时遇到了一些意外的错误。
问题是这样的。我已经从网站上抓取了数据,并将其转换为数据框。现在我想对数据进行更改,以使其更适合项目使用。
从抓取的数据中,有一列包含所有的特征,它是一个json格式的列表,但在pd中,它是一个非空对象:
"feature": ["Wi-Fi", "LAN", "LED"]
我希望基于每个特征创建新的布尔列,这将在未来非常有用。 它应该像这样:
Product Wifi LAN LED
1 True True True
2 True False False
我尝试了 str.contains 和 .isin(),但是只得到了错误。例如
TypeError: only list-like objects are allowed to be passed to isin(), you passed a [str]
ValueError: Length of values does not match length of index
如何更好地解决这个问题?
另外,原始数据是用日语编写的,我使用"encoding="utf-8"将数据加载到数据框中。当在pandas中使用utf8时,最佳编码方法是什么?我正在使用Notepad++作为编辑器。
feature
是什么 - 它是一个JSON字符串还是一个特征列表? - MaxU - stand with Ukraine