我是Python和Pandas的新手,花了很多时间搜索但没有找到解决我的问题的答案。
我有一个数据框,其中前几行只是以'#'开头的注释,接着是包含行和列的通常数据框。我有数百个这样的文本文件需要读取和操作。例如:
'#' blah1
'#' blah2
'#' blah3
Column1 Column2 Column3
a1 b1 c1
a2 b2 c2
等等。
我想删除所有以'#'开头的行。有人能告诉我如何在Pandas中实现这一点吗?
或者,我尝试使用以下代码来读取文本文件:
my_input=pd.read_table(filename, comment='#', header=80)
但问题在于每个文本文件的标题行都不同。有没有一种方法可以概括并告诉Python我的标题在以“#”开头的最后一行下方?
df = pd.read_csv(StringIO(s), sep=' ', comment="'")
- joris