我觉得我可能会漏掉一些显而易见的东西,但我是新手,正在学习Python和Pandas。我正在阅读一个大型文本文件,只想使用范围在61到75496行内的数据。我可以使用以下代码跳过前60行:
keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60)
如何只包含这些值之间的行?不幸的是,没有userows参数可用。
是否有类似的东西?
range(start, stop, start, stop)?
根据文档,您可以使用skiprows = X
跳过前几行,其中X是整数。如果您的文件有标题行,并且该行在数行之后,您还可以使用header = X
跳转到标题行。
使用skipfooter = X
可以从文件底部向上计数跳过行。
如果需要同时实现将标题设置为第3行(跳过上面的行)和忽略底部4行,则可以使用如下代码:pd.read_csv('path/or/url/to/file.csv', skiprows=3, skipfooter=4)
nrows
参数来指定要读取的行数。nrows : int, default None
Number of rows of file to read. Useful for reading pieces of large files
代码 -
keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60,nrows=75436) #Here 75436 is 75496 - 60
nrows
参数。keywords = pd.read_csv('keywords.list', sep='\t', skiprows=60, nrows=(74596-60))