直接将CSV文件下载到Python CSV解析器中

Question

直接将CSV文件下载到Python CSV解析器中

3

我正在尝试从晨星网下载CSV内容，然后解析其内容。如果我直接将HTTP内容注入到Python的CSV解析器中，结果格式不正确。但是，如果我将HTTP内容保存到文件（/tmp/tmp.csv），然后在Python的CSV解析器中导入该文件，则结果是正确的。换句话说：

def finDownload(code,report):
    h = httplib2.Http('.cache')
    url = 'http://financials.morningstar.com/ajax/ReportProcess4CSV.html?t=' + code + '&region=AUS&culture=en_us&reportType='+ report + '&period=12&dataType=A&order=asc&columnYear=5&rounding=1&view=raw&productCode=usa&denominatorView=raw&number=1'
    headers, data = h.request(url)
    return data

balancesheet = csv.reader(finDownload('FGE','is'))
for row in balancesheet:
    print row

返回：

['F']
['o']
['r']
['g']
['e']
[' ']
['G']
['r']
['o']
['u']
     (etc...)

改为:

[Forge Group Limited (FGE) Income Statement']

?

- Matthew Brown

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Tim Pietzcker · Accepted Answer

这个问题的原因是文件迭代是逐行进行的，而字符串迭代是逐字符进行的。

你需要使用 StringIO/cStringIO (Python 2) 或者 io.StringIO (Python 3, 感谢 John Machin 的指点) 将字符串转换为类似文件的对象： Python 2:

mystring = 'a,"b\nb",c\n1,2,3'
import cStringIO
csvio = cStringIO.StringIO(mystring)
mycsv = csv.reader(csvio)

Python 3：

mystring = 'a,"b\nb",c\n1,2,3'
import io
csvio = io.StringIO(mystring, newline="")
mycsv = csv.reader(csvio)

两种方法都可以正确地保留引号内部的换行符:

>>> for row in mycsv: print(row)
...
['a', 'b\nb', 'c']
['1', '2', '3']