是否有一种直接的方法可以将CSV文件的内容导入记录数组中,就像R语言的 read.table()
、read.delim()
和 read.csv()
将数据导入到R数据框中那样?
或者我应该使用csv.reader()
然后再应用numpy.core.records.fromrecords()
吗?
是否有一种直接的方法可以将CSV文件的内容导入记录数组中,就像R语言的 read.table()
、read.delim()
和 read.csv()
将数据导入到R数据框中那样?
或者我应该使用csv.reader()
然后再应用numpy.core.records.fromrecords()
吗?
最新的pandas和numpy版本提供此功能。
import pandas as pd
import numpy as np
data = pd.read_csv('data.csv', header=None)
# Discover, visualize, and preprocess data using pandas if needed.
data = data.to_numpy()
我尝试了这个:
import pandas as p
import numpy as n
closingValue = p.read_csv("<FILENAME>", usecols=[4], dtype=float)
print(closingValue)
In [329]: %time my_data = genfromtxt('one.csv', delimiter=',')
CPU times: user 19.8 s, sys: 4.58 s, total: 24.4 s
Wall time: 24.4 s
In [330]: %time df = pd.read_csv("one.csv", skiprows=20)
CPU times: user 1.06 s, sys: 312 ms, total: 1.38 s
Wall time: 1.38 s
这是一个非常简单的任务,最好的方法是这样的
import pandas as pd
import numpy as np
df = pd.read_csv(r'C:\Users\Ron\Desktop\Clients.csv') #read the file (put 'r' before the path string to address any special characters in the file such as \). Don't forget to put the file name at the end of the path + ".csv"
print(df)`
y = np.array(df)
numpy
数组。将其作为dataframe
读取并转换为numpy array
需要更多的存储空间和时间。 - user3503711