def lineGenerator():
with open(INPUT_FILENAMES_TITLE[0],'r') as f1:
title_reader = csv.reader(f1)
for line in title_reader:
yield line[0]
然后你可以调用分类器
clf = LinearSVC()
clf.fit(lineGenerator())
这假设 INPUT_FILENAMES_TITLE[0] 是你的文件名。
Fit()
在开始批量学习之前仍会将所有数据读入内存,因此使用生成器不会显着改变整体性能。我想你可能将其与partial_fit()
混淆了,后者确实可以通过逐行读取数据文件的生成器来逐步进行学习。不幸的是,LinearSVC
不支持partial_fit()
。 - Cerin
SGDClassifier
来实现与LinearSVC
相同的模型。 - Fred FooLinearSVC
)的讨论。这可能会导致更可扩展的实现。不过不要抱太大希望。 - Fred Foo