为什么Scala读取我的CSV时会崩溃?

9
文件在这里 http://dl.dropbox.com/u/12337149/history.csv 我尝试按照以下方式读取数据
  for (line <- Source.fromFile(new File(file)).getLines) {
   println(line)
  }

我收到了以下错误信息。
Exception in thread "main" java.nio.charset.MalformedInputException: Input length = 1
    at java.nio.charset.CoderResult.throwException(CoderResult.java:260)
    at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:319)
    at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:158)
    at java.io.InputStreamReader.read(InputStreamReader.java:167)
    at java.io.BufferedReader.fill(BufferedReader.java:136)
    at java.io.BufferedReader.readLine(BufferedReader.java:299)
    at java.io.BufferedReader.readLine(BufferedReader.java:362)
    at scala.io.BufferedSource$BufferedLineIterator.<init>(BufferedSource.scala:32)
    at scala.io.BufferedSource.getLines(BufferedSource.scala:43)
    at com.alluvia.reports.RunIGConverter$$anonfun$main$1.apply(RunIGConverter.scala:17)
    at com.alluvia.reports.RunIGConverter$$anonfun$main$1.apply(RunIGConverter.scala:15)
    at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:34)
    at scala.collection.mutable.ArrayOps.foreach(ArrayOps.scala:38)
    at com.alluvia.reports.RunIGConverter$.main(RunIGConverter.scala:15)
    at com.alluvia.reports.RunIGConverter.main(RunIGConverter.scala)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at com.intellij.rt.execution.application.AppMain.main(AppMain.java:120)

文件在Excel中可以正常打开。我认为这是某种编码问题,但我不知道解决方法。
1个回答

38

我会尝试使用ISO8859_1编码,如果不行的话可以尝试Cp1252:

Source.fromFile(new File(file), "ISO-8859-1").getLines()

您可以在这里查看Sun Java支持哪些编码。我忘记了是应该使用nio还是io版本。(如我的回答中所示,两者都有使用。)


我曾经遇到过同样的问题。打开文件并使用UTF8保存解决了这个问题。 - Henrique Ferrolho

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接