79得票11回答
StreamWriter 和 UTF-8 字节顺序标记

我在使用StreamWriter和字节顺序标记时遇到了问题。文档似乎表明Encoding.UTF8编码启用了字节顺序标记,但是在写入文件时,有些文件有标记,而有些文件没有。 我是按以下方式创建流写入器的:this.Writer = new StreamWriter(this.Stream, ...

46得票4回答
如何确定文件编码?

我有一个用VIM创建的PHP文件,但不确定它的编码方式。 当我在终端中使用命令file -bi foo检查编码方式时(我的操作系统是Ubuntu 11.04),它给出了下一个结果: text/html; charset=us-ascii 但是,当我使用gedit打开该文件时,它显示的编码...

36得票6回答
File.listFiles()在JDK 6中会破坏Unicode名称(Unicode规范化问题)

我有一个问题,当在Java 6上列出OS X和Linux中的目录内容时,遇到了一种奇怪的文件名编码问题:似乎File.listFiles()等方法返回的文件名与系统其他部分使用的编码不同。 请注意,仅仅是这些文件名的显示并不会引起我的问题。我主要关心将文件名与远程文件存储系统进行比较,因此我...

30得票1回答
PowerShell out-file: 防止编码更改

我正在尝试使用PowerShell自动化一些搜索和替换操作。不幸的是,昨天我发现我们的代码库中有不同的文件编码格式(UTF8和ASCII)。由于我们正在另一个分支上执行这些搜索和替换操作,因此我无法在此阶段更改文件编码格式。 即使我将默认的PowerShell编码设置为iso-8859-1(...

23得票1回答
PowerShell:获取默认系统编码

PowerShell命令out-file有一个开关-encoding,您可以将其设置为default。此默认值将使用系统当前ANSI代码页的编码。 我的问题是:如何在PowerShell中获取out-file将使用的此默认编码的名称?

14得票4回答
为什么R将UTF-8头部读取为文本?

我将一个Excel表格保存为文本文件(*.txt)。不幸的是,Excel没有让我选择编码方式。所以我需要在记事本中打开它(默认为ANSI编码),并将其另存为UTF-8编码。然后,在我使用R语言读取该文件时: data <- read.csv("my_file.txt",header=T...

12得票5回答
如何将Delphi IDE的默认文件格式设置为UTF8?

Delphi 2009将新的源代码文件默认文件格式设置为ANSI,这使得源代码具有平台依赖性。即使是在IDE中创建的新XSD文件,默认情况下也是以此行开头<?xml version="1.0" encoding="UTF-8" ?> Delphi将文件格式设置为ANSI(这似乎是一...

12得票3回答
Linux 上的 Java 字符集问题

问题:我有一个包含特殊字符的字符串,我将其转换为字节,反之亦然...在Windows上转换正常,但在Linux上特殊字符无法正确转换。在Linux上的默认字符集是UTF-8,可以通过Charset.defaultCharset.getdisplayName()进行查看。 然而,如果我在Lin...

8得票4回答
将Mac Roman字符转换为相应的UTF-8

我得到了一些使用Mac OS Roman文件编码的HTML文件。这些文件包含法语文本,但是在编辑器中,许多重音符号看起来很奇怪(即非法语)。 Si cette option est sÈlectionnÈe, <removed> tentera de communiquer av...

7得票2回答
在Java中有检查.txt文件字符集编码的方法吗?

有没有办法使用Java检查文本文件(.txt)是否采用Unicode或UTF-8编码?