Eclipse字符编码

14

我正在使用Java中的Scanner扫描一个.txt文档。但是,当我在Eclipse中打开这个.txt文档时,我注意到有一些字符不能被识别,并且它们被替换成像这样的东西:

这些字符甚至不让我扫描文件

    while(scan.hasNext)

如果这些字符不存在,自动返回false(如果这些字符不在,那么我可以很好地扫描文档)。

那么,我该如何让Eclipse识别这些字符,以便我可以扫描?我无法手动删除它们,因为文档非常大。谢谢。


这意味着文件中有不可打印的字符,或者你正在使用的字符集(可能是默认的)与该文件不符。 - Brian Roach
3个回答

26
如果需要更改整个Eclipse Workspace的字符编码,请转到"窗口"->"首选项"。然后在 "常规"->"工作空间" 下,将 "文本文件编码" 更改为适当的字符编码(在此示例中为UTF-8)。 Eclipse首选项-更改字符编码

22

你正在阅读的文件必须包含UTF-8或其他编码字符,当你尝试在控制台上打印这些字符时,会出现一些 �' 字符。这是因为Eclipse中默认的控制台编码不是UTF-8。你需要通过转到 “Run Configuration -> Common -> Encoding -> 从下拉菜单中选择UTF-8 ” 进行设置。请查看下面的屏幕截图:

输入图像描述


在您的图像中,它显示为“默认-继承(UTF-8)”。那么它不是UTF-8吗? - GregT
@GregT 是的,在这种情况下,正如答案中提到的那样,它是一些其他编码而不是UTF-8。 - Juned Ahsan
1
默认情况下,运行配置的编码继承工作区的设置。根据@HeavyE的回答,您最好将整个工作区字符集更改为UTF-8(菜单> Windows>首选项:在标签中:常规>工作区)。 - Witold Kaczurba

0
如果之前的解决方法都没有起作用,你可以通过更改你的区域设置来解决这个问题,如果你使用的是 Windows 11 操作系统。 点击此处查看

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接