如何对 List<List<String>> 进行排序

3
我得到了一个任务,要对文本文件进行排序,满足以下要求:
  1. 按列排序
  2. 按第一列排序(如果列中的数据相同,则按第二列排序),行中的数据在排序后保持不变;
  3. 数字必须按升序排序,字母按字母顺序排序,数字比字母大;
  4. 列用制表符("\t")分隔。
这是我的操作过程: 读取文件并将所有内容复制到List>中,其中List的每个元素都是存储在文件中的一行。以下是代码:
public class ReadDataFile {
public static List<List<String>> readData(String fileName) throws IOException {
    BufferedReader br = new BufferedReader(new FileReader(fileName + ".txt"));
    List<List<String>> data = new ArrayList<List<String>>();
    String line;
    while (true) {
        line = br.readLine();
        if (line == null)
            break;
        List<String>lines = Arrays.asList(line.split("\t"));
        data.add(lines);
        System.out.println(lines);
    }
    br.close();
    return data;

并将数据写入另一个文件:
    public void writeToFile(String fileName) throws IOException {
    FileWriter writer = new FileWriter(fileName);
    List<List<String>> data = ReadDataFile.readData("input");

    Collections.sort(data, new Comparator<List<String>>() {
        @Override
        public int compare(List<String> o1, List<String> o2) {
            // TODO Auto-generated method stub
            return o1.get(0).compareTo(o2.get(0));
        }
    });

    for (List<String> lines : data) {
        for (int i = 0; i < lines.size(); i++) {
            writer.write(lines.get(i));
            if (i < lines.size() - 1) {
                writer.write("\t");
            }
        }
        writer.write("\n");

    }
    writer.close();
}

问题在于:
public int compare(List<String> o1, List<String> o2) {
  // TODO Auto-generated method stub
  return o1.get(0).compareTo(o2.get(0));
}

无法正确排序我所需的内容。
以下是输入文件的示例:
-2.2 2 3 4 329 2
2.2 12345q 69 -afg
2.2 12345q 69 -asdf
-22 1234234 asdfasf asdgas
-22 11 abc
-22 -3 4
-1.1
qqqq 1.1

期望的输出结果是:
-22 -3 4
-22 11 abc
-22 1234234 asdfasf asdgas
-2.2 2 3 4 329 2
-1.1
 2.2 12345q 69 -afg
 2.2 12345q 69 -asdf
 qqqq 1.1

但是,我得到的是:
-1.1
-2.2 2 3 4 329 2
-22 -3 4
-22 11 abc
-22 1234234 asdfasf asdgas
 2.2 12345q 69 -afg
 2.2 12345q 69 -asdf
 qqqq 1.1

问题是如何编写适当的排序?谢谢回答。

1
你的问题不是对列表进行排序,而是比较包含数字的字符串,并期望比较行为像数字一样,即当比较字符串时,"2"大于"10",因为字符被比较,'2'大于'1'(同样,"-22"大于"-2.2",因为'2''.'被比较)。你需要解析这些字符串以获得数字比较(并检查它们是否为数字)。 - Thomas
你可以使用Collections.sort函数,请参考这个链接https://dev59.com/VGw05IYBdhLWcg3w4165 - David Hackro
@DavidHackro 他已经在使用这个了:Collections.sort(data, new Comparator<List<String>>() { ... } - Thomas
一个 SC 更高,所以它排序更靠后。说“数字比字母高”意味着数字在字母之后排序,但是你的示例却相反。请明确语言。另外,字母排序是否区分大小写?重音字母呢?您想按某种语言排序吗?例如,在德语中,üu 排序相同吗? - Andreas
抱歉,@Thomas,请问您在比较列表时的条件是什么?也许是大小吗? - David Hackro
显示剩余3条评论
1个回答

2
看起来您想要将有效数字的字符串值使用数字比较进行排序。由于您的示例包含非整数值,因此可以选择使用doubleBigDecimal进行数字比较。下面的代码使用BigDecimal,因此可以比较任何大小的数字,而不会失去精度,但它不支持特殊值"Infinite""-Infinite""NaN",以及Double.parseDouble()支持的HexFloatingPointLiteral格式。
将数字与字符串进行比较应该将数字排在字符串之前。
对于字符串与字符串之间的比较,可以按字典顺序排序(即按照字母表顺序排序)、不区分大小写地排序,或使用{{link2:Collator}}进行区域敏感的比较。下面的代码使用默认区域设置的 Collator。
比较将首先比较列表的第一个值,如果相等,则比较第二个值,以此类推。如果一个列表较短,并且在该点上两个列表相等,则较短的列表排在前面。
public final class NumberStringComparator implements Comparator<List<String>> {
    private Collator collator = Collator.getInstance();
    @Override
    public int compare(List<String> r1, List<String> r2) {
        for (int i = 0; ; i++) {
            if (i == r1.size())
                return (i == r2.size() ? 0 : -1);
            if (i == r2.size())
                return 1;
            String v1 = r1.get(i), v2 = r2.get(i);
            BigDecimal n1 = null, n2 = null;
            try { n1 = new BigDecimal(v1); } catch (@SuppressWarnings("unused") NumberFormatException unused) {/**/}
            try { n2 = new BigDecimal(v2); } catch (@SuppressWarnings("unused") NumberFormatException unused) {/**/}
            int cmp = (n1 == null ? (n2 == null ? this.collator.compare(v1, v2) : 1) : (n2 == null ? -1 : n1.compareTo(n2)));
            if (cmp != 0)
                return cmp;
        }
    }
}

测试
String input = "-2.2\t2\t3\t4\t329\t2\n" +
               "2.2\t12345q\t69\t-afg\n" +
               "2.2\t12345q\t69\t-asdf\n" +
               "-22\t1234234\tasdfasf\tasdgas\n" +
               "-22\t11\tabc\n" +
               "-22\t-3\t4\n" +
               "-1.1\n" +
               "qqqq\t1.1";
List<List<String>> data = new ArrayList<>();
try (BufferedReader in = new BufferedReader(new StringReader(input))) {
    for (String line; (line = in.readLine()) != null; )
        data.add(Arrays.asList(line.split("\t")));
}
data.sort(new NumberStringComparator());
data.forEach(System.out::println);

Output

[-22, -3, 4]
[-22, 11, abc]
[-22, 1234234, asdfasf, asdgas]
[-2.2, 2, 3, 4, 329, 2]
[-1.1]
[2.2, 12345q, 69, -afg]
[2.2, 12345q, 69, -asdf]
[qqqq, 1.1]

不错的回答。解释和可运行代码的结合很棒。 - GhostCat
谢谢,这正是我需要的排序逻辑,并且你的代码运行得很好,但是如果我尝试使用从文件读取的数据,它仍然像这样排序: -1.1 -2.2 2 3 4 329 2 -22 -3 4 -22 11 abc -22 1234234 asdfasf asdgas 2.2 12345q 69 -afg 2.2 12345q 69 -asdf qqqq 1.1 - Stonecold
@Stonecold,我不明白你的评论是什么意思,也许你的文本不是以制表符分隔的?如果文本是以空格分隔的,则整行都是一个值,而这个值不是数字,那么你基本上只需要进行普通的行排序,而不是按(数字)列排序。 - Andreas
也许在评论中它显示不正确,但它是以制表符分隔的,但排序结果与我在第一篇帖子中描述的相同(如果我使用文件中的数据,如果我使用您的示例排序和打印一切都很好,但问题是我需要从文件中对数据进行排序)。 - Stonecold
@Stonecold,我不知道你的文件内容与示例中给出的“input”字符串的内容有何不同,因此无法确定你做错了什么。但是,即使你的问题文本中的值之间没有制表符,而是空格,请再次检查你的文本文件。 - Andreas
@Andreas 谢谢你的帮助,问题是我的文件被空格分隔,编辑为制表符分隔后一切运行良好。 - Stonecold

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接