在文本文件中按行读取、排序,然后覆盖文件。

5

我正在尝试编写一个Go函数,它将读取文本文件中的行,对它们进行排序(按字母顺序),并将它们覆盖回文件。目前,我能够基本模拟cat,但似乎无法操作read_line中元素的内容。

func sort() {

    ff, _ := os.OpenFile(file, os.O_RDWR, 0666)
    f := bufio.NewReader(ff)
    for {
        read_line, _ := f.ReadString('\n')
        fmt.Print(read_line)
        if read_line == "" {
            break
        }
    }
    ff.Close()
}

当我使用ReadString时,如何将每一行存储到一个切片中(或者有更好的方法可以存储它们以便于操作)?然后我会使用sort包类似于这样的方式:

sorted := sort.Strings(lines) 

然后,为了写入文件,我正在使用类似于以下内容的东西,尽管我还没有包含它,因为我还没有让“sort”起作用:
io.WriteString(ff, (lines + "\n"))

感谢您提前给出的任何建议!
4个回答

4
例如,
package main

import (
    "bufio"
    "fmt"
    "os"
    "sort"
)

func readLines(file string) (lines []string, err os.Error) {
    f, err := os.Open(file)
    if err != nil {
        return nil, err
    }
    defer f.Close()
    r := bufio.NewReader(f)
    for {
        const delim = '\n'
        line, err := r.ReadString(delim)
        if err == nil || len(line) > 0 {
            if err != nil {
                line += string(delim)
            }
            lines = append(lines, line)
        }
        if err != nil {
            if err == os.EOF {
                break
            }
            return nil, err
        }
    }
    return lines, nil
}

func writeLines(file string, lines []string) (err os.Error) {
    f, err := os.Create(file)
    if err != nil {
        return err
    }
    defer f.Close()
    w := bufio.NewWriter(f)
    defer w.Flush()
    for _, line := range lines {
        _, err := w.WriteString(line)
        if err != nil {
            return err
        }
    }
    return nil
}

func main() {
    file := `lines.txt`
    lines, err := readLines(file)
    if err != nil {
        fmt.Println(err)
        os.Exit(1)
    }
    sort.Strings(lines)
    err = writeLines(file, lines)
    if err != nil {
        fmt.Println(err)
        os.Exit(1)
    }
}

2
这是一种非常简单的做法。
import (
    "bytes"
    "io/ioutil"
    "sort"
)

// allow [][]byte to implement the sort.Interface interface
type lexicographically [][]byte

// bytes.Compare compares the byte slices lexicographically (alphabetically)
func (l lexicographically) Less(i, j int) bool { return bytes.Compare(l[i], l[j]) < 0 }
func (l lexicographically) Len() int           { return len(l) }
func (l lexicographically) Swap(i, j int)      { l[i], l[j] = l[j], l[i] }

func SortFile(name string) error {
    content, err := ioutil.ReadFile(name)
    if err != nil {
        return err
    }

    lines := bytes.Split(content, []byte{'\n'})
    sort.Sort(lexicographically(lines))

    content = bytes.Join(lines, []byte{'\n'})
    return ioutil.WriteFile(name, content, 0644)
}

你没有检查 scanner.Err。你不需要重新打开文件,只需调用 file.Truncate(0)(忽略不使用第二个文件会导致数据丢失的危险)。而且你没有检查从 file.Close() 返回的错误(在编写文件时可能很重要)。 - Dave C

1

由于您即将对行进行排序,因此基本上需要读取整个文件。 您可以使用io/ioutil.ReadAll slurp文件,也可以编写一个小的slurp函数。 一旦您拥有了文件的行,就可以通过调用sort.Strings来对它们进行排序。 我将添加一个可能过于冗长的版本,希望说明如何完成它。 我还建议阅读这篇关于Go sort包工作原理的优秀解释:Go's sort package

package main

import (
    "os"
    "bufio"
    "fmt"
    "sort"
)

// slurp file into slice of lines/strings
func slurp(f string) (lines []string, e os.Error) {

    var fd *os.File
    var line string
    var bufRd *bufio.Reader
    var keepReading bool = true

    fd, e = os.Open(f)

    if e != nil {
        return nil, e
    }

    defer fd.Close()

    bufRd = bufio.NewReader(fd)

    for keepReading {
        line, e = bufRd.ReadString('\n')
        switch e {
        case nil:
            lines = append(lines, line)
        case os.EOF:
            lines = append(lines, line)
            keepReading = false
        default:
            return lines, e
        }
    }

    return lines, nil
}

// test stuff out..
func main() {

    if len(os.Args) > 1 {

        lines, e := slurp(os.Args[1])

        if e != nil {
            fmt.Fprintf(os.Stderr,"%s\n", e)
            os.Exit(1)
        }

        fmt.Println("\n----- unsorted -----\n")

        for _, line := range lines {
            fmt.Printf("%s", line)
        }

        fmt.Println("\n----- sorted -----\n")

        sort.Strings(lines)

        for _, line := range lines {
            fmt.Printf("%s", line)
        }
    }
}

注意,排序是原地进行的,因此不会返回任何内容。

-3

只是想知道使用Unix的sort在这个目的上有多方便。我知道在许多部署场景中无法使此代码工作,但我认为值得提及作为一个选项:

package main

import (
    "os"
    "os/exec"
)

func main() {
    file := "file.txt"

    command := []string{"sort", file, "-o", file}

    cmd := exec.Command(command[0], command[1:]...)
    cmd.Stdout = os.Stdout
    cmd.Stderr = os.Stderr

    if err := cmd.Run(); err != nil {
        panic(err)
    }
}

有什么想法吗?


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接