Java中解析固定宽度文本日志的技巧

Question

Java中解析固定宽度文本日志的技巧

3

我正在尝试找出最佳方法来解析以下日志文件，将每个由水平线分隔的部分分开，并提取各种数据，例如“COMPANY123”，“BIMMU”，日期（2/18等），然后创建一个包含该部分中所有其他数据的字符串，以水平线为分隔符。

即，我想创建一个“语句”对象数组，每个对象都具有以下属性：

Company name, Account, Date, Data.

例如，对于下面的第二条记录，

Account = 'BIMMU'
Firm = 'Super Corporation'
Date= 9/14/11
Data = '* * * * * * * * TODAYS ACCOUNT ACTIVITY * * * * * * * * * * *
        9/14/11 Y9 CALL OESX OCT 11 ........ etc'

日志是一个固定宽度的文本文件，变量（如日期等）总是出现在同一行的相同位置，例如：sSalesCode = line.substring(142, 147); 也许我应该分两步操作，比如将代码拆分成由水平线分隔的几个部分，然后单独解析这些部分？

仅仅在这里写下这些已经帮助我整理了思路，但如果有其他聪明的主意，那就太好了。

------------------------------------------------------------------------------------------------------------------------------------F   BIASPBIMMU
BIMMU    BIASP-COMPANY123 KG              (Z )  9/14/11  EU (T-  I- )                      MT-0                              F   BIASP²BIMMU
CALLS     2/18  YI              50.00-X (49)                                                                                        F   BIASP²BIMMU
------------------------------------------------------------------------------------------------------------------------------------F   BIASPBIMMU
BIMMU    BIMM2-SUPER CORPORATION KG              (Z )  9/14/11  EU (T-  I- )                      MT-0                              F   BIMM2²BIMMU
                                                                                                                                    F   BIMM2²BIMMU
* * * * * * * * * * * * * * * * * * *     T O D A Y S    A C C O U N T    A C T I V I T Y    * * * * * * * * * * * * * * * * * * * *F   BIMM2²BIMMU
 9/14/11        Y9             500   GO  CALL OESX   OCT 11  2400            9.60    EU                                        .00  F   BIMM2²BIMMU
                                                              GO-PARFSecurities Ser                                                 F   BIMM2²BIMMU
                Y9        *    500 *     COMMISSIONS                                 EU                                     250.00- F   BIMM2²BIMMU
                Y9                       PERTES & PROFITS NETS                       EU                                     250.00- F   BIMM2BIMMU
CALLS     9/14  E1          17,825.00-H ( 1)                                                                                        F   BIMM2²BIMMU
CALLS     9/14  E1          17,825.00-N ( 1)                                                                                        F   BIMM2²BIMMU
-----------------------------------------------------------------------------------------------------------------------------------

- jkhamler

2个回答

1

我最近也遇到了类似的问题，最终我使用了Flapjack（Google Code: Flapjack）...在Google Code上看一下示例，我想它应该能帮助你解决问题。

- mja

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- master_bo · Accepted Answer

您可以尝试使用框架Fixedformat4j，它使用注释且工作速度快。我已部分地为我的项目实现了这个框架，以便了解它的工作原理。

您可以创建一个类，并像这样添加注释：

@Record
public class LogRecord {
    private String firm;
    private String user;
    private Date logonDate;
    private String logData;

    public String getFirm() {
        return firm;
    }

    @field(offset=10, length=10)
    public void setFirm(String firm) {
        this.firm = firm;
    }

    public String getUser() {
        return user;
    }

    @field(offset=0, length=10)
    public void setUser(String user) {
        this.user = user;
    }

    public Date getLogonDate() {
        return logonDate;
    }

    @field(offset=nn, length=8)
    @FixedFormatPattern("mm/dd/yy")  
    public void setLogonDate(Date logonDate) {
        this.logonDate = logonDate;
    }

    public String getLogData() {
        return logData;
    }

    @field(offset=mm, length=yy)
    public void setLogData(String logData) {
        this.logData = logData;
    }

}

然后使用FixedFormatManager进行实例化。