Java中解析固定宽度文本日志的技巧

3
我正在尝试找出最佳方法来解析以下日志文件,将每个由水平线分隔的部分分开,并提取各种数据,例如“COMPANY123”,“BIMMU”,日期(2/18等),然后创建一个包含该部分中所有其他数据的字符串,以水平线为分隔符。
即,我想创建一个“语句”对象数组,每个对象都具有以下属性:
Company name, Account, Date, Data.

例如,对于下面的第二条记录,
Account = 'BIMMU'
Firm = 'Super Corporation'
Date= 9/14/11
Data = '* * * * * * * * TODAYS ACCOUNT ACTIVITY * * * * * * * * * * *
        9/14/11 Y9 CALL OESX OCT 11 ........ etc'

日志是一个固定宽度的文本文件,变量(如日期等)总是出现在同一行的相同位置,例如:sSalesCode = line.substring(142, 147); 也许我应该分两步操作,比如将代码拆分成由水平线分隔的几个部分,然后单独解析这些部分?
仅仅在这里写下这些已经帮助我整理了思路,但如果有其他聪明的主意,那就太好了。
------------------------------------------------------------------------------------------------------------------------------------F   BIASPBIMMU
BIMMU    BIASP-COMPANY123 KG              (Z )  9/14/11  EU (T-  I- )                      MT-0                              F   BIASP²BIMMU
CALLS     2/18  YI              50.00-X (49)                                                                                        F   BIASP²BIMMU
------------------------------------------------------------------------------------------------------------------------------------F   BIASPBIMMU
BIMMU    BIMM2-SUPER CORPORATION KG              (Z )  9/14/11  EU (T-  I- )                      MT-0                              F   BIMM2²BIMMU
                                                                                                                                    F   BIMM2²BIMMU
* * * * * * * * * * * * * * * * * * *     T O D A Y S    A C C O U N T    A C T I V I T Y    * * * * * * * * * * * * * * * * * * * *F   BIMM2²BIMMU
 9/14/11        Y9             500   GO  CALL OESX   OCT 11  2400            9.60    EU                                        .00  F   BIMM2²BIMMU
                                                              GO-PARFSecurities Ser                                                 F   BIMM2²BIMMU
                Y9        *    500 *     COMMISSIONS                                 EU                                     250.00- F   BIMM2²BIMMU
                Y9                       PERTES & PROFITS NETS                       EU                                     250.00- F   BIMM2BIMMU
CALLS     9/14  E1          17,825.00-H ( 1)                                                                                        F   BIMM2²BIMMU
CALLS     9/14  E1          17,825.00-N ( 1)                                                                                        F   BIMM2²BIMMU
-----------------------------------------------------------------------------------------------------------------------------------                                                                                                                                                                      
2个回答

5
您可以尝试使用框架Fixedformat4j,它使用注释且工作速度快。我已部分地为我的项目实现了这个框架,以便了解它的工作原理。
您可以创建一个类,并像这样添加注释:
@Record
public class LogRecord {
    private String firm;
    private String user;
    private Date logonDate;
    private String logData;

    public String getFirm() {
        return firm;
    }

    @field(offset=10, length=10)
    public void setFirm(String firm) {
        this.firm = firm;
    }

    public String getUser() {
        return user;
    }

    @field(offset=0, length=10)
    public void setUser(String user) {
        this.user = user;
    }

    public Date getLogonDate() {
        return logonDate;
    }

    @field(offset=nn, length=8)
    @FixedFormatPattern("mm/dd/yy")  
    public void setLogonDate(Date logonDate) {
        this.logonDate = logonDate;
    }

    public String getLogData() {
        return logData;
    }

    @field(offset=mm, length=yy)
    public void setLogData(String logData) {
        this.logData = logData;
    }

}

然后使用FixedFormatManager进行实例化。


1
我最近也遇到了类似的问题,最终我使用了Flapjack(Google Code: Flapjack)...在Google Code上看一下示例,我想它应该能帮助你解决问题。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接