我正在尝试解析以制表符分隔的数据,该数据已保存为带有多余数据的文本文件。我希望将其转换为R数据表/数据框。
制表符分隔格式如下:
只有两种类型的行,A和B。 A始终有5列,例如第一行,
B一直有两列:
问题:如何解析一个具有“交替”行和不同格式的文件?
假设这是一个文本文件,只有这种格式,交替行A和B,分别具有5列和2列。如何将其解析为R数据表?我的想法是创建以下格式:
制表符分隔格式如下:
A 1092 - 1093 + 1X
B 1093 HRDCPMRFYT
A 1093 + 1094 - 1X
B 1094 BSZSDFJRVF
A 1094 + 1095 + 1X
B 1095 SSTFCLEPVV
...
只有两种类型的行,A和B。 A始终有5列,例如第一行,
1092 - 1093 + 1X
B一直有两列:
1093 HRDCPMRFYT
问题:如何解析一个具有“交替”行和不同格式的文件?
假设这是一个文本文件,只有这种格式,交替行A和B,分别具有5列和2列。如何将其解析为R数据表?我的想法是创建以下格式:
1092 - 1093 + 1X 1093 HRDCPMRFYT
1093 + 1094 - 1X 1094 BSZSDFJRVF
1094 + 1095 + 1X 1095 SSTFCLEPVV
...