SAS:在PROC EXPORT中限制变量

5
我有一个 PROC EXPORT 的问题,想问你是否能回答。我有一个包含800多个变量和超过200K观测值的SAS数据集,我想要将部分变量导出为CSV文件(即我需要所有记录,只是不需要所有800多个变量)。我可以总是创建一个临时数据集“KEEP”,只保留我需要的字段并在该临时数据集上运行EXPORT,但我试图避免额外的步骤,因为我有大量的记录。
为了说明这一点,考虑一个具有三个名为x、y和z的变量的数据集。但是,我希望通过PROC EXPORT生成的文本文件仅包含x和y。我下面尝试解决此问题的代码不够完美。 The SAS Code 当我运行以下代码时,得到的结果并不完全符合我的需求。如果您运行此代码并查看生成的文本文件,每行都有一个逗号,并且标题中仍然包含数据集中的所有变量。此外,我会收到一些不应该得到的日志消息。
data ds1;
      do x = 1 to 100;
            y = x * x;
            z = x * x * x;
            output;
      end;
run;

proc export data=ds1(keep=x y)
      file='c:\test.csv'
      dbms=csv
      replace;
quit;

以下是生成的文本文件(“C:\test.csv”)的前几行:
x,y,z
1,1,
2,4,
3,9,
4,16,

SAS日志

9343  proc export data=ds1(keep=x y)
9344      file='c:\test.csv'
9345      dbms=csv
9346      replace;
9347  quit;

9348   /**********************************************************************
9349   *   PRODUCT:   SAS
9350   *   VERSION:   9.2
9351   *   CREATOR:   External File Interface
9352   *   DATE:      30JUL12
9353   *   DESC:      Generated SAS Datastep Code
9354   *   TEMPLATE SOURCE:  (None Specified.)
9355   ***********************************************************************/
9356      data _null_;
9357      %let _EFIERR_ = 0; /* set the ERROR detection macro variable */
9358      %let _EFIREC_ = 0;     /* clear export record count macro variable */
9359      file 'c:\test.csv' delimiter=',' DSD DROPOVER lrecl=32767;
9360      if _n_ = 1 then        /* write column names or labels */
9361       do;
9362         put
9363            "x"
9364         ','
9365            "y"
9366         ','
9367            "z"
9368         ;
9369       end;
9370     set  DS1(keep=x y)   end=EFIEOD;
9371         format x best12. ;
9372         format y best12. ;
9373         format z best12. ;
9374       do;
9375         EFIOUT + 1;
9376         put x @;
9377         put y @;
9378         put z ;
9379         ;
9380       end;
9381      if _ERROR_ then call symputx('_EFIERR_',1);  /* set ERROR detection macro variable */
9382      if EFIEOD then call symputx('_EFIREC_',EFIOUT);
9383      run;

NOTE: Variable z is uninitialized.
NOTE: The file 'c:\test.csv' is:
      Filename=c:\test.csv,
      RECFM=V,LRECL=32767,File Size (bytes)=0,
      Last Modified=30Jul2012:12:05:02,
      Create Time=30Jul2012:12:05:02

NOTE: 101 records were written to the file 'c:\test.csv'.
      The minimum record length was 4.
      The maximum record length was 10.
NOTE: There were 100 observations read from the data set WORK.DS1.
NOTE: DATA statement used (Total process time):
      real time           0.04 seconds
      cpu time            0.01 seconds


100 records created in c:\test.csv from DS1.


NOTE: "c:\test.csv" file was successfully created.
NOTE: PROCEDURE EXPORT used (Total process time):
      real time           0.12 seconds
      cpu time            0.06 seconds

有什么想法可以解决这个问题吗?我正在运行Windows 7上的SAS 9.2。

非常感谢您的任何帮助。

  • Karthik

我意识到可以使用“data null; set ds1; file 'c:\test.csv' dlm=','; put x y; run;”来使其工作。PROC Export似乎很有吸引力,因为明天我可能需要将其导出到Excel工作簿而不是CSV文件,而“数据步骤”选项将无法使用。 - Karthik
6
我不确定这个方法是否可行,所以我将其作为评论发表。您能否使用数据视图创建所需的子集,然后导出它?我的意思是,您能导出一个视图吗?我不太确定... - itzy
那个运行得非常好!我会把它发布为解决方案。谢谢。 - Karthik
1
只是一个快速的提示,当导出到诸如csv之类的分隔文件时,数据集选项不起作用,但当导出到Excel时它们是有效的。 - Longfish
1个回答

7

基于Itzy在我的问题中的评论,这里是答案,它完全满足我的需求。

proc sql;
    create view vw_ds1 as 
        select x, y from ds1;
quit;

proc export data=vw_ds1
    file='c:\test.csv'
    dbms=csv
    replace;
quit;

感谢您的帮助!

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接