如何用SAS读取以逗号分隔的文本文件
(2013-12-29 07:10:21)
标签:
sasinfileinput逗号分隔的文本文件数据导入it |
分类: SAS数据导入 |
上次分享了如何用SAS读取空格分隔的文本文件,但是有时我们会遇到一个字段的内容中包含空格的情况,如果我们还用上次的方法就会发生读取错位。
在确认了数据内容中确实存在空格的情况下,我们需要和数据提供方进行商议,给出两种解决方案:
1.如果出现空格的情况比较少,并且去掉空格不影响数据准确性的前提下可以压缩掉空格;
2.如果出现空格的情况比较多,并且去掉后会影响数据准确性时,建议更换数据提供方式,使用其他分隔符分隔字段。
下面分享针对第二种方案如何导入以逗号分隔的文本文件。
需求如下:
在D:\下存放名为myfile.txt的文本文件,该数据是由四个字段组成,分别为IdNumber Name Team Weight,其中Weight为数值变量,其余均为字符变量,各个字段以逗号分隔。需要将该文件导入到work库下的名为club的数据集中。
文件的内容如下:
1024,David,red,189
1049,Amelia,yellow,145
代码如下:
data work.club;
run;
代码分析:
与上次分享的代码唯一不同的地方是在infile语句后面多了一个dlm = ",",意思为导入的文件各个字段是以逗号作为分隔符。
补充说明:
可以用dlm选项指定其他分隔符,如:# | $ 等。