IMPORT导入CSV文件乱码问题

之前的文章我们提到在做SDTM和ADAM数据集的时候很多数据需要外部导入,外部导入基本都会用import程序步和csv文件,在导入的时候往往会发生各种情况,诸如路径不存在,窜行,乱码和无法导入。
filename filename "路径" encoding="gb2312";
proc import datafile=filename out=dataname dbms=csv replace;
    getnames=no;
    guessingrows=max;
run;
路径不存在基本就是文件名称错误或者真的是路径错误或者setup程序修改完了以后没有run造成的,这个比较容易解决。导入的文件如果发生窜行很有可能是csv文件里面有换行符。
比较让人头疼的是乱码问题,尤其是中文,很容易乱码,这个时候可以加上encoding="gb2312"这段代码指定导入文件的编码,往往这个时候乱码问题就会解决,屡试不爽,所以我们会习惯性的在导入csv文件的时候加上encoding="gb2312"。
当我们的路径没有任何问题,csv文件里没有换行符,也加上了encoding="gb2312",还是会有无法导入的情况,SAS关了又开,开了又关还是无果,最后发现问题竟然出在encoding="gb2312"这段代码上,有些文件无法解析,去掉这段就好了,真实成也萧何败萧何。




请前往:http://www.mark-to-win.com/TeacherV2.html?id=166