第二章 SAS 概述
Post on 03-Jan-2016
114 Views
Preview:
DESCRIPTION
Transcript
第二章 SAS 概述
SAS 安装包含:( 压缩为 150MB ~ “400MB”)
1 、 SAS 的各种系统文件。2 、教科书上的所有例题的 SAS 程序及数据文
件。( SASCLASS 子目录)3 、教科书后上机实习题的 SAS 程序及数据文
件。( SASEXER 子目录)安装步骤见安装光盘中 SASV8 安装说明。
第一节 SAS 基本运行环境
1 、进入和退出 SAS : 进入:( 1 )桌面双击 SAS 快捷方式图标。 ( 2 ) C:\Program Files\SAS Institute\SAS\V8
子目录中双击 SAS.EXE 。
退出:单击 SAS 窗口中右上角的关闭按钮。 SAS 要求进一步确认,再确定。
第一节 SAS6.12 基本运行环境
2 、三个基本窗口: 程序编辑窗口( PROGRAM EDITTO
R ) ( PGM )日记窗口( LOG )输出窗口( OUTPUT )各窗口中的下拉菜单、按钮和窗口命令。
第二节 SAS 程序
在 PGM 窗口输入程序,交 SAS 运行。( 1 )数据步:建立 SAS 数据集。 以关键词, DATA ,开头。( 2 )过程步:调用 SAS 过程,统计分析等。 以关键词, PROC ,开头。数据步和过程步都由一个或多个语句组成。
SAS 语句SAS 语句特点:( 1 )以一个关键词开始。( 2 )以分号“;” ,结束。( 3 )一行可写几个语句,一个语句可写几行( 4 )语句中的关键词或选择项都用空格分开
SAS 程序执行SAS 程序用 SUBMIT 命令执行。 F8 | F3
最简单方法:用 SUBMIT 按钮。RUN 语句不属于数据步或过程步,它的作用
是要求 SAS 运行前面读入的 SAS 语句。注意:如不用 “ RUN ;” 语句, SAS 只读
入各语句,不运行,读到 “ RUN ;” 语句后,再运行前面读入的各语句。
建立 SAS 数据集
建立 SAS 数据集
SAS 数据集包括二部分: 数据,和对数据的描述。数据存放在矩阵式的表格中,列为变量(指
标),行为观测(记录)。描述部分包括:对整个数据集的描述(数据
集名,变量数,观测数,产生日期等),和对每个变量属性的描述(变量名,类型,长度,位置,标记等)
第三节 建立 SAS 数据集建立 SAS 数据集有多种方法:( 1 )在数据步中用 INPUT 和 CARDS 语句读入数据
建立数据集。( 2 )先建立外部数据文件(只有数据),在数据步
中用 INFILE 和 INPUT 语句读入数据建立数据集。( 很少用,不要求掌握 )
( 3 )利用开放式数据库连接器( ODBC )直接把EXCEL 等数据库的数据文件转换成 SAS 数据集。
( 4 )在已建立的 SAS 数据集中取出数据,建立新的SAS 数据集。
1. 用 CARDS 语句读入数据建立数据集
例 2.2 :SAS 的默认语句: OUTPUT , RETURNINPUT 语句后的不分行符: @@ 如不用 @@, INPUT 语句读完数据后,下一次执
行 INPUT 语句时,从下一行数据开始读数据,原数据行中未读完的数据不利用;
如用 @@, INPUT 语句读完数据后,下一次执行INPUT 语句时,从原数据行中未读完的数据处开始读数据。
常用于一行数据中包含多个观测的情况。
3. 把 EXCEL 等其它数据库文件直接转换成 SAS 数据集
( 1 ) Excel 文件另存为 Excel2000 工作簿, 然后关闭 Excel 文件。( 2 ) SAS 下拉菜单: File - Import ,出现窗口( 3 )选择数据文件类: Excel( 4 ) Next ,选择要转换的 Excel 文件( 5 ) Next ,指定转换成的 SAS 数据集名及路径( 6 ) Finish
或者只需运行“ PROC IMPORT ” 程序就可导入 Excel 数据:
PROC IMPORT OUT= mydata DATAFILE= “C:\Program Files\SAS
Institute\SAS\SASCLASS\STUDENT.XLS" DBMS=EXCEL2000 REPLACE; GETNAMES=YES;RUN;
Excel 转换成 SAS 数据集其它方法1
SAS数据集名
Excel数据文件全名(引号内包括文件夹路径及
文件全名)
( 1 )在 Excel 中把选择数据部分复制( 2 )在 SAS 中把这些数据粘贴到
PGM
窗口中( 3 )用 Cards 语句读入这些数据建立 SAS 数据集。
Excel 转换成 SAS 数据集其它方法2
不推荐此方法
Excel 数据转换 SAS 数据集注意事项
注意: Excel 数据文件中如有的数据缺失,不要留空格,用指定的数字,如999.99 ,表示该数据缺失。
以后转换成 SAS 数据集后,再用条件语句表示该数据是缺失的:
If X=999.99 then X=. ;
五、拆分、合并和拼接 SAS 数据集
• 在已建立的 SAS 数据集中取出数据,通过拆分、合并和拼接的方法建立新的 SAS 数据集。
数据集的拆分
• 在已建立的 SAS 数据集中取出一部分数据(部分观测或部分指标)建立新的数据集。
• P26 , 例 2.4
• 用 “ SET 语句”定义已建立的 SAS 数据集,用 IF…THEN 条件语句选择观测。
纵向合并 : set 语句A B
Data C; Set A B; RUN;
A
B
多个 SAS 数据集纵向合并
• 各地区或各部门分别建立 SAS 数据集,要求合并成一个总的 SAS 数据集。
• P28 ,程序 2.5
• 用 SET 语句,后面写上要合并的所有SAS 数据集名,数据集名之间用空格分开。
• 各 SAS 数据集结构应尽量一致,如有的数据集某指标没有,则用缺失值表示。
横向合并 : MERGE 语句A B
Data C; Merge A B; RUN;
A B
多个 SAS 数据集横向合并
• P29 ,例 2.5
• ( 1 )要横向合并的 SAS 数据集最好有一个大家都有的共同编号,编号要每个个体独有的,不重复
• ( 2 )用 SORT 过程对数据集用编号从小到大重新排序。( BY 语句)
• ( 3 )用 MERGE 语句,后面写上数据集名,另外还要有 BY 语句,说明编号的变量名。
2 种 SAS 数据集变量类型
• 数值型变量
• 字符型变量
六、字符型变量的输入( 1 )在 INPUT 语句中,变量名后面加上 $
符号,定义该变量为字符型变量。( 2 )字符型变量的长度默认 8 位,如超过
8 位,要在 INPUT 语句前面用 LENGTH 语句定义长度。
( 3 )字符的大小写是有区别的。( 4 )调用字符型变量 ( 如 sex 取值为 male
或 female) 时,其内容要用单引号括起来。 if sex =‘male’ then output ;
七、缺失值的表示
• P31 ,程序 2.8
• ( 1 )数字型缺失值用小数点表示,字符型变量的缺失值用空格或专门定义的字符表示,如: MISSING 。
• ( 2 )用缺失值计算出的结果也为缺失。
八. SAS 运算符及函数介绍 • P32 ~ P33
• 讲义中列出部分常用的 SAS 运算符及函数,如要了解其他有关内容,进入HELP模块。
• + 加 - 减 * 乘 / 除• ** 乘方
SAS初步应用的学习捷径 学习捷径:1. 统计学知识为基础2. 了解 SAS 语言、调用现成引导程序后修
改 示例 Tips
• F4 = recall 菜单点击—— PGM 重现• libname —— work 中看数据内容,以此代
替 proc print 过程。
上机实习( 2 )上机实习( 2 ):进入 SASEXER 子目录,
把现成的 SAS 程序调出来,执行。不需要自已输入程序。
上机实习( 2 ):第 5 题数据较多,由于时间关系,可以只输入前 8 个观测的数据。
第 6 题数据文件名为 eye1.dat ,是 1 , 2 ,3 的 1 ,不是 L 。
top related