SAS BASE认证培训
1. 导入数据(infile input、import)
第一部分:原始数据分类
1.1标准数据和非标准数据
1.2 数值数据和字符数据
第二部分:data步使用infile+input读入原始数据3
2.1 input简单方式
2.2 input列方式(columns)读入
2.3 input格式化(format)方式
2.4 input列表(list)方式
2.5 input命名方式(name)
2.6 infile语句
第三部分:通过IMPORT访问外部数据文件
3.1 IMPORT过程的通用格式
3.2 导入EXCEL、SPSS、STATA文件示例
3.3 导入Tab分割符文本文件
3.4 导入.csv数据文件
3.5 导入‘任意分割符’文本文件
3.6 一次性导入excel的多个sheet
3.7一次性导入多个excel表格
2. 变量输入输出格式(format)
第一部分:输入格式
1.1输入格式使用方法
1.2 数值变量常用输入格式
1.3 字符变量常用输入格式
1.4日期常用输入格式
第二部分:proc format自定义输出格式
2.1数值按照范围
2.2字符编码
2.3日期编码
3. 数据部修改和选择观测(keep drop rename等)
第一部分:变量选择:drop 与keep
1.1常用使用方法
1.2 在set中使用
1.3在data option中使用
第二部分:rename、retain和delete
2.1 Rename重新命名变量名
2.2 Retain计算累积值
2.3 delete删除观测
第三部分:观测选择:if和where
3.1 if用法
3.2 where用法
第四部分:变量长度length和累积语句
4.1变量长度
4.2累积语句
4.排序和转置(sort transpose)
第一部分:数据集排序(sort)
1.1 Sort格式
1.2 sort案例
第二部分:改变数据结构(transpose)
2.1 transpose过程语法
2.2数据集转置
2.3长格式转换为宽格式
2.3宽格式转换为长格式
5.SAS数据集合并(set merge)
第一部分:Set语句
1.1 set语句格式2
1.2 set常用用法举例4
第二部分:MERGE语句5
2.1 merge语句格式5
2.2 One-to-one合并5
2.3One-to-many匹配合并
6.数组array(array)
第一部分:定义数组
1.1用格式一定义一维、二维数组。
1.2用格式二定义二维数组。
1.3格式三定义数组
第二部分:引用数组元素
2.1显式下标
2.2.隐含下标
第三部分:Array 应用案例
3.1缺失值填补
3.2编码变量
3.3.计算新变量
3.4确定变量所属的类型应用
3.5宽格式转换为长格式
3.6 first.、 last. 、 retain 用法
3.7 长格式转换为宽格式
3.8. 宽格式转换为长格式实际案例
7.统计量计算(mean freq univariate)
第一部分:相关过程(corr)
1.1计算相关系数和偏相关系数
1.2 相关过程句法
第二部分:频数过程(FREQ)
2.1 频数过程语法
2.2 频数过程案例
第三部分:均值过程(MEANS)
3.1 PROC MEANS过程介绍
3.2 PROC MEANS应用案例
第四部分:单变量过程(UNIVARIATE)
4.1 PROC UNIVARIATE过程介绍
4.2 PROC UNIVARIATE应用案例
第五部分: proc datasets
8.输出控制(ods和report)
第一部分:输出传送系统(ODS)
1.1 ODS传送目标
1.2查询输出对象
1.3 传送至目标LISTING
1.4 传送至目标OUTPUT
1.5 传送至目标PRINTER
1.6 生成RTF格式文件
1.7传送至目标HTML
1.8传送至目标csv
第二部分:Proc report
2.1 基本的report过程
2.2 在proc report中使用define
2.3 在proc report中加入统计量
2.4 proc report中加入计算的变量
9.循环语句(do end)
第一部分: Do 循环
1.1简单DO语句
1.2循环DO语句
1.3 DO OVER语句
1.4 DO WHILE语句
1.5 DO UNTIL语句
第二部分: 一些常用语句
2.1 SELECT语句
2.2 IF THEN语句
2.3 子集IF语句
10.SAS常用函数(数值、字符、日期函数)
第一部分:常用字符函数
1.1截取字符substr
2.2字符串左对齐、右对齐--left、 right
2.3大小写--lowcase、 upcase、propcase
2.4加引号、去掉引号--quote、dequote
2.5从字符串中去掉指定字符--compress
2.6返回字符表达式x中的第n个词-- scan
2.7替换字符串中的特定词-- tranwrd
2.8连接字符串--cat、 cats、catx
第二部分:常用数值函数
2.1算数函数sum、int、log等
2.2 滞后差分函数--lag() 、difn()
2.3正态分布随机数函数--- rannor 、normal
2.4对数正太分布随机数
第三部分:常用日期函数
3.1两个日期之间的天数--datdif(sdata,edata,basis)
3.2返回由年月日定义的sas日期值--mdy(month,day,year)
3.3返回SAS日期值或文字的月份-- month(date)
3.4返回两个日期之间的年数-- yrdif(sdata,edata,basis)
3.5计算两个时间之间的周期时间间隔-- INTCK
3.6给出时间间隔和初始时间,返回一个最终时间- INTNX