一 下载和导入数据

首先,我们下载原始数据。中国综合社会调查2015年数据于2018年1月1日在中国国家调查数据库(CNSDA)官网上发布,网址是:http://cnsda.ruc.edu.cn。CGSS 2015数据共发布了3个版本:Stata14、Stata12、SPSS。同时发布CGSS 2015中文版调查问卷。通过注册后,CGSS数据可免费下载使用。

2015年CGSS项目调查覆盖全国28个省/自治区/直辖市的478个村居,经统计,共完成有效问卷10968份,是目前社会科学研究中最常用的数据之一。

R语言能导入不同格式的数据,SPSS、Stata、SAS、Excel、CSV、TXT等格式的数据都能导入。导入表格数据一般使用read.table()、read.csv()等。在R语言中,用haven包导入外部数据(尤其是导入SPSS、Stata和SAS数据)是一种通用的做法。如:

install.packages("haven")#需要导入haven包

library(haven)

data1 <- read_sav("路径+文件名.sav")

data2 <- read_stata("路径+文件名.dta",encoding ="GB2312")

data3 <- read_sas("路径+文件名.sas7bdat")