- R语言与社会科学调查数据分析
- 谢颖编著
- 311字
- 2025-04-03 17:53:47
一 下载和导入数据
首先,我们下载原始数据。中国综合社会调查2015年数据于2018年1月1日在中国国家调查数据库(CNSDA)官网上发布,网址是:http://cnsda.ruc.edu.cn。CGSS 2015数据共发布了3个版本:Stata14、Stata12、SPSS。同时发布CGSS 2015中文版调查问卷。通过注册后,CGSS数据可免费下载使用。
2015年CGSS项目调查覆盖全国28个省/自治区/直辖市的478个村居,经统计,共完成有效问卷10968份,是目前社会科学研究中最常用的数据之一。
R语言能导入不同格式的数据,SPSS、Stata、SAS、Excel、CSV、TXT等格式的数据都能导入。导入表格数据一般使用read.table()、read.csv()等。在R语言中,用haven包导入外部数据(尤其是导入SPSS、Stata和SAS数据)是一种通用的做法。如:
install.packages("haven")#需要导入haven包
library(haven)
data1 <- read_sav("路径+文件名.sav")
data2 <- read_stata("路径+文件名.dta",encoding ="GB2312")
data3 <- read_sas("路径+文件名.sas7bdat")