应用简介
Stata是一款集数据分析、数据管理以及绘制专业图表的整合性统计软件,它提供多种数据模型,包括线性混合模型、均衡重复反复及多项式普罗比模式,用Stata绘制的统计图形相当精美。它的分析功能也是比较出众的,可利用命令快速完成数据整理、导入导出等工作。
设置里可更改Stata语言:Edit > Preferences > User-interface language > 简体中文
【功能特点】
1、数据访问功能
除了直接读取自身格式的数据集外,Stata支持导入/导出很多其他格式的数据集,如常用的Excel格式、XML格式、SAS XPORT格式、文本格式及ODBC接口。如果数据很少,可以直接将数据手工录入至Stata软件。
2、数据管理功能
Stata为用户提供了完善的数据管理功能,举例如下:①Stata支持最多达32个字符的变量名,字符变量值支持长达20亿字节(Stata区分字符大小写);②利用数值函数或字符函数产生新变量;③自动由分组变量生成哑变量,自动将字符变量映射成数字代码;④对数据文件进行横向和纵向链接、行列变换等;⑤重复测量数据的长型格式和宽型格式相互转换;⑥数值变量和字符变量相互转换。
3、作图功能
Stata可生成可供发表的高质量的图形输出。最常见的几种基本图形的制作:散点图、线图、面积图、条图、方向图等自带模型,一键生成。
4、统计分析功能
Stata的统计功能很强,除了传统的统计分析方法外,还收集了近年来发展起来的新方法,其分析功能紧跟国际上数理统计方法学的最新进展。Stata 13增加了许多特性,如处理效应、多水平广义线性模型、功效和样本量、广义结构方程模型、预测、效应量、删失的连续性结局、单变量时间序列模型。更为令人称赞的是,Stata在统计分析命令的设置上结构极为清晰,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。
5、矩阵运算功能
矩阵代数是多元统计分析的重要工具,Stata不但提供了多元统计分析中所需的基本矩阵运算,如矩阵的加、积、逆、Cholesky分解、Kronecker内积等,还提供了一些高级运算,如特征根、特征向量、奇异值分解等。在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。Stata 9.0以后版本完美地整合了执行矩阵计算的矩阵编程语言Mata,可进行强大的矩阵运算。
6、程序设计功能
Stata是一个统计分析软件,但它也具有很强的程序语言功能,给用户提供了一个广阔的开发应用的天地。和矩阵运算功能相结合,用户就能够充分发挥自己的聪明才智,熟练应用各种技巧,对Stata的功能进行扩展(详见第11章)。如Stata自身并无Meta分析命令,但是用户们开发了一整套优秀的Meta分析命令集(详见第12章),对Stata的功能进行了进一步扩展,使之成为当前最优秀的Meta分析软件之一。
【怎么安装命令】
首先,打开stata软件,我们需要确定自己安装的命令是否已经在stata系统之中,简单的一个测试方法便是在输入框中输入“help XXX”,以“fsum”命令为例,输入“h fsum”。
如果没有该命令,则会出现图片的提示。这里也可以选择“是”来软件自动搜索,但是我们提供另外一个下载方式。
我们可以直接在stata命令窗口中输入下载命令:“ssc install fsum”命令,点击就安装到本地了,一般放在C盘的ado文件夹里面。
等待下载,当出现以上图样的时候,命令便下载完成了。
最后检验一下新命令是否添加完成,采用上述方法输入“h fsum”命令查询即可。
【怎么导入数据】
利用命令导入:
use
1.insheet using filename, [option]
这个命令是专门用来导入像excel之类的以电子表格形式存储的数据。在导入之前,首先要把excel文件转存为STATA可以识别的格式。其中我最常用的就是另存为csv逗号分隔符格式。
然后在STATA中使用insheet读取csv文件,在option中指定为comma告诉STATA你读取的是csv文件。
这种方法有个不足在于如果你的数据中包含中文而且里面含有逗号时无法识别,解决的办法是不要用逗号标示分隔符了,在excel中另存为txt(制表符分隔),这样就不会与逗号相混淆了。然后再在insheet命令中在option里指定是tab,就完事了。
2.infile using filename
这个infile命令分两类,一种是处理固定格式(fixed format)的txt或raw,另一种是处理自由格式(free format),当然你在用这个命令里还需要定义一个dictionary,这个dictionary是用来描述数据的组织方式的,需要自己根据要导入的数据文件自己编写代码,然后嵌套到数据文件txt的前面去,或者是单独地存为一个dct文件,并且告诉STATA你要导入的数据在保存在哪里。
3.xmluse
这个命令首先要把xls文件另存为xml格式,然后用xmluse命令去读取,当然在读取时你也要在option中声明你的xml文件是excel保存的而不是STATA保存的,这样就不会弄错。
如果你的xls文件中如果有汉字的话,STATA读取后对应的变量会出现乱码,这一点用insheet就不会有这个问题。
4.odbc
这个命令是专门读取数据库文件的,并且支持SQL命令,这样如果你的数据比较多的话,可以先用SQL语句进行筛选,然后而导入。当然这个命令也能导向excel文件。
【怎么合并数据】
使用merge命令语法:merge [varlist] using filename [filename...] [,optione];其中[varlist]代表合并进去的新变量,using filename指的是所要与原文件合并的文件路径
首先打开第一个源文件water1.dta,将它按year排序,然后再以覆盖方式保存
再打开第二个源文件water2.dta,将它按year排序
用merge命令进行两个文件的合并
保存合并后的结果,并查看合并后的数据
【怎么用折线把散点连接起来】
右击图表区域
更改图表类型-带平滑线和数据标记的散点图
进入后选择相应的模块就好了
查看效果(OK)
或者使用命令twoway (scatter y x) (lfit y x)
“ lfit"表示”linear fit"(线性拟合),形状为直线,如果想在散点图上同时画出二次回归曲线,直接将“ lfit"改为“qfit",(二次拟合),形状为曲线。
【怎么导出回归结果】
Step1:进行命令分析,如回归分析(命令结果如下)
Step2:(输入命令)outreg2 using myfile(结果导出命令)
Step3 :(输入命令)findit outreg2(找outreg2命令)
Step4:点击界面中的链接(fmwww.bc.edu),会出现 clink here to install 按钮,点击进入
Step5:(再次输入命令)outreg2 using myfile(结果导出命令)就可以导出回归结果了。