stata变量的描述性统计命令,stata多变量相关性分析命令
1.常用的数据分析工具Stata,SPSS,SAS,R,Python,甚至Excel都可以做数据分析。r和Python是程序员的首选,可以通过编写程序实现数据清洗、分析、挖掘为一体,还可以添加扩展支持,将一套代码应用于类似的数据分析场景。对于专业人士(如生物、医学领域)来说,掌握编程语言的学习成本太高,他们更注重通过工具方便快捷地得到分析结果。SPSS和Stata主要是图形界面的软件操作,相对更合适。很多专业领域在发论文的时候都会用到Stata和SPSS软件的分析结果。随着时间的推移,该软件已经成为该领域数据分析的标准工具。
2.stata安装和运行。我下载了Linux版的Stata 15.1。下载到本地解包后,可以看到工具Stata和xstata,分别是命令行版和图形界面版。您也可以使用图形界面中的命令来运行xstata:
$ ./xstata
您可以在下面的框中输入Stata命令,然后回车运行。该软件中最常用的三个菜单是:数据(数据处理)、图形(绘图)和统计(统计)。功能非常丰富,包括许多二级和三级子菜单。以下是一些最常用的函数。
3.Stata数据导入Stata数据的导入方式主要有两种,一种是从文件导入,另一种是手动编辑内容。用文件菜单中的打开打开文件,支持数据等文件类型。dta 和图表。由Stata定义的‘gph’(Python Pandas支持导出Stata文件类型,但默认不支持中文字段名)。也可以通过文件菜单中的导入,导入Excel、csv、dbf等常用格式的数据。此外,您可以通过界面顶部的新Do-file Editer或Data Editer手动创建新数据和编辑现有数据。编辑界面支持复制粘贴功能。大家可以看到,每次通过菜单操作,界面中间的窗口都会显示相应的命令。我们可以把常用的命令记录下来,以便以后可以通过命令行快速调用。
4.Stata公共数据分析命令
(1) 变量相关
生成新变量。gen a=3更改变量名。重命名一个b变化幅度。替换b=5删除变量。drop b计算器。显示2 3
(2) 文件目录相关
切换目录。cd /tmp/查看目录中的文件。ls打开数据文件。使用xxx.dta在excel文件中导入名为“主页”的工作表页。导入excel/tmp/xxx.xlsx ,工作表(主页)以保存文件。save /tmp/a.dta退出。
(3) 数据表相关
号出口显示当前数据表内容。列表来查看当前的数据格式。描述如何查看统计数据,包括:案例数(Obs)、变量平均值、标准偏差、最小值和最大值。总和标致的方箱系数。pw corr x,SIG计算潇洒背包系数。spearman y x计算kwallis测试值。kwallis y,乘(x)计算f检验值。单向y x多元线性回归。回归y x1 x2 x3…