数据分析软件

当前位置:

Stata 丨 数据统计分析软件包

相关文章            

集编程与非编程于一体的统计软件            

·统计分析软件Stata新版本中文版15正式发布!                 

·常用统计分析软件:SPSS、Stata、Minitab        

·Stata项目反应理论与建模课程        

Stata 是一套提供其使用者数据分析、数据管理以及绘制图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。集合了数据分析、数据管理以及绘制专业图表等多种功能于一体的数据统计分析软件,主要用于管理、分析和绘制定量数据,能够执行各种统计分析。除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。该程序适用于处理时间序列、面板和横截面数据。是满足您数据科学需求的解决方案,获取并操纵数据探索可视化模型。


Stata新版本16已发布,Stata是您的数据科学需求的解决方案。获取和操作数据,探索,想象,模型进行推断。将结果收集到可重复的报告中。Stata 16带来了强大的套索,提供了全部预期的模型选择和预测工具、除了尖端的推理方法以及连续,二元,计数结果,可重复的报告功能为用户提供了使用Stata结果和图形快速创建Word,HTML,PDF和Excel文件的能力,并且能够提供真正的动态文件,因为全部的报告都可以跟随数据的变化而进行更新,所以您的数据报告永远保持在新的状态,除此之外,使用Stata的新元分析套件,您可以轻松汇总多项研究的结果。软件可以结合内置的数据编辑器以及散点图、直方图将结果统计出来,利用强大的逻辑公式计算出复杂的数据,通过强大的分析流程,轻松快速的进行数据分析。


STATA 16中的新功能


LASSO

STata的新lasso工具可能让您从大量数据中提取真实特征。使用这些功能,您可以执行以下操作:

  • 预测结果

  • 表征数据中的组和模式

  • 搜索高度非线性的潜在关系

  • 对感兴趣的协变量进行推断

  • 处理内源性协变量或未观察到的混杂因素


为您提供工具,以确保您找到真正的功能,而不仅仅是特定样本中的工件。


Lasso的根源在于:

  • 机器学习

  • 统计

  • 计量经济学习


也就是说,它已经建立了实际应用程序的功能,已知统计属性的严格性以及更多应用程序的承诺。您也可以在较小的数据集上使用它。



可重复的报告

使用STata结果和图形创建Word,HTML,PDF,和Excel文件



STata的集成版本控制为您提供真正可重复的报告。想要动态文件?这些报告都可以随着数据的变化而更新。



Meta分析

Mate分析结合了多个研究的结果,这些研究回答了类似的研究问题。运动会延长寿命吗?睡眠不足会增加患癌症的风险吗?以及更多,许多研究试图回答这些问题,有些研究报告不确定甚至是相互矛盾的结果。元分析有助于将信息(通常是压倒性的)从原始的许多研究中汇总成一个统一的结论,或者提供无法达到这种结论的原因。

STata拥有由STata研究人员提供的元分析方法的悠久历史,例如Palmer和Sterne(2016)。STata现在提供新的命令套件meta,以执行元分析。新套件很广泛,但其优点之一就是它的简洁性。

让我们快速看下一个可能的工作流程:

1、准备数据以进行元分析

2、获取元分析摘要

3、探索异质性

4、调查小型研究的影响和发表偏倚


选择模型

在Stata16之前,大多数选择模型中的非线性和额外相关性使得很难回答真正有趣的问题。您可以轻松测试协变量是否显着且为正,但无法衡量其对选择概率的影响。您可以接受有限问题的答案,也可以为特定问题导出解决方案并手动进行编程。


一切都会随着Stata16的变化而变化。即使使用诸如多项式概率或混合logit之类的复杂模型,您现在也可以获得真正有趣的问题的答案。使用Stata16时,回答这些问题(包括测试和置信区间)的命令很简单。


Stata16引入了一套新的统一功能,用于对选择数据进行建模。新命令易于使用,它们提供了强大的工具来解释选择模型的结果。



贝叶斯分析新功能

Stata16为Stata的贝叶斯命令套件提供了广泛的补充,其中包括:

可使用多个马尔科夫链(multiple chains)来检验现代贝叶斯分析所依赖的马尔科夫链蒙特卡洛(markov China Monte Carlo)是否收敛;以及使用后验分布(posterior distribution)进行“贝叶斯预测”(Bayesian predictions)。



Python集成

在STata 16中,您可以在STata中嵌入并执行Python代码。STata的新Python命令提供了一套子命令。允许您从STata轻松调用Python并在STata中输出Python结果。


您可以交互式调用Python,也可以在do-files和ado-files中调用Python,以便利用Python广泛语言功能。您还可以直接通过STata执行Python脚本文件(.py)。

 

此外还包括STata Function Interface(sfi) Python模块。他提供STata和[ython之间的双向连接。它允许您将Python的功能与STata的核心功能进行交互。在模块中,定义类似提供对STata当前数据集,框架,宏,标量,矩阵,值标签,特征,全局Mata矩阵的访问。

从Python 2.7开始,STata支持Python 2和Python 3.您可以从STata中选择要绑定的那个。



面板数据ERM

  • 内生性+

  • 选择+

  • 治疗+

  • 面板数据

同时护理并发症



他们适合有问题的模型。通过模型,我们指的是连续结果的线性回归和区间回归,二元结果的概率,以及有序结果的有序概率。


问题实质内源性和外源性样本选择,内源性协变量(为观察到混杂因素)和非随机治疗分配的任何组合。新版本是ERM处理另一个问题面板数据(也称为纵向数据或两级多级数据)。默认情况下,每个等式中都包含随机效应。随机效应是相关的;您可以省略特定的随机效果,并可以测试相关性。

stata中的其他命令可以使模型符合列出的任何问题。ERM可以处理上述问题的任何组合,并且可以使模型具有连续,间隔,二元和多个结果。


导入数据

从SAS导入数据

任何研究项目的任务之一就是读取数据。允许导入SAS 7或更高版本的数据到Stata中。可以导入整个数据集或仅导入其中的一部分。通过import sas,还可以导入价值标签。日期,值标签和缺失值均已从SAS正确转换为Stata格式。



从SPSS导入数据

允许将SPSS文件(版本16或更高)和压缩的IBM SPSS文件(版本21或更高)导入Stata。



非参数序列回归

非参数序列回归(NPSR)估计意味着给定一组协变量的结果,就像线性回归一样。与线性回归不同,NPSR在协变量方面对结果的功能形式不可知,这意味着NPSR不会出现错误指定错误。



数据框:内存中的多个数据集

  • 内存中的多个数据集同时存在

  • 内存数据集都存储在一个框架中

  • 框架易于交互使用

  • 在ado货物Mata中,帧都是完全可编程的

  • 在Java和Python访问帧中的数据

等等



CI的准确度和样本量分析

新的ciwidth命令对置信区间(CI)执行精度和样本大小分析。目标是在CI用于推断时理想地分配研究资源,挥着换句话说,估计实现CI的期望精度所需的样本大小。ciwidth还允许您调查各种场景中的精度,这在规划阶段很有用。您可以研究样本大小,所需CI宽度以及实际场景中的精度,在这规划阶段很有用。您可以检查每种参数随其他参数的变化情况。结果可以在表或图表中显示。



面板数据混合logit

面板数据选择模型

放宽无关替代(IIA)假设的独立性

来自6个分布图的随机系数-正态,相关正态,阶段正态,均匀和暗礁性强大且集群稳健的标准错误,支持复杂的调查数据。



非线性DSGE

动态随机一般均衡(DSGE)模型用于宏观经济学来秒速经济结构。这些模型由来自经济理论的方程组成。在这些模型中,期望来确定当今变量的介质方面发挥着重要作用。DSGE模型与其他时间序列模型的区别在于它与理论的紧密联系以及模型中期望的出现。


宏观经济学家使用DSGE来评估政策对产出增长,通货膨胀和利率等结果的影响。DSGE模型可以嵌套多种理论。然后,研究人员可以使用估计的参数值来确定哪种理论更适合数据。

STata的新dsgenl命令通过使用稳态下模型方程的一阶近来估计参数和变量中非线性的DSGE参数。



多组IRT模型

许多亚牛人员研究认知能力,人格特质,态度,生活质量以及其他无法直接测量的属性。为了量化这些类型的潜在特征。,研究人员开发了由二元,序数或分类项目成的仪器问卷或测试,以确定个体的特征水平。


项目反应理论(IRT)模型可用于评估潜在特征与旨在测量特征的项目之间的关系。使用IRT模型,我们可以去确定能够哪些测试项目更难以及哪些更容易。我们可以确定哪些测试项目提供了有关潜在特征的信息以及哪些测试项,目提供的信息很少。


具有滞后,差异的NLME模型:增长模型,多剂量PK模型等

现有的命令菜单具有用于拟合非线性混合效应模型(NLMEM)的新功能,这些模型可能包括滞后,超前(正向)和差分算子。这种模型的一个重要类别是药代动力学(PK)模型,menl的新功能还可以用于拟合其他模型,例如某些增张模型和时间序列非线性多级模型。



异方差有序概率

模型化受试者或组之间方差的差异



图形的点大小

在Stata 16中,现在可以以打印机点,英寸和厘米为单位指定图形元素的大小。只需在大小上添加单位后缀:pt表示打印机电,in表示英寸,cm表示厘米,rs表示相对大小。



Mac界面中的新功能


暗模式和选项卡式窗口


档案编辑器中的新功能

Stata的“文件”编辑器为Stata的提供了语法突出显示功能。它仍然如此。在Stata 16中,它还为Python和Markdown提供语法高亮显示。


Stata 16的“文件”编辑器具有自动补全功能。编辑器自动完成文档中已经存在的单词,自动完成Stata命令,并自动完成引导,括号,花括号和方括号。您现在可以将空格用于缩进和制表符。


Stata的“文件”编辑器创建和编辑文本文件。这是带有自动补全和语法突出显示的示例:





哪个Stata适合您

无论您是学生还是经验丰富的研究人士,我们都会提供合适您需求的软件包:

  • Stata / MP:速度快的Stata版本(用于四核,双核和多核/多处理器计算机),可以分析很多的数据

  • Stata / SE:用于大型数据集的Stata

  • Stata / IC:中型数据集的Stata

  • Stata的数值:用于嵌入式和Web应用程序的Stata

Stata / MP是运行速度快,很大的Stata版本。几乎任何当前的计算机都可以利用Stata / MP的高级多处理功能。其中包括Intel i3 , i5 , i7, i9 , Xeon , Celeron和AMD多核芯片。在双核芯片上,Stata / MP在耗时的估算命令上的总体运行速度提高了40%,在重要的位置运行速度提高了72%。Stata /MP具有两个以上的内核或处理器,速度甚至更快。


Stata / MP,Stata / SE和Stata / IC均可在任何计算机上运行,但Stata / MP的运行速度更快。


Stata/SE和Stata/IC仅在各自可以分析的数据集大小上有所不同。Stata/SE(至多10998)和Stata/MP(至多65532)可以拟合比Stata/IC(至多798)具有更多自变量的模型。Stata/SE至多可以分析20一个观测值。


Stata/IC允许具有多大2048个变量和20亿个观测值的数据集。一个模型中,Stata/IC至多可baohan798个独立变量。


Stata的数值可以在嵌入式环境中支持上面列出的任何数据大小。


兼容的操作系统

STata将在下面列出的平台上运行。虽然STata软件是特定于平台的,但您的STata许可证并非如此;因此在下单时无需指定操作系统。

了解在双核,多核或多处理器计算机上运行STata。

平台

适用于Windows®的STata

Windows 10 、Windows 8 、 Windows 7 、Windows Server 2019 ,2016, 2012 , 2008 R2

STata需要64位Windows 用于由英特尔®和AMD纸草的X86 - 64处理器(了解您的操作系统是否符合64位标准)


适用于Mac®的STata

macOS 10.11或更新版本


适用于Linux的STata

任何运行Linux的64位(x86-64或兼容)

对于xstata,您需要安装GTK 2.24


硬件要求



记忆磁盘空间
Stata/MP4GB1GB
Stata/SE2GB1GB
Stata/IC1GB
1GB

Stata for Linux需要一个可以显示数千种颜色或更多颜色的显卡(16位或24位颜色)

NetMiner | 社会网络可视化分析软件
生态学数据软件

上一篇:

下一篇:

分享到: 0