点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
2022年9月中旬,IBM正式宣布推出SPSS Statistics软件全新的29版,软件增加了新功能以及对已有功能进行改进,包括新的生存模型程序(survival model procedure)、新的开源扩展程序、UI界面、搜索及工作薄改进等,同时为了更好地帮助用户了解这些全新的特性和功能,IBM官方将组织系列在线技术讲座。
以下是29新版的各项全新功能与诸多改进:
新功能一:
线性OLS的替代模型:弹性网络
Linear OLS Alternatives: Elastic Net
全新线性弹性网络扩展程序可生成估算因变量对一个或多个自变量的正则化线性回归模型,正则化结合了L1(Lasso)和L2 (Ridge)的罚函数(penalties)。
该扩展包括可选的模式,以显示在给定的L1比率下,不同α值的跟踪图,并在交叉验证的基础上选择L1比率和α超参数值。
当单一模型被拟合或交叉验证被用来选择修正率和/或α,分区的保留数据可被用来估计样本外的性能。
新功能二:
线性OLS的替代模型:套索
Linear OLS Alternatives: Lasso
全新线性套索扩展可对一个或多个自变量的因变量进行L1损失正则化线性回归模型估算,并包括显示跟踪图和根据交叉验证选择α超参数值的可选模式。如上图所示图表代表了程序的输出示例。
当单一模型被拟合或交叉验证被用来选择α时,分区的保留数据可被用来估计样本外的性能。
新功能三:
线性OLS的替代模型:脊线
Linear OLS Alternatives: Ridge
全新线性脊线扩展程序对一个或多个自变量的因变量进行L2或平方损失正则化线性回归模型估算,同样包括显示跟踪图和基于交叉验证选择α超参数值的可选模式。
当单一模型被拟合或交叉验证被用来选择α时,分区的保留数据可被用来估计样本外的性能。
新功能四:
参数化的加速失效时间(AFT)模型
Parametric Accelerated Failure Time (AFT) Models
新程序调用了参数化生存模型程序与非复现性生命时间数据。参数化生存模型假定生存时间遵循一个已知分布,而这种分析适合加速失效时间模型,其模型效应与生存时间成正比。
新功能五:
假性R²量
Pseudo-R² Measures
假性R² 量和类内相关系数现在包括在线性混合模型和广义线性混合模型的输出中(在适当时)。决定系数R2是一个常见的统计数字,因为它代表了一个线性模型所解释的方差比例。
类内相关系数(ICC)是一个相关的统计数字,它量化了多层次/分层数据中由分组(随机)因素解释的方差比例。
新功能六:
小提琴图
Violin Plots
图形板模板选择器现在包括一个全新的小提琴图供选择,盒式图和核心密度图的混合核心密度图。小提琴图显示了统计数据中的峰值,适用于可视化数字数据的分布情况。
以往的盒式图只能显示汇总的统计数据,而小提琴图则描述了汇总统计数据和每个变量的密度情况。
29版改进的功能部分包括:工作薄新增了2个工作薄工具条项目:“显示/隐藏所有语法窗口(Show/Hide all syntax windows)”和“清除所有输出(Clear all output)”;程序状态栏增加新的按钮,用于在经典(输出和语法)和工作簿模式之间切换;搜索功能现在支持在工具栏字段中直接输入术语,或在下拉窗格中查看结果的选项;取消掉隐藏未选择案例功能,当选择一个案例子集时,未选择的案例在数据编辑器中不再被隐藏,也不会被丢弃了;Python 3.10.4和R语言4.2.0改为与29程序本身一并安装,不再需要额外处理。
据悉,30版SPSS Statistics将会在明年第三季度发布。30版作为数字版本大升级,将增加更多弹性网(Elastic net)逻辑回归分析,以及更多的开源算法,对状态栏等界面也会进行全新设计,并支持为所有扩展添加显示名称。