IBM SPSS Modeler v15.0 32位 官方安装免费版

SPSS Modeler下载

  • 软件大小:1.07GB
  • 软件语言:简体中文
  • 软件类型:国产软件
  • 软件授权:免费软件
  • 软件类别:审计评估
  • 应用平台:Windows平台
  • 软件官网:
  • 更新时间:2016-08-16
  • 网友评分:
360通过 腾讯通过 金山通过

情介绍

SPSS Modeler 15.0是14.2的升级版本,是一款非常好用且专业的统计、分析以及数据挖掘工具,该软件由IBM公司开发,该软件可以通过大数据进行相应的分析,可以有效地增加客户价值,提高市场营销活动的回报,本站提供了SPSS Modeler 15.0 32位版下载地址,有需要的朋友们可以前来下载使用。

百度云网盘文件名称:spss_mod_clt_32b_15.0_win_ml.rar

使用说明:

用线性回归建立理赔欺诈检测模型

在本例中,用于建立模型的数据存放在 InsClaim.dat 中,该文件是一个 CSV 格式的数据文件, 存储了某医院以往医疗保险理赔的历史记录。该文件共有 293 条记录,每条记录有 4 个字段, 分别是 ASG(疾病严重程度)、AGE(年龄)、LOS(住院天数)和 CLAIM(索赔数额)。 图 1 显示了该数据的部分内容。

图 1. 历史理赔数据文件

任务与计划

基于已有的数据,我们的任务主要有如下内容:

建立理赔金额预测模型,该模型将基于病人的疾病严重程度、住院天数及年龄预测其索赔金额。

假设模型匹配良好,分析那些与预测误差较大的病人资料。

通过模型来进行索赔欺诈预测。

根据经验及对数据进行的初步分析(这个数据初步分析可以通过 IBM SPSS Modeler 的功能实现,此处不是重点, 故不做深入介绍),可以猜测理赔金额与疾病严重程度、住院天数以及年龄存在线性相关关系,因此我们将首先 选用线性回归模型进行建模,因此可以得到下面这样一个初步计划:

应用线性回归分析来建立模型。

如果模型匹配度不佳,则可能应用更加复杂的模型,例如神经网络、规则推导等。

基于上面的分析,我们容易得到目标模型的因变量为 CLAIM,自变量为 ASG、AGE 和 LOS。在建立模型之前,我们可以 对该模型进行一些猜测,以下是根据经验能想到的一些假设:

随着住院天数的增加,索赔金额增加

随着疾病严重程度的增加,索赔金额增加

随着年龄的增加,索赔金额增加

在建立好模型后,我们会根据模型来验证或推翻这些假设。

用 IBM SPSS Modeler 创建 stream 文件

根据任务要求,我们在 IBM SPSS Modeler 中建立如图 2 所示的 stream 文件。在该 stream 中,InsClaim.dat 作为数据源节点, 它通过一个类型节点(type)进行数据处理后输入到模型节点(CLAIM),在本例中,输出节点(table)作为一个测试节 点,可以用于查看类型节点处理后产生的数据。

图 2. 理赔预测模型 stream 示例图

设置类型(type)节点

从前面的分析可见,CLAIM 是因变量,在类型节点中须作为目标变量(Target),而其余三个字段(ASG、AGE 和 LOS) 则是自变量,在类型节点中须设置为输入变量(Input)。

需要注意的是,在线性回归分析模型中,要求所有变量(包括自变量和因变量)都是连续类型。 如果数据中有非数字类型,比如 Category 或者 Flag,则需要预先转换为数字型。图 3 显示了类型节点设置的具体情况。

图 3. 类型节点设置图

模型节点设置

在设置好类型节点后,我们可以双击 CLAIM 节点,对模型节点进行设置。首先设置 Model 标签页中的选项。 从图 4 可以看到设置的具体信息,Model Name 有自动和定制两种类型,在自动方式下,模型名称自动设置 为目标变量的名字(CLAIM)。本模型的输入信息并没有分组,因此 Use partitioned data 和 Build model for each split 的选择与否并无关系。

Method 选项将选择输入字段的选择方式,由于本例中的输入字段较少,可以使用默认的 Enter 模式。 在字段较多的情况下,可以选择 StepWise、Forward 和 Backward 中的一种,它们会采用不同的统计学方式对输入字段进行筛选。

 Include constant in equation 选项表示模型中是否包含常量(即截距),在本例中,由于每次理赔会有一个起始额度,因此选中该选项。

图 4. 模型节点的 Model 页设置图

在 Expert 页中可以设置一些模型的高级选项。在我们选择了专家模式后,可以设置两个选项内容:

Missing Values ——当选中该选项,会忽略那些含有 Missing Value 的记录。 (默认选项,通常应该使用这个选项,除非你非常有经验,清楚知道 Missing Value 对该模型的影响)Singularity tolerance ——用来防止相关变量影响模型准确度。 该值越小,表示相似性越高,也就说明排除的可能性越低。有些统计师倾向于把 该值设置的稍大,比如 .05(在本例中是 .0001)

载地址

下载错误?【投诉报错】

IBM SPSS Modeler v15.0 32位 官方安装免费版

      气软件

      关文章

      载声明

      ☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
      ☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
      ☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
      ☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
      ☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
      ☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
      ☉ 本站提供的IBM SPSS Modeler v15.0 32位 官方安装免费版资源来源互联网,版权归该下载资源的合法拥有者所有。