R语言关于随机森林算法的知识点详解

 更新时间:2021年05月13日 08:24:44   作者:w3cschool  
在本篇文章里小编给大家整理的是一篇关于R语言关于随机森林算法的知识点详解内容,有兴趣的朋友们可以跟着学习下。

在随机森林方法中,创建大量的决策树。 每个观察被馈入每个决策树。 每个观察的最常见的结果被用作最终输出。 新的观察结果被馈入所有的树并且对每个分类模型取多数投票。

对构建树时未使用的情况进行错误估计。 这称为OOB(袋外)误差估计,其被提及为百分比。

R语言包“randomForest”用于创建随机森林。

安装R包

在R语言控制台中使用以下命令安装软件包。 您还必须安装相关软件包(如果有)。

install.packages("randomForest")

包“randomForest”具有函数randomForest(),用于创建和分析随机森林。

语法

在R语言中创建随机森林的基本语法是

randomForest(formula, data)

以下是所使用的参数的描述 

  • formula是描述预测变量和响应变量的公式。
  • data是所使用的数据集的名称。

输入数据

我们将使用名为readingSkills的R语言内置数据集来创建决策树。 它描述了某人的readingSkills的分数,如果我们知道变量“age”,“shoesize”,“score”,以及该人是否是母语。

以下是示例数据。

# Load the party package. It will automatically load other required packages.
library(party)

# Print some records from data set readingSkills.
print(head(readingSkills))

当我们执行上面的代码,它产生以下结果及图表

  nativeSpeaker   age   shoeSize      score
1           yes     5   24.83189   32.29385
2           yes     6   25.95238   36.63105
3            no    11   30.42170   49.60593
4           yes     7   28.66450   40.28456
5           yes    11   31.88207   55.46085
6           yes    10   30.07843   52.83124
Loading required package: methods
Loading required package: grid
...............................
...............................

我们将使用randomForest()函数来创建决策树并查看它的图。

# Load the party package. It will automatically load other required packages.
library(party)
library(randomForest)

# Create the forest.
output.forest <- randomForest(nativeSpeaker ~ age + shoeSize + score, 
           data = readingSkills)

# View the forest results.
print(output.forest) 

# Importance of each predictor.
print(importance(fit,type = 2)) 

当我们执行上面的代码,它产生以下结果

Call:
 randomForest(formula = nativeSpeaker ~ age + shoeSize + score,     
                 data = readingSkills)
               Type of random forest: classification
                     Number of trees: 500
No. of variables tried at each split: 1

        OOB estimate of  error rate: 1%
Confusion matrix:
    no yes class.error
no  99   1        0.01
yes  1  99        0.01
         MeanDecreaseGini
age              13.95406
shoeSize         18.91006
score            56.73051

结论

从上面显示的随机森林,我们可以得出结论,鞋码和成绩是决定如果某人是母语者或不是母语的重要因素。 此外,该模型只有1%的误差,这意味着我们可以预测精度为99%。

到此这篇关于R语言关于随机森林算法的知识点详解的文章就介绍到这了,更多相关R语言随机森林算法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:

相关文章

  • 详解R语言中生存分析模型与时间依赖性ROC曲线可视化

    详解R语言中生存分析模型与时间依赖性ROC曲线可视化

    这篇文章主要介绍了R语言中生存分析模型与时间依赖性ROC曲线可视化,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-03-03
  • R语言对二进制文件操作详解

    R语言对二进制文件操作详解

    在本篇内容里小编给大家整理的是一篇关于R语言二进制文件操作实例内容,有兴趣的朋友们可以学习下。
    2021-05-05
  • R语言中c()函数与paste()函数的区别说明

    R语言中c()函数与paste()函数的区别说明

    这篇文章主要介绍了R语言中c()函数与paste()函数的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • 解决R语言报错:Error in y + 1:non-numeric argument to binary operator

    解决R语言报错:Error in y + 1:non-numeric argument to binary

    R语言编程中的常见错误有一些错误是R的初学者和经验丰富的R程序员都可能常犯的,下面这篇文章主要给大家介绍了关于解决R语言报错:Error in y + 1:non-numeric argument to binary operator的相关资料,需要的朋友可以参考下
    2022-11-11
  • R语言关于变量的知识点总结

    R语言关于变量的知识点总结

    在本篇文章里小编给大家整理了一篇关于R语言关于变量的知识点总结内容,有兴趣的朋友们可以学习下。
    2021-03-03
  • R语言绘制空间热力图实例讲解

    R语言绘制空间热力图实例讲解

    这篇文章主要介绍了R语言绘制空间热力图实例讲解,图文实例讲解的很清楚,有感兴趣的同学可以学习下
    2021-03-03
  • R语言中fread使用方法

    R语言中fread使用方法

    在R语言中,fread函数是data.table包中的一个功能强大的数据读取函数,可以用于快速读取大型数据文件,它比基本的read.table和read.csv函数更快,尤其在处理大型数据集时效果更为明显,这篇文章主要介绍了R语言中fread使用方法,需要的朋友可以参考下
    2023-12-12
  • R语言数据可视化绘图Slope chart坡度图画法

    R语言数据可视化绘图Slope chart坡度图画法

    这篇文章主要为大家介绍了R语言数据可视化绘图Slope chart坡度图的画法示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-02-02
  • R语言安装以及手动安装devtools的详细图文教程

    R语言安装以及手动安装devtools的详细图文教程

    R语言是一个强大的数据分析工具,其强大之处在于有各种各样的R包帮助其实现各种各样的功能,下面这篇文章主要给大家介绍了关于R语言安装以及手动安装devtools的相关资料,需要的朋友可以参考下
    2022-08-08
  • R语言可视化ggplot2绘制24小时动态血糖图

    R语言可视化ggplot2绘制24小时动态血糖图

    这篇文章主要为大家介绍了R语言可视化使用ggplot2绘制24小时动态血糖,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05

最新评论