R语言 实现data.frame 分组计数、求和等

 更新时间:2021年03月27日 11:22:03   作者:Asher117  
这篇文章主要介绍了R语言 实现data.frame 分组计数、求和等操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

df为1个data.frame对象,有stratum和psu两列,这里统计stratum列计数

方法1:

cnt = table(df$stratum)

方法2:

cnt = tapply(df$psu, INDEX=df$stratum, FUN=length)

在方法2的基础上,只要改变FUN函数就可以实现分组求和、求均值等功能,如下

分组求均值:

tapply(df$psu, INDEX=df$stratum, FUN=mean)
#(等价于python中的df.groupby('stratum').psu.mean)

补充:R语言 | 自定义函数对数据集(data.frame)的列进行条件判断计算

1.使用iris数据集

> iris_10 <- head(iris, n = 10)
## 自定义函数:如果x >= 5.0, z = y *10
> get_With_function <- function(x, y, z){
+   if(x >= 5.0){
+     z <- y * 10
+   }
+   c(zlie = z )
+ }

2.保险起见,设定z列为0,可能也不需要

> iris_10$z <- 0

3.运用自定义函数,对data.frame的x行进行判断,对y列进行运算,赋值到z列

4…注意Map的使用

> iris_10$z <- with(
+   iris_10,
+   Map(
+     get_With_function,
+     iris_10$Sepal.Length,
+     iris_10$Sepal.Width,
+     z
+   )
+   )
> iris_10
  Sepal.Length Sepal.Width Petal.Length Petal.Width
1      5.1     3.5     1.4     0.2
2      4.9     3.0     1.4     0.2
3      4.7     3.2     1.3     0.2
4      4.6     3.1     1.5     0.2
5      5.0     3.6     1.4     0.2
6      5.4     3.9     1.7     0.4
7      4.6     3.4     1.4     0.3
8      5.0     3.4     1.5     0.2
9      4.4     2.9     1.4     0.2
10     4.9     3.1     1.5     0.1
  Species z
1  setosa 35
2  setosa 0
3  setosa 0
4  setosa 0
5  setosa 36
6  setosa 39
7  setosa 0
8  setosa 34
9  setosa 0
10 setosa 0

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • R语言多元线性回归实例详解

    R语言多元线性回归实例详解

    对比一元线性回归,多元线性回归是用来确定2个或2个以上变量间关系的统计分析方法,下面这篇文章主要给大家介绍了关于R语言多元线性回归的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • R语言关于多重回归知识点总结

    R语言关于多重回归知识点总结

    在本篇内容里小编给大家整理了一篇关于R语言关于多重回归知识点总结,有兴趣的朋友们可以学习下。
    2021-05-05
  • R语言-因子与向量的转换方式

    R语言-因子与向量的转换方式

    这篇文章主要介绍了R语言-因子与向量的转换方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • R语言中时间序列分析浅析

    R语言中时间序列分析浅析

    在本篇文章里小编给大家整理的是一篇关于R语言中时间序列分析浅析内容,有需要的朋友们跟着学习下。
    2021-05-05
  • 大数据分析R语言RStudio使用超详细教程

    大数据分析R语言RStudio使用超详细教程

    RStudio是用于R编程的开源工具,这篇文章主要介绍了大数据分析R语言RStudio使用教程和一些RStudio的重要技巧,窍门和快捷方式,可快速将您变成RStudio高级用户,感兴趣的朋友跟随小编一起看看吧
    2021-03-03
  • R语言实现将分类变量转换为哑变量(dummy vairable)

    R语言实现将分类变量转换为哑变量(dummy vairable)

    这篇文章主要介绍了R语言实现将分类变量转换为哑变量(dummy vairable),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • R语言数据可视化绘图bar chart条形图实现示例

    R语言数据可视化绘图bar chart条形图实现示例

    这篇文章主要为大家介绍了R语言数据可视化绘图bar chart条形图的实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2022-02-02
  • 基于R语言赋值符号的区别说明

    基于R语言赋值符号的区别说明

    这篇文章主要介绍了基于R语言赋值符号的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-04-04
  • R语言数据可视化ggplot绘制置信区间与分组绘图技巧

    R语言数据可视化ggplot绘制置信区间与分组绘图技巧

    这篇文章主要为大家介绍了R语言数据可视化ggplot绘制置信区间与分组绘图的技巧,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2021-11-11
  • R语言ggplot在热图上标注相关系数的操作方法

    R语言ggplot在热图上标注相关系数的操作方法

    R语言是一种开源、免费的编程语言,主要用于统计分析、图形化和机器学习,这篇文章主要介绍了R语言ggplot怎么在热图上标注相关系数,需要的朋友可以参考下
    2024-07-07

最新评论