博客
关于我
R语言中的apply(),lapply(),sapply(),tapply()函数以及示例
阅读量:624 次
发布时间:2019-03-13

本文共 1405 字,大约阅读时间需要 4 分钟。

R语言中的apply函数及其应用

在R语言中,apply函数是一种强大的工具,能够有效地替代传统的循环结构,进行数据处理和统计分析。本文将探讨apply及其衍生函数(如lapply、sapply、tapply)的功能、用途及其示例。

apply函数

apply函数用于将给定的函数应用到矩阵或数据框的列或行上,返回结果为向量。常见用途包括对矩阵进行列和行计算,避免使用循环结构。

示例:计算矩阵列和

m1 <- matrix(c(-1:10), nrow=5, ncol=6)m1a <- apply(m1, 2, sum)

示例:应用自定义函数

cave <- function(x, c1, c2) {    c(mean(x[c1]), mean(x[c2]))}ma <- matrix(c(1:4, 1, 6:8), nrow=2)ma2 <- apply(ma, 1, cave, c1="x1", c2=c("x1", "x2"))

lapply函数

lapply用于对列表执行函数操作,返回结果为列表,适合处理多个元素的列表数据。

示例:处理电影标题

movies <- c("SPYDERMAN","BATMAN","VERTIGO","CHINATOWN")movies_lower <- lapply(movies, tolower)

示例:转换为向量

films_lower <- unlist(lapply(movies, tolower))

sapply函数

sapply类似于lapply,但返回结果为向量,适用于需要转换为向量的场景。

示例:计算最小值

dt <- carslmn_carslmn_cars <- lapply(dt, min)smn_cars <- sapply(dt, min)smn_cars_unlist <- unlist(lmn_cars)

tapply函数

tapply用于对数据框应用度量函数,如求均值、中位数等,适合数据框处理。

示例:计算中位数

data(iris)tapply(iris$Sepal.Width, iris$Species, median)

apply结合dimnames的使用

names(dimnames(x)) <- c("row", "col")x3 <- array(x, dim = c(8, 2, 3), dimnames = c(dimnames(x), list(C = paste0("cop.", 1:3)))

自定义函数与apply结合

cave <- function(x, c1, c2) {    c(mean(x[c1]), mean(x[c2]))}ma <- matrix(c(1:4, 1, 6:8), nrow=2)ma2 <- apply(ma, 1, cave, c1="x1", c2=c("x1", "x2"))stopifnot(apply(ma, 2, is.vector))

结论

通过以上案例可以看出,R语言的apply函数及其衍生工具在数据处理和分析中具备强大的灵活性和便利性。选择合适的函数(如apply、lapply、sapply或tapply)能够显著提升工作效率,减少代码复杂度。在实际应用中,合理搭配函数属性和自定义函数,是提高R代码性能和代码质量的关键。

转载地址:http://vfjaz.baihongyu.com/

你可能感兴趣的文章
NHibernate学习[1]
查看>>
NHibernate异常:No persister for的解决办法
查看>>
NIFI1.21.0_Mysql到Mysql增量CDC同步中_日期类型_以及null数据同步处理补充---大数据之Nifi工作笔记0057
查看>>
NIFI1.21.0_Mysql到Mysql增量CDC同步中_补充_更新时如果目标表中不存在记录就改为插入数据_Postgresql_Hbase也适用---大数据之Nifi工作笔记0059
查看>>
NIFI1.21.0_NIFI和hadoop蹦了_200G集群磁盘又满了_Jps看不到进程了_Unable to write in /tmp. Aborting----大数据之Nifi工作笔记0052
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表多表增量同步_增删改数据分发及删除数据实时同步_通过分页解决变更记录过大问题_02----大数据之Nifi工作笔记0054
查看>>
NIFI1.21.0通过Postgresql11的CDC逻辑复制槽实现_指定表或全表增量同步_实现指定整库同步_或指定数据表同步配置_04---大数据之Nifi工作笔记0056
查看>>
NIFI1.23.2_最新版_性能优化通用_技巧积累_使用NIFI表达式过滤表_随时更新---大数据之Nifi工作笔记0063
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_根据binlog实现数据实时delete同步_实际操作04---大数据之Nifi工作笔记0043
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置binlog_使用处理器抓取binlog数据_实际操作01---大数据之Nifi工作笔记0040
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_实现数据插入数据到目标数据库_实际操作03---大数据之Nifi工作笔记0042
查看>>
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_生成插入Sql语句_实际操作02---大数据之Nifi工作笔记0041
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_03_来吧用NIFI实现_数据分页获取功能---大数据之Nifi工作笔记0038
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_无分页功能_02_转换数据_分割数据_提取JSON数据_替换拼接SQL_添加分页---大数据之Nifi工作笔记0037
查看>>
NIFI从PostGresql中离线读取数据再导入到MySql中_带有数据分页获取功能_不带分页不能用_NIFI资料太少了---大数据之Nifi工作笔记0039
查看>>
nifi使用过程-常见问题-以及入门总结---大数据之Nifi工作笔记0012
查看>>
NIFI分页获取Mysql数据_导入到Hbase中_并可通过phoenix客户端查询_含金量很高的一篇_搞了好久_实际操作05---大数据之Nifi工作笔记0045
查看>>
NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
查看>>
Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
查看>>
NIFI大数据进阶_FlowFile拓扑_对FlowFile内容和属性的修改删除添加_介绍和描述_以及实际操作---大数据之Nifi工作笔记0023
查看>>