博客
关于我
R语言中的apply(),lapply(),sapply(),tapply()函数以及示例
阅读量:624 次
发布时间:2019-03-13

本文共 1405 字,大约阅读时间需要 4 分钟。

R语言中的apply函数及其应用

在R语言中,apply函数是一种强大的工具,能够有效地替代传统的循环结构,进行数据处理和统计分析。本文将探讨apply及其衍生函数(如lapply、sapply、tapply)的功能、用途及其示例。

apply函数

apply函数用于将给定的函数应用到矩阵或数据框的列或行上,返回结果为向量。常见用途包括对矩阵进行列和行计算,避免使用循环结构。

示例:计算矩阵列和

m1 <- matrix(c(-1:10), nrow=5, ncol=6)m1a <- apply(m1, 2, sum)

示例:应用自定义函数

cave <- function(x, c1, c2) {    c(mean(x[c1]), mean(x[c2]))}ma <- matrix(c(1:4, 1, 6:8), nrow=2)ma2 <- apply(ma, 1, cave, c1="x1", c2=c("x1", "x2"))

lapply函数

lapply用于对列表执行函数操作,返回结果为列表,适合处理多个元素的列表数据。

示例:处理电影标题

movies <- c("SPYDERMAN","BATMAN","VERTIGO","CHINATOWN")movies_lower <- lapply(movies, tolower)

示例:转换为向量

films_lower <- unlist(lapply(movies, tolower))

sapply函数

sapply类似于lapply,但返回结果为向量,适用于需要转换为向量的场景。

示例:计算最小值

dt <- carslmn_carslmn_cars <- lapply(dt, min)smn_cars <- sapply(dt, min)smn_cars_unlist <- unlist(lmn_cars)

tapply函数

tapply用于对数据框应用度量函数,如求均值、中位数等,适合数据框处理。

示例:计算中位数

data(iris)tapply(iris$Sepal.Width, iris$Species, median)

apply结合dimnames的使用

names(dimnames(x)) <- c("row", "col")x3 <- array(x, dim = c(8, 2, 3), dimnames = c(dimnames(x), list(C = paste0("cop.", 1:3)))

自定义函数与apply结合

cave <- function(x, c1, c2) {    c(mean(x[c1]), mean(x[c2]))}ma <- matrix(c(1:4, 1, 6:8), nrow=2)ma2 <- apply(ma, 1, cave, c1="x1", c2=c("x1", "x2"))stopifnot(apply(ma, 2, is.vector))

结论

通过以上案例可以看出,R语言的apply函数及其衍生工具在数据处理和分析中具备强大的灵活性和便利性。选择合适的函数(如apply、lapply、sapply或tapply)能够显著提升工作效率,减少代码复杂度。在实际应用中,合理搭配函数属性和自定义函数,是提高R代码性能和代码质量的关键。

转载地址:http://vfjaz.baihongyu.com/

你可能感兴趣的文章
Pandas 的 DataFrame 详解-ChatGPT4o作答
查看>>
pandas 读取excel数据,以字典形式输出
查看>>
Pandas 读取具有浮点值的 csv 文件会导致奇怪的舍入和小数位数
查看>>
pandas 适用,但仅适用于满足条件的行
查看>>
pandas 重新采样到每月的特定工作日
查看>>
pandas :按移位分组和累加和(GroupBy Shift And Cumulative Sum)
查看>>
pandas :检测一个DF和另一个DF之间缺失的列
查看>>
Pandas-从具有嵌套列表列表的现有列创建动态列时出错
查看>>
Pandas-通过对列和索引的值求和来合并两个数据框
查看>>
pandas.columns、get_dummies等用法
查看>>
pandas.DataFrame.copy(deep=True) 实际上并不创建深拷贝
查看>>
pandas.read_csv()的详解-ChatGPT4o作答
查看>>
PANDAS.READ_EXCEL()输出‘;溢出错误:日期值超出范围‘;而不存在日期列
查看>>
pandas100个骚操作:再见 for 循环!速度提升315倍!
查看>>
Pandas:对给定列求和 DataFrame 行
查看>>
Pandas、Matplotlib、Pyecharts数据分析实践
查看>>
Pandas中文官档~基础用法2
查看>>
Pandas中文官档~基础用法6
查看>>
Pandas中的GROUP BY AND SUM不丢失列
查看>>
pandas交换两列
查看>>