R语言优雅的进行广义可加模型泊松回归分析
创始人
2024-11-17 08:07:38

泊松回归(Poisson regression)是以结局变量为计数结果时的一种回归分析。泊松回归在我们的生活中应用非常广泛,例如:1分钟内过马路人数,1天内火车站的旅客流动数,1天内的银行取钱人数,一周内的销售经营数据等等都可以使用泊松回归进行分析。

在这里插入图片描述
既往已经有文章《R语言进行泊松回归》初步的介绍了泊松回归,本期介绍下如何使用tidygam包来优雅的进行泊松回归,tidygam包主要是通过mgcv包来进行分析,通过对tidygam包对mgcv包的数据转换后,上手难度大大降低,可以轻松优雅的进行泊松回归分析。
咱们先导入R包和数据,数据使用的是tidygam自带的gest数据

library(tidygam) library(mgcv) library(dplyr) library(ggplot2) data("gest") theme_set(theme_light()) 

在这里插入图片描述
这个数据是一个10、11和12个月婴儿的手势数量的数据,这个数据表包含了来自孟加拉、中国和英国背景的60名婴儿所做的三种手势的计数。我解释一下变量名:dyad是ID标识的意思,background:表明来自哪个国家,months:月份,只有10,11,12共3个月,gesture手势的类型,count:手势的计数,这个是 结局变量
先生成gam模型

gs <- gam(   count ~ s(months, k = 3),   data = gest,   family = poisson ) 

这个模型gam是mgcv包生成的,解析模型,表明月数和手势计数是相关的

在这里插入图片描述
生成预测值

gs_pred <- predict_gam(gs) 

绘图,一定要用series标明绘制哪个变量

gs_pred %>%   plot(series = "months") 

在这里插入图片描述
R包介绍,这个时候生成的Y周是count的对数值,因此我们还需要转换一下

predict_gam(gs, tran_fun = exp) %>%   plot(series = "months") 

在这里插入图片描述
如果咱们想了解不同国家的分类,可以再gam函数中设定

gs_by <- gam(   count ~ s(months, by = background, k = 3),   data = gest,   family = poisson ) 

解析模型,表明不同的国家婴儿,手势计数都是和月份相关

summary(gs_by) 

在这里插入图片描述
接下来咱们可以绘制分类图形,需要再comparison处指明根据哪个变量分类

gs_by %>%   predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%   plot(comparison = "background") 

在这里插入图片描述
R包指出,虽然使用plot函数绘图,但是它的本质上是一个ggplot2绘制的图片,所以咱们可以使用ggplot的方法修改它

gs_by %>%   predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%   plot(comparison = "background") +   scale_color_brewer(type = "qual") + scale_fill_brewer(type = "qual") 

在这里插入图片描述
咱们如果考虑有2个非连续的变量,可以再模型里面定义

gs_by_2 <- gam(   count ~ s(months, by = background, k = 3) +     s(months, by = gesture, k = 3),   data = gest,   family = poisson ) 

解析模型,这里虽然有变量交叉,但是这种做法并不是交互效应,应该理解为亚组更加准确

summary(gs_by_2) 

在这里插入图片描述
绘图

gs_by_2 %>%   predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%   plot(comparison = "gesture") +   scale_color_brewer(type = "qual") + scale_fill_brewer(type = "qual") +   facet_grid(~ background) 

在这里插入图片描述
如果咱们想了解background和gesture的交互关系,要先生成一个交互变量

gest <- gest %>%   mutate(back_gest = interaction(background, gesture)) 

然后咱们使用这个交互变量进行模型分类

gs_i <- gam(   count ~ s(months, by = back_gest, k = 3),   data = gest,   family = poisson ) summary(gs_i) 

在这里插入图片描述
绘图,

predict_gam(   gs_i, tran_fun = exp,   separate = list(back_gest = c("background", "gesture")) ) %>%   plot(series = "months", comparison = "gesture") +   facet_grid(~ background) 

在这里插入图片描述
这样一个亚组交互图形就生成好啦。

相关内容

热门资讯

裸辞做“一人公司”,我后悔了 去年这个时候,一位以色列程序员正在东南亚旅行。他顺手把一个在脑子里转了很久的想法做成了产品,一个让任...
南京建成国内首个Pre-6G试... 4月21日,2026全球6G技术与产业生态大会在南京开幕。全息互动技术展台前,一名远在北京的工作人员...
超梵求职受邀参加“2025抖音... 超梵求职受邀参加“2025抖音巨量引擎成人教育行业生态大会”,探讨分享优质内容传播,服务万千学员。 ...
摩托罗拉Razr 2026(R... IT之家 4 月 22 日消息,摩托罗拉宣布新一代 Razr 折叠手机将于 4 月 29 日在美国发...
库克卸任,特纳斯领航:苹果新纪... 苹果首席执行官蒂姆·库克将卸任,硬件工程主管约翰·特纳斯将接任,苹果公司今天宣布此事。 库克将在夏季...