分享好友 编程语言首页 频道列表

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

r语言文章/教程  2023-03-08 13:010

原文链接:http://tecdat.cn/?p=14874

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

 

通常,GLM的连接函数可能比分布更重要。为了说明,考虑以下数据集,其中包含5个观察值

  1.  
    x = c(1,2,3,4,5)
  2.  
    y = c(1,2,4,2,6)
  3.  
    base = data.frame(x,y)

然后考虑具有不同分布的几个模型,以及一个链接

  1.  
    regNId = glm(y~x,family=gaussian(link="identity"),data=base)
  2.  
    regNlog = glm(y~x,family=gaussian(link="log"),data=base)
  3.  
    regPId = glm(y~x,family=poisson(link="identity"),data=base)
  4.  
    regPlog = glm(y~x,family=poisson(link="log"),data=base)
  5.  
    regGId = glm(y~x,family=Gamma(link="identity"),data=base)
  6.  
    regGlog = glm(y~x,family=Gamma(link="log"),data=base)
  7.  
    regIGId = glm(y~x,family=inverse.gaussian(link="identity"),data=base)
  8.  
    regIGlog = glm(y~x,family=inverse.gaussian(link="log"),data=base

还可以考虑一些Tweedie分布,甚至更一般

考虑使用线性链接函数在第一种情况下获得的预测

  1.  
     
  2.  
    plot(x,y,pch=19)
  3.  
    abline(regNId,col=darkcols[1])
  4.  
    abline(regPId,col=darkcols[2])
  5.  
    abline(regGId,col=darkcols[3])
  6.  
    abline(regIGId,col=darkcols[4])
  7.  
    abline(regTwId,lty=2)

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

 

这些预测非常接近。在指数预测的情况下,我们获得

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

我们实际上可以近距离看。例如,在线性情况下,考虑使用Tweedie模型获得的斜率(实际上将包括此处提到的所有参数famile)

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

这里的坡度总是非常接近,如果我们添加一个置信区间,则

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

对于Gamma回归或高斯逆回归,由于方差是预测的幂,因此,如果预测较小,则方差应该较小。因此,在图的左侧,误差应该较小,并且方差函数的功效更高。

  1.  
     
  2.  
     
  3.  
     
  4.  
     
  5.  
    plot(Vgamma,Verreur,type="l",lwd=3,ylim=c(-.1,.04),xlab="power",ylab="error")
  6.  
    abline(h=0,lty=2)

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

 

当然,我们可以对指数模型做同样的事情

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

 

或者,如果我们添加置信区间,我们将获得

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析  

因此,这里的“斜率”也非常相似...如果我们看一下在图表左侧产生的误差,可以得出

  1.  
     
  2.  
    plot(Vgamma,Verreur,type="l",lwd=3,ylim=c(.001,.32),xlab="power",ylab="error")

 

拓端tecdat|R语言中广义线性模型(GLM)中的分布和连接函数分析

 

因此,分布通常也不是GLM上最重要的一点。

查看更多关于【r语言文章/教程】的文章

展开全文
相关推荐
反对 0
举报 0
评论 0
图文资讯
热门推荐
优选好物
更多热点专题
更多推荐文章
拓端tecdat|R语言VAR模型的不同类型的脉冲响应分析
原文链接:http://tecdat.cn/?p=9384目录模型与数据估算值预测误差脉冲响应识别问题正交脉冲响应结构脉冲反应广义脉冲响应参考文献脉冲响应分析是采用向量自回归模型的计量经济学分析中的重要一步。它们的主要目的是描述模型变量对一个或多个变量的冲击的演化

0评论2023-03-16712

Visual Studio 编辑R语言环境搭建
Visual Studio 编辑R语言环境搭建关于Visual Studio 编辑R语言环境搭建具体的可以看下面三个网址里的内容,我这里就讲两个问题,关于r包管理和换本地的r的服务。1.r包管理:Ctrl+72.R本地服务管理:Ctrl+9Visual Studio R官方帮助文档(中文): https://docs

0评论2023-03-16320

拓端tecdat|R语言代写实现向量自回归VAR模型
原文链接:http://tecdat.cn/?p=8478 澳大利亚在2008 - 2009年全球金融危机期间发生了这种情况。澳大利亚政府发布了一揽子刺激计划,其中包括2008年12月的现金支付,恰逢圣诞节支出。因此,零售商报告销售强劲,经济受到刺激。因此,收入增加了。VAR面临的批

0评论2023-03-16915

[译]用R语言做挖掘数据《五》 r语言数据挖掘简单实例
一、实验说明1. 环境登录无需密码自动登录,系统用户名shiyanlou,密码shiyanlou2. 环境介绍本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序:1. LX终端(LXTerminal): Linux命令行终端,打开后会进入Bash环境,可以使用Linux命令2. GVim:非常好

0评论2023-03-08418

[译]用R语言做挖掘数据《三》 数据挖掘——基于r语言的实战
一、实验说明1. 环境登录无需密码自动登录,系统用户名shiyanlou,密码shiyanlou2. 环境介绍本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序:1. LX终端(LXTerminal): Linux命令行终端,打开后会进入Bash环境,可以使用Linux命令2. GVim:非常好

0评论2023-03-08596

数据科学与R语言: 关于我 Rer
数据科学与R语言: 关于我关于我钱钟书曾说,鸡蛋好吃不一定要去认识下蛋的母鸡。不过人类是社会化的动物,访客和博主都希望有多一些的交流。在2012年元旦之即,写下这篇短文算是我的简介吧。 最早接触的计算机还是一台386,那时作为Geek的成就感来自于迅速的

0评论2023-03-08403

使用R语言和XML包抓取网页数据-Scraping data from web pages in R with XML package
In the last years a lot of data has been released publicly in different formats, but sometimes the data we're interested in are still inside the HTML of a web page: let's see how to get those data. One of the existing packages for doing th

0评论2023-02-12524

R语言的ARIMA模型预测 r语言arima参数估计
R通过RODBC连接数据库stats包中的st函数建立时间序列funitRoot包中的unitrootTest函数检验单位根forecast包中的函数进行预测差分用timeSeries包中diffstats包中的acf和pacf处理自相关和偏自相关stats包中的arima函数模型 

0评论2023-02-09490

3.3-Cypher语言及语法使用 cypher读法
Cypher是一种图数据库查询语言,表现力丰富,查询效率高,其地位和作用与关系型数据库中的SQL语言相当。Cypher具备的能力:Cypher通过模式匹配图数据库中的节点和关系,来提取信息或者修改数据。Cypher语句中允许使用变量,用来表示命名、绑定元素和参数。Cyp

0评论2023-02-09514

更多推荐