logit回归模型结果分析,logistics回归模型的参数估计

  logit回归模型结果分析,logistics回归模型的参数估计

  本文主要介绍如何根据效用最大化理论推导出二项logit模型。

  本文是离散选择模型(DCM)系列文章的第八篇。

  温馨提示:阅读本文前,请准备好纸、笔和小板凳。自己推导,有助于理解。

  Probit模型建模过程回顾在论文《效用最大化准则:离散选择模型的核心(Probit篇)——离散选择模型之七》中,我们给出了基于效用最大化理论的二项式Probit模型的推导过程。简要回顾建模过程:

  假设决策主体N面临两个方案I和J,方案I的效用可以表示为可观测的确定性部分和一个随机项之和:(1)同样,方案J的效用可以表示为:

  (2)对于决策主体N,如果方案I的效用高于方案J,则N选择方案I.也就是说,n选择方案I的概率相当于事件发生的概率:

  (3)如果和服从均值为0、方差为0的正态分布,则服从均值为0、方差为0的正态分布。在此基础上,可以推导出Probit模型的表达式形式,如下式(4)所示。其中表示标准正态分布的累积分布函数。

  (4)概率单位模型的特点

  从建模的角度来看,Probit模型假设了随机项。

  并且服从正态分布,这有一定的合理性3354,这也是它的优势;但是Probit模型没有——的封闭解,每次计算值都需要积分,给实际应用带来了一定的不便。为了解决这个问题,研究者提出如果假设随机项

  而Gumbel分布(而不是上面提到的正态分布),我们可以得到一个模型——,它有属性和Probit模型类型,但是更方便分析。这是二项式Logit模型。图1 .标准正态分布的累积分布函数冈贝尔分布

  Gumbel分布是一种极值分布,常用于估计和预测极端事件。比如一个水文站连续50年每天观测某条河流的水位;如果河道的年最高水位单独建模,则可考虑Gumbel分布。此外,Gumbel分布还应用于地震、洪水等极端自然灾害的预测。

  带有参数的。

  is的耿贝尔分布,其概率密度函数(PDF)可表示为:(5)

  图2显示了当参数

  以及对应不同值的概率密度函数图。从图中可以看出,是位置系数(冈贝尔分布的众数为),但标度系数3354与冈贝尔分布的离散性有关(冈贝尔分布的方差为)。图2 .冈贝尔分布

  与,相对应的冈贝尔分布,称为标准冈贝尔分布;的概率分布是:

  (6)

  其对应的累积分布函数(CDF)为:

  (7)

  从图3中可以看出,标准耿贝尔分布的形状一般接近于标准正态分布的形状,但耿贝尔分布是不对称的,其分布表现出一定的偏斜度。另外,Gumbel分布的尾部比标准的正态分布要胖一点。

  图3 .标准Gumbel分布和标准正态分布逻辑分布

  在推导二项Logit模型的表达式之前,先介绍另一种分布:Logistic分布。

  随机变量

  服从逻辑分布意味着具有以下分布函数和密度函数:(8)

  (9)

  其中,

  是位置参数和形状参数。为了方便起见,我们将记录带参数的逻辑分布,如下所示。下图显示了这些参数。

  以及不同值对应的Logistic分布的概率密度函数(PDF)。从图中可以看出,曲线的增长速度在附近较快,两端较慢。形状参数的值越小,附近的曲线增长越快。什么时候,什么时候,叫做标准物流配送;其对应的分布函数和密度函数为:(10)

  (11)

  图4。物流配送Logit模型的推导

  首先给出一个重要的性质:如果随机变量

  而且都服从Gumbel分布,相互独立,所以服从Logistic分布。也就是说,如果:和彼此独立:

  详细认证流程请参考《从Gumbel分布到Logistic分布——离散选择模型之九》。

  根据上面的公式(3),我们知道决策主体N选择方案I的概率。

  相当于:

  在Logit模型中,我们只是假设随机效用部分。

  和,服从Gumbel分布,和,相互独立。根据上述性质,它服从参数为0和1的Logistic分布。所以上面的公式可以进一步改写为:(12)

  分子和分母同时相乘。

  是:(13)

  中中

  方案I和J的效用的确定性部分.如前所述,效用的确定性部分可以表示为几个独立变量的线性组合,即:

  最后,在二项式Logit模型中,决策者N选择方案I的概率可以表示为:

  (14)

  等式(14)是二项式Logit模型的表达式。图5显示了只有一个独立变量时二项式Logit和二项式Probit的图像:

  图5 .二项式Logit和二项式Probit模型之间的比较

  [本文结束]

  列列表(动态更新.)离散选择模型的基础:

  离散选择模型简介线性模型vs. Logistic模型Logit到底是什么?赔率和比值比的区别如何正确打开/解读Logit模型系数Logit模型拟合实战案例(SAS)Logit模型拟合实战案例(Python)二项式Logit/Probit:

  效用最大化准则:离散选择模型的核心(Probit模型I)效用最大化准则:离散选择模型的核心(Probit模型II)效用最大化准则:离散选择模型的核心(二项式Logit模型)多项式Logit(MNL)从冈贝尔分布到Logistic分布:

  效用最大化准则:多项式Logit (MNL)多项式Logit (MNL)拟合实际案例(SAS) MNL的IIA特性和“红公交/蓝公交悖论”(上篇)MNL的IIA特性和“红公交/蓝公交悖论”(下篇)如何将决策者属性和方案属性同时放入MNL模型?Logit模型中个人属性和方案属性的数据处理案例为什么条件Logit模型中没有常数项,你的女神会嫌弃你吗?Logit模型中的ASC(替代特定常数)是什么意思?相关统计数据:

  最大似然估计(top)和最大似然估计(bottom)模型中存在共线性问题。怎么破?关注【DCM笔记】微信官方账号,私信作者获取相关文章中的练习数据及代码:

logit回归模型结果分析,logistics回归模型的参数估计