电话:010-60531612
邮箱:teskey@126.com
经济计量学堂:二元响应模型,离散因变量模型
2021-05-17 浏览次数:0数据的类型决定了我们模型的选择。对于截面数据,时间序列及面板数据,各自都有自己的建模思路。数据也可以分为离散数据和连续变量数据。对于离散数据,即为我们理解的虚拟变量,二元变量,哑变量。
这种数据在我们现实中比比皆是,比如是否考研,去那个城市工作,买房还是不买...虽然离散数据看起来不高级,但是我们做决策的时候实际上往往就是离散的形式。
如果离散虚拟变量作为解释变量即为虚拟变量回归,这点本科计量都作为基本知识点。
当离散虚拟变量为被解释变量,问题就比虚拟变量回归复杂多了。为什么呢?因为它破坏了回归方程的经典假定。不能用ols进行直接回归。
比如是否考研,虽然y的数值是0或1,但是实际上这个考研的决策是个类似于概率的潜变量。假定概率0. 5是个临界值,当影响你考研决策的因素大于不考研因素的时候,即概率大于0.5时,你才选择考研,否则不考研。
如果直接在0与1积聚的地方画出一条直线,则误差非常大,而且参与估计的统计推断无法进行。
较理想的做法是在0与1之间找到光滑的链接函数,经过科学家尝试,他们提出了正态分布函数和逻辑分布函数满足这些要求,即为probit 模型和logit模型。在应用上,logit模型系数比较好估计而且有很好的经济含义,比probit更常用。