search
您的位置: 首页 > 转载 > 杂谈

有些事明明对自己有益,但我......真的做不到啊

2015年10月29日      来源:知乎日报

有些事明显对自己有益,为什么却无法去做?

陈茁,经济学博士在读,行为经济学

以下括号中翻译内容,部分为知乎日报注。

这个问题当中可能凝结着许多读者一生中的四大主题:“戒烟、攒钱、看书、减肥”。

我们姑且把这个问题讲成这样一个故事:

数学系大学生陈茁因为智商低跟不上一周四十多节的数学课,心灰意冷自暴自弃,沉迷扫雷不可自拔,一度将扫雷高级提升到 40s,也终于在保研率 99% 的学校里奇迹般地没有研究生可上。痛定思痛,他决心参加国考,当上公务员,走上人生巅峰。

但人算不如天算,在国考前一周,微软非常贱地开发出了一个 100×100 的超高难度扫雷游戏。
星期一,“就玩这一局,再玩剁手!”
星期二,“就玩这一局,再玩剁手!”
……
星期六晚上八点,“就玩这一局,再玩剁手!”
星期六晚上九点,“就玩这一局,再玩剁手!”
……
星期天早上六点,“就玩这一局,再玩剁手!”

最终,陈茁错过了这场考试,毕业后沦为无业游民。​

显然,这里需要对所谓“有益”下一个定义,不过这就有点儿抬杠了,毕竟,人绝大多数的行为都是可以被“理性化”的。什么是理性化呢?根据鲁宾斯坦的微观经济学讲义中的说法,只要我们能替这个决策者找到一个目标(偏好),并且他的行为符合这个目标,就可以称之为可理性化的。广泛地说,除了某些带有神秘色彩的宗教仪式之外,大多数人类行为是符合这个标准的。在这个例子里,我们当然可以认为,其实一直玩扫雷直到 it's too late 就是他的目标,也就是说,他自己认为这就是对他有益的。但是这么做稍微有点儿抬杠,题主的本意我猜大概是隐含着为“有益”一词下了一个有客观价值论以为的判断。因此姑且认为,因为这位大学生的前途非常成问题,最后一周努力复习找到工作以图东山再起,显然是“对自己有益的”行为。

但这孙子拒绝了这项行动。为什么?

首先说结论,人为什么会拒绝对自己有益的行为呢?因为这些行为往往需要我们持续的投入时间和经历,而在这个过程中:

首先上一个决策树(decision tree),图来自 Hammond (1988),“期望效用的结果主义基础”(这个图首先见于 Hammond (1976),不过那篇文章里面图太难看……):

article_20151029-2_1.jpg

这张图作者把它称作“潜在上瘾(potential addict)”,不过正好可以拿来说明我们的剁手问题。这里的空心节点叫做“决策节点”,每个节点对应着一个决策,实心节点叫做“结果节点”。可以看到,这个 tree 里面有两个决策节点{n0,n1},和三个结果节点{xa,xb,xc}。这里,每个节点代表的含义如下:

{n0}:周一的陈茁,向左走表示先玩一局,向右走表示直接卸载扫雷;

{n1}:周六的陈茁,向左走表示继续玩下去,向右走表示不玩了;

{xc}:由于没玩到新版扫雷复习过程心不在焉以致于考试只考 60 分;

{xb}:玩到了扫雷心满意足复习火力全开考 100 分;

{xa}:过度沉迷扫雷导致错过考试。

从这些结果来看,

{xb}是最好的结果,也就是“对自己最有益的事情”,但是不幸的是,陈茁最后一步一步地走到了{xa}这个最差的结果。

为什么呢?因为他要实现这个最好的结果{xb},需要做两次选择:一次是“要不要开始玩”,一次是“要不要停止玩”。而且,为了实现{xb}这个结果,决策者必然要先放弃掉{xc}这个不是最好也不是最差的选择,把自己置于一个“best or never”的选择题当中。

在周一,决策者对这个游戏还没有“上瘾”,他对考试结果还是在意的,否则也不会选择放弃掉{xc}。也就是说,如果不是他无比相信自己一定能在周六选择{xb},就不会提前放弃{xc}。但是到了周六,面对已经上瘾了这个结局,他的偏好改变了,而且这种改变是没有被预料到的,他只能选择接着玩儿下去直到错过考试。

行为经济学有一篇很经典的文章:

article_20151029-2_2.png

里面的 Projection Bias(投射偏见),说的就是人们有低估自己偏好改变的倾向。决策理论家将这类决策者叫做“幼稚决策者(naive decision maker)”,他们的特点是喜欢制定一些自己完不成的计划,马三立先生的《明天开始》说的就是这类人。这种谬误也被称作“规划谬误(planning fallacy)”,笔者就是一个深度患者。

有人会问,是不是偏好的改变被预见到了就完事大吉了呢?不是。在上面的“潜在上瘾(potential addict)”中,如果决策者预见到了自己一旦开始玩就根本停不下来,也就是说,他知道一旦放弃{xc},他将在未来选择{xa}。应用倒推法(backward induction)的思想,他会直接选择卸载扫雷,而这个结果也不是最优的。这样的决策者被称作复杂决策者(sophisticated decision maker)。

行为经济学的另一篇经典文献讨论了两类“非理性”的决策者的福利问题,

article_20151029-2_3.png

他们研究了两类子情境,一类是“现在痛苦将来幸福”,另一类是“现在幸福将来痛苦”,作者证明,对于每一类决策者,分别有一个情境使他们的福利更低。

如果陈茁可以在决策节点n0处,直接从{xa,xb,xc}选择,那么这种事情不会出现。因为我们已经假设了xb≥xc≥xa。可能很多读者已经反应过来了,这其实就是博弈论嘛,而且是简单的完全信息静态博弈,解是子博弈完美纳什均衡。事实上,这个结论早在 1973 年就被证明了:利用泽莫罗公理,任何有限博弈树存在 SPNE,所以,复杂决策者(Sophisticated decision maker)一定有均衡策略。潜在上瘾(Potential addict)与一个博弈的区别在于,这是现在的自己和未来的自己之间的博弈,是一个自我控制问题,然而因为在两个决策节点上偏好不同,我们无法把“他们”看作同一个人。Hammond (1988):

Rather,the potential addict is really two (potential) persons,before and after addiction,and the decision problem has to be analysed as a “game” between two “rational players”.​

陈茁首先向左走,先玩儿了一局,然后成功上瘾,错过考试,走到人生低谷。而爸妈口中的“别人家的孩子”们,那些不会犯错的神(jian)人们,究竟怎么做呢?第一步,他们从容不迫地选择向左走,大胆地玩儿了一局,然后意识到需要学习了,他们就不玩儿了。

换言之,他们从一开始就有一个走到xb的计划,并且在后续过程中靠着完美的执行力从容地执行了这项计划。这些人代表了所谓的完美意志,无论偏好怎么改变都有严格的纪律性来实现之前订立的目标。

就此,Hammond 提出了“结果主义”的概念。结果主义,顾名思义,就是所有行为都对着一个结果去的。妈妈对孩子说,你敢调皮我就打你,孩子预见到了妈妈其实舍不得打他,于是还是调皮。

那么,在我们的例子里面,空威胁(empty threat)对应着什么呢?很明显,“剁手”就是对自己的,或者说现在的自己对未来的自己的空威胁。如果这个一人博弈树通过倒推法(backward induction)找到的均衡行为,与简单的静态选择一致,那么行为就是结果主义的。

显然,potential addict 不满足结果主义,为什么呢,看这个决策树。

article_20151029-2_4.png

和上面那个相比,这里多了一个xd,假设,xd和xb表示同样的结果,小玩儿辄止,不同之处在于给予了决策者事先规范自己行为的方式(比如把剁手的权力交给一个跟你有仇的人,再比如给信用卡设置一个上限等等)。我们可以看到,在这个“树”当中,决策者会毫不犹豫地选择xd,既不是幼稚(naive)情况下的xa,也不是复杂(sophisticated)情况下的xc

对于别人家的孩子来说,结果主义一定是满足的,他们不受情绪的影响,不为诱惑所动,持续投入,最后做成了我们看来有益的事情。而对于我们一般人,上面的例子告诉我们,我们必须通过缩小自己未来的选择集来控制自己。Gul & Pesendorfer 2001 年发表在 Econometrica 上的文章中举例说,人在早上励志要减肥,并且预见到了自己中午饿了的时候会狂吃,那么早上订餐的时候,就不要给自己留下吃肉的自由。所以,戒烟的人把打火机交给值得信任的朋友,存钱的人把信用卡交给值得信任的朋友,减肥的人把钱包交给值得信任的朋友,才是现实的。