操作性条件反射(operant conditioning):由美国心理学家斯金纳命名,是一种由刺激引起的行为改变。操作条件反射与经典条件反射不同,操作条件反射与自愿行为有关,而巴甫洛夫条件反射与非自愿行为有关。
操作性条件反射这一概念,是斯金纳新行为主义学习理论的核心。
斯金纳把行为分成两类:一类是应答性行为,这是由已知的刺激引起的反应;另一类是操作性行为,是有机体自身发出的反应,与任何已知刺激物无关。与这两类行为相应,斯金纳把条件反射也分为两类。
与应答性行为相应的是应答性反射,称为S(刺激)型(S型名称来自英文 Stimulation);与操作性行为相应的是操作性反射,称为R(反应)型(R型名称来自英文Reaction)。S型条件反射是强化与刺激直接关联,R 型条件反射是强化与反应直接关联。
斯金纳认为,人类行为主要是由操作性反射构成的操作性行为,操作性行为是作用于环境而产生结果的行为。在学习情境中,操作性行为更有代表性。斯金纳很重视R型条件反射,因为这种反射可以塑造新行为,在学习过程中尤为重要。
斯金纳通过实验发现,动物的学习行为是随着一个起强化作用的刺激而发生的。
斯金纳把动物的学习行为推而广之到人类的学习行为上,他认为虽然人类学习行为的性质比动物复杂得多,但也要通过操作性条件反射。操作性条件反射的特点是:强化刺激既不与反应同时发生,也不先于反应,而是随着反应发生。
有机体必须先作出所希望的反应,然后得到“报酬”,即强化刺激,使这种反应得到强化。学习的本质不是刺激的替代,而是反应的改变。斯金纳认为,人的一切行为几乎都是操作性强化的结果,人们有可能通过强化作用的影响去改变别人的反应。在教学方面教师充当学生行为的设计师和建筑师,把学习目标分解成很多小任务并且一个一个地予以强化,学生通过操作性条件反射逐步完成学习任务。
在营销中的应用
1.外卖红包设计
首先,我们了解关于强化物的概一级强化物能够直接满足我们的欲望,比如:食物满足了生物进食的原始欲望,水满足了我们饮水的欲望,我们管食物和水,成为一级强化物。
二级强化物指初时并不具有强化的作用,而是由于它们同诸如食物、水之类的一级强化物相匹配而具有了强化的作用。最常见的就是金钱,获得金钱后可以用来购买水、食物等一级强化物。
让我们模拟一个场景:一天中午,你选择了用饿了么进行午餐的购买。当你下单成功后,饿了么会立即弹出红包分享窗口,告诉你“您和您的朋友都有红包可以领取”,红包领取的金额(二级强化物)可以在下次订餐时使用,这是一次固定正强化(下单肯定有红包)。
当你分享后,发现分享出去的是“拼手气红包” ,第n个领取的人才能获得大额红包,其余都是小额。你有时点开是1块,甚至5毛,偶尔运气好,你抽中了大包,可能是5-10块不等。当你抽到大包时,多巴胺大量分泌,给你带来超乎寻常的快感。
这时候你发现了吗?这是一次典型的概率型正强化。
由于是随机性质的抽奖,你很难直观地判断强化机制是否失效,所以单次的失败(没中大包)不会给予明显的“惩罚”效果,终止你的习惯,从而你的学习行为(下单)会一直持续下去。
现在你就会发现:平台通过发送拼手气红包的方式,连续两次,通过不同形式强化了你的下单行为。
但是当红包力度下降,每次即使运气好也只能抽到2-3块时,你便不再使用这个平台,进而开始寻找其他优惠力度大的平台。这就是因为降低奖励,给你造成了负强化,慢慢的减少、消除了你的下单行为。
最后当订单送达,你获得了食物(一级强化物),平台针对你“下单”这个动作的强化才到此为止。经过这一连串的强化,以后你只要肚子一饿,就会想打开饿了么订餐,这就是强化的意义。
2.泡泡玛特盲盒设计
为什么大家这么热衷于拆盲盒?
对于盲盒购买者来说,打开盲盒获得想要的玩偶是一种“奖赏”,会正强化购买盲盒这一行为。不确定的购买结果,就像以一定概率掉落的食物,使购买者无法判断行为与结果的关系,行为就有可能始终持续下去。
概率化的正反馈导致消费者无法量化自己所花的钱与所得的奖励之间的关系,即有可能花费极少的成本就获得巨大的正反馈。
为了获得正反馈(比如仅有1%可能抽到的稀有玩具),消费者不得不反复的去消费盲盒,就如同小白鼠并不知道哪一次能获得食物,只能不停的按按键希望得到正反馈,在这个时候,人类与小白鼠处于同一智商层面。
如果某家POPMART直营店曾经多次出现稀有物品,或者有多个在不同分店抽到稀有物品的人有行为共性,并且这一消息传播开来,那么大家就会蜂拥而至,并且反推原因——如猜测这家店是旗舰店货源有优势,或早上到货的盲盒更容易出现稀有物品的运输批次。