[精品]动物行为训练的理论基础.doc

[精品]动物行为训练的理论基础.doc

ID:49405771

大小:127.00 KB

页数:5页

时间:2020-03-01

[精品]动物行为训练的理论基础.doc_第1页
[精品]动物行为训练的理论基础.doc_第2页
[精品]动物行为训练的理论基础.doc_第3页
[精品]动物行为训练的理论基础.doc_第4页
[精品]动物行为训练的理论基础.doc_第5页
资源描述:

《[精品]动物行为训练的理论基础.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、动物行为训练的理论基础(北京动物园刘赫)摘要:木文阐述了动物行为训练的生物学背景和相应的心理学和神经生理学原理,论述了动物四种学习方式以及动物训练的两种方法:强化和惩罚。关键词:行为训练条件反射强化惩罚一、生物学背景和原理动物的行为训练就是一种学习行为,动物有四种学习方式:经典性条件反射、操作性条件反射、适应和复杂学习。经典性条件反射就绘著名的巴甫洛夫条件反射,巴甫洛夫是前苏联著名的生理学家,曾因为对动物消化腺的创造性研究而获得1904年诺贝尔生理学奖。巴甫洛夫对动物消化腺的研究主要以狗为研究对象。他与

2、助手在对狗的研究屮发现,当助手给狗食物时,狗吃到食物,会分泌很多唾液;此后乂发现狗只要看到食物,就开始分泌睡液;再后来,只要听到助手的脚步声,狗似乎知道马上就可以吃到食物,唾液的分泌也开始增加。巴甫洛夫系统研究了这种现象,提出了“条件反射”的概念,后人称Z为“经典条件反射”。巴甫洛夫认为,条件反射形成的条件是无条件反射:食物吃到嘴里,引起唾液分泌增加,这是H然的生理反应,形成后不需要学习,这种反应叫做无条件反射;此时引发反应的刺激是食物,为无条件刺激,做出的反应是无条件反应。另外一种是条件反射:研究助手

3、的脚步声与狗的唾液分泌增加木来没有必然的联系,是一种无关刺激,或称屮性刺激;当脚步声与食物同时、多次重复后,狗听到脚步声,唾液分泌就开始增加,这时中性刺激市于与无条件刺激联结而变成了条件刺激,由此引起的唾液分泌就是条件反应。操作性条件反射是美国心理学家斯金纳(B.F.Skinne「)在木世纪30年代根据他所设计的实验研究的结果提出来的。斯金纳设计了一种专用木箱——斯金纳箱,箱内有一套杠杆装置。将饥饿的动物置于箱内,它们在箱内乱跑、乱咬、乱撞,偶尔跳上杠杆,将杠杆压下,这时杠杆带动一个活门,从活门内掉出一

4、个食物小球滚入箱内的木槽屮,从而取得食物。以后动物再次进入箱内经过乱撞之后按压了杠杆取得了食物,反复几次之后,饥饿的动物一进入箱内,就会主动按压杠杆取得食物。这样就在压杠杆和取食物Z间形成了条件反射,斯金纳称它为操作性条件反射。操作式条件反射如以食物为非条件刺激,也可称为食物运动性条件反射。将动物(如鸡)放入实验箱内,当它在走动中偶然用喙啄在杠杆上时,就喂食以强化这一动作,如此重复多次,鸡就学会自动啄杠杆而得食。在此基础上,可以进一步训练动物只有当出现某一特定的信号(如灯光)后才啄杠杆,才能得到食物的强

5、化,就形成了以灯光为条件刺激的食物运动性条件反射,或称操作式条件反射。这类条件反射的特点是动物必须通过白己的某种运动或操作才能得到强化,所以称作操作式条件反射,这是一种更为复杂的行为。斯金纳的操作性条件反射又称工具性条件反射,其结果是规范或改变动物的行为。动物通过自己的某种活动或操作才能得到强化而形成条件反射。动物对环境做出反应,从而得到奖励,动物的行为在要求奖励的时候是一种丁■具。在操作性条件反射中,动物通过展示特殊行为而受到奖励或避免一个转移性刺激。例如,动物进入一个指定区域,然后动物受到食物奖励。

6、在建立这种关系后,在下次动物更愿意进入指定区域。适应是重复刺激导致行为减弱或消失的结果。例如动物开始可能被巨大的噪咅惊吓,但如果噪音重复许多次,动物对噪音的反应开始变小。此时噪音作为一种刺激,逐渐转变成被忽略的事物。复杂学习基本上是一•种无所不包的条目。科学家最初认为所有的学习都能概括为适应、典型条件反射和工具性条件反射。然而这三种学习形式不能解释一些观测到的学习,如有的动物通过观察其他动物学会了作某些特殊的行为;或某些隐藏的学习,如果大鼠第一次探索过一个迷宫,当再次通过的时候其速度会更快。二、动物行为

7、训练的方法一强化行为训练的方法主要是强化和惩罚。强化是无关刺激和无条件刺激在时间上结合的过程。包括正强化和负强化,正强化是使动物感到高兴或愉快同时增加其特殊行为发生可能性的作用;而负强化则是使动物感到不高兴或不愉快,同时为了消除某些作用而增加其特殊行为发生可能性的作用。与之相对有积极强化物和消极强化物,积极强化物是指能增强该反应与反皿相依随的刺激,如水、食物、奖赏等;所谓消极强化物,是指与反应相依随的刺激物,从情境屮被排除时,可增强该反应。例如,将白鼠放进一特别箱子屮,给予白鼠电击直至白鼠按压杠杆。经过

8、几次强化以示,H鼠很快习得了压杆反应,以逃避电击。电击即是增强压杆反应的消极强化物,其他诸如强光、噪声、批评等厌恶性刺激皆屈此类。图一强化分类指示图正强化积极强化物/水、食物、语言奖励、抚摸等良好刺激负强化极强化物强光、噪音、批评等厌恶性刺激。强化的程序分为连续强化和间歇强化。间歇强化一般可分为固定强化和菲固定强化两种。固定强化又分定时强化和定比强化。定时强化是指以反应时间而非反应数量为单位來实施强化,如每隔3分钟或10分钟给予一次强化,人

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。