大自然定律
各位朋友好 , 在之前讨论过的「正面奖赏与确认训练法」 , 我谈及到奖赏式训练的优点 , 运用方法与重要性 ◦ 在自然界里 , 有正必有负 , 有柔必有刚 ◦ 动物训练领域中还有另一面所谓传统式的训练法或正确名称应该叫作负面学习的训练方法 , 亦有其独特优点与功用 ◦ 我将于本文讨论负面学习的系统与结构 , 希望读者能增加对犬只训练正与负的全面理解和平衡 , 而可以对犬只的不同天份 , 个性 , 功用 , 和经验因材施教 ◦
什么是负面学习 ?
负面学习 (Aversive Conditioning) 有很多不同名字 , 风格和程度 , 例如 Stress to Comfort , Escape Training , Avoidance Learning , Force Training , Punishment , 和 Compulsion 等等 ◦ 由于这类名称大多数都意味着逃避 , 强迫 , 或惩罚等字眼 , 不是真正理解这训练系统的朋友经常对其误解 , 以为这是对犬只暴力虐待的方法 , 使初学者容易产生成见或错误运用 , 其实真正的负面学习并非如此 , 和正面奖赏一样 , 都是高度科学化的训练系统 ◦
负面的意思是指任何不受欢迎的刺激 , 不安感觉 , 烦恼 , 滋扰 , 或压力 (Stress) ◦ 压力的定义因人而异 , 对每只受训练的动物都不同 ◦ 而同一个体 , 在不同的情况下 , 都有很大机会对相同程度的压力有不同反应 ◦ 压力的范围甚广 , 噪音可以是压力 , 斥责 ,等候可以是压力 , 气温的高低可以是压力 , 失眠和痛楚亦是压力 ◦ 负面学习的原则 , 是要对受训个体施加最微弱的压力 , 甚至只是压力前的先兆 , 就得到最理想的指定行为 ◦
传统负面学习的例子
相信很多犬主都体会过犬儿在步行时扯带的感受 ◦ 狗只扯带原因多数是自然探索行为或族群权力问题 , 这行为经常为主人带来很多不便 , 所以有需要训练犬儿在主人的左侧随行 ◦ 随行当然可以用正面奖赏教导 , 但在这儿我会集中于负面学习 ◦
首先 , 犬儿必需戴上皮颈环和狗带 ◦ 训犬员带犬儿出外散步 , 犬儿像平常一样扯带冲前 , 这时训犬员指令一声 “Heel” , 一秒钟后向右后抖动狗带 , 同时迅速向右后 180º转身 , 往返方向前行 ◦ 由于训犬员突然改变方向 , 这时狗儿由本来带头向前变为跟从在后 , 由主动变为被动 , 决策权归还训犬员手上 , 此刻训犬员用左手轻拍左腿 , 鼓励狗儿跟随在左侧 , 当犬儿成功在左侧随行时 , 训犬员柔声称赞 “Good Boy , Heel” , 并轻抚犬儿表示喜悦 ◦ 如此每天练习 , 每当犬只扯带冲前 , 训犬员就重复这程序 , 久而久之 , 犬只养成习惯在主人一声 “Heel” 后在左侧随行 ◦
这么简单直接的一个训练过程起码有一百年历史 , 几乎每个训犬员都懂 , 利用恰当 , 可以快速教导犬儿各种指令 ◦ 传统负面学习的步骤如下 :
1. 否定信号
2. 压力
3. 正确行为
4. 压力消失
在教导犬儿左侧随行时 , 训犬员的 “Heel” 指令 , 其实是施展压力前的否定信号 , 表示 「你现在的行为如果在一秒钟后不改变 , 你将会受到压力 ◦」 因为每次在“Heel”后训犬员都会快速向右后180º 转身 , 并且抖动狗带 , 而当犬只走在主人身边时 , 不但没有压力 , 更获得主人称赞确定正确行为 ◦ 从狗儿的累积经验中 , 他渐渐学会如果在“Heel” 后跟从主人左侧随行 , 可以避免压力 , 所以会特别留意训犬员的步伐和指令 ,改变扯带冲前的行为 ◦
否定信号 (Aversive Marker)
否定信号是训犬员对犬只施压前的信息 , 在以上举例的 “Heel” 就是一个否定信号,因为在初期教导犬儿左侧随行时 , 每次 “Heel” 后一秒犬儿都会感受压力 , 在狗只学会了只要听到“Heel” 后随行于主人 , 便可避免受压 ◦
除此之外 , 香港最流行的运动赛马 , 马匹都是主要由负面学习训练出来的 ◦ 缰绳向左收紧 , 马匹感受压力 , 当他靠左后 , 骑师放松缰绳 , 压力消失 ◦ 大家又有否留意到骑师大多数在抽鞭前都会向马匹展示马鞭 , 而很多时候马匹一看到鞭子便加速奔驰吗 ? 这些都是负面学习的例子 ◦ 其实否定信号只是正面奖赏中确认信号的相反 ◦ 在我们日常生活中比比佳是 , 甚至交通灯的红灯都是否定信号 「你现在如果再不停止 , 你将会面临压力(危险) ◦」 而绿灯可算是正面奖赏中的确认信号 ◦
常被误解的电颈环
电颈环 (Teletact, Electric Collar, Remote Trainer) 是训犬界一个最常被误解和滥用的发明 ◦ 它之所以被误解 , 就是因为人们对它的滥用 , 而它被滥用 , 也正是因为人们对它的误解 ◦ 这工具的操作非常简单 , 狗只戴上特制的颈环 , 训练员手持遥控 , 能于方圆二百公呎内向犬儿发放不同级数的电流刺激 , 以作行为的奖赏或纠正 ◦ 这是电颈环方便之处 , 但亦是最被误解和滥用之处 ◦
电颈环的发明给予练犬员能力于远距离无绳纠正犬只行为 , 提高指令的可靠性 , 纠正并不是强迫 , 避免压力是任何动物天生的本能 ◦ 电颈环亦不是虐待工具 , 而是利用动物天生避重就轻的习性来训练我们要求的行为 , 它与声盒一样 , 是在实践上的科学 ◦
下一部会续谈正确使用电颈环的系统 ◦
负面学习与常被误解的电颈环 2 :
压力的运用
我有一朋友 , 曾经对她训练的马令华犬束手无策 , 我问她为何烦恼 , 她对我说 :「近来不知怎样 , 每次在追踪时纠正我犬儿的速度 , 他总会放弃追踪 , 立刻跑往我左侧随行 ,就算我指令他继续前进 , 他只会紧靠我左侧 , 越纠正他却越紧靠我身旁 ◦」 我笑说 :「左侧随行是不是你第一个用电颈环教他的指令 ?」 她惊奇地说 :「你怎知道的 ?」 原来犬只虽然聪明 , 但学习时大都不能举一反三 , 像机械人一般 , 对没有输入过的程式不懂处理 ◦ 如果学习的基础没有打稳 , 日后要提高训练水准时往往进一步退两步 , 每当犬儿感到压力时只会联想到第一次受压时学会的行为 , 就像我朋友的马令华一样 ◦
由于每位训犬员对其犬只的要求都不同 , 运用电颈环的方法与程序根据犬儿的功用均有变化 , 我在这儿的举例将会集中在最讲求效率和操控能力的工作犬和比赛犬训练上 ◦ 工作犬与比赛犬 , 不论是警犬 , 护卫赛犬 , 服从赛犬 , 若要稳定贯彻地获得可靠性和优异成绩 , 犬只本身必需热爱工作 , 而培养活力和动力最有效方法就是我不久前介绍过的正面奖赏 ◦
电颈环的运用 , 最终目的是犬只没有佩戴电颈环时 , 都能在任何日常情况下绝对明白与服从指令 , 所以训练中的系统与编排不容有失 , 否则徒劳无功 ◦ 由于单凭笔墨所能表达的意念有限 , 以下扼要只供参考 , 有很多重点细节未能尽述 ◦ 读者们如要真正实习电颈环的训练系统 , 必需对此法胜任的训犬师请教 ◦
正 确 运 用 电 颈 环 的 程 序
1. 将 电 颈 环 和 链 环 交 替 与 食 物 一 起 引 进
这首要部骤是要将电颈环引进为犬儿特别喜欢的东西 , 当训练员第一次将电颈环戴上犬儿时 , 立即给与食物 , 当 儿吃饱后 , 训犬员立即拿下电颈环 ◦ 第二天重复这过程 ◦ 到了第三天 , 训犬员用一普通链环 (Choker Chain) 代替电颈环戴上犬只 , 仍然给他食物◦ 如是者连续十天随意把电颈环和链环交替戴上 , 然后喂以食物 , 但永远不会两个颈环一起戴上 , 而且喂饲时间每天不一 ◦ 这个程序非常重要 , 除了利用条件反射的原理引进颈环的正面形象外 , 更加将电颈环和链环配对成同一颈环 , 而且电颈环又是经过巧妙的修改 (见 图) , 令犬只误认两者如一 , 没有分别 ◦ 由于犬只在比赛时不能戴电颈环 , 这一点对犬只日后在只可戴着链环的情况下工作极为重要 ◦
2. 将电颈环和链环交替与猎靶一起引进
每头犬只对猎物都拥有不同程度的动力 , 犬只喜爱追捕皮球或快速移动的物体正是因为这种天赋的捕猎本能 ◦ 如果犬儿天生猎性强 , 再加上训犬员后天的栽培 , 捕猎动力可提供极奇强大的能量 , 对犬只在追踪 , 服从 , 和攻击等工作都可发挥非常潜在力 ◦ 其实 , 犬儿和训练员追逐玩耍与猎性的提高绝不限于工作犬训练或电颈环的应用 ◦ 家犬本身由狼进化而来 , 是有高度组织性猎食动物 , 生活中的大部份时间都是直接或间接环绕捕猎 ◦ 与犬儿玩耍除了提供运动和刺激脑部发展外 , 正确的游戏更加提高犬只的反应 , 集中性 , 服从性 , 和巩固主人的领袖地位 ◦
经过第一部骤后 , 犬儿已经对电颈环和链环产生好感 , 第二部骤最主要以条件反射原理 , 使犬只一戴上颈环便进入兴奋主动状态 ◦ 训犬员准备好犬儿平时喜爱追捕的猎靶例如皮球 , 咬靶等 , 训犬员将犬儿带到训练场入口 , 把电颈环戴上 , 随即牵犬进场, 掏出猎靶与狗儿激烈地玩耍追捕约一至三分钟 , 然后脱下颈环 , 带犬儿离开场地 ◦ 第二和第三天重复部骤, 但改变训练时间 ◦ 第四第五天改用链环 ◦ 第六第七天再用电颈环 , 但改变场地 ◦ 如是者连续十天反复进行 , 训练时间与场地不一 , 但每次戴上颈环 , 就一定是玩耍追逐时间 ◦
到了第十一天 , 戴上颈环的过程不变 , 但此时训练员应开始在与犬儿于训练场上玩耍时引进少量犬儿已懂得的服从指令例如 “Sit”◦ 训练员如常带狗儿到训练场外 , 由于犬儿已经对训练场视为玩耍场地 , 会急不及待冲进场内 , 但此际训犬员用狗带限制其行动 , 犬儿将会变得异常兴奋 , 可能大叫大嚷 , 或弹跳不停 , 训犬员不理其行为 , 只向犬儿指令 “Sit”, 通常犬儿因过于活跃 , 都对指令听而不闻 , 领犬员静心等待遍刻, 再发指令 , 当犬儿成功做到指令时 , 训犬员立即说 “Free”, 并且替犬只戴上电颈环 , 随即进入训练场玩耍一番 ◦ 第二天重复程序 , 第三天在开始时亦一样 , 但在玩耍时给予一至三次 “Sit” 的指令 , 每当狗儿做到要求就立刻奖赏 ◦ 此步骤是要将训练和玩耍配对 , 令犬儿视工作于娱乐 ◦ 如此续渐增加训练而将大部份玩耍押至最后 , 随了 “Sit”,训练员亦应该练习犬儿已懂的其他指令 , 但每堂只练习一种指令 , 以免犬儿混乱 , 如此练习两星期 ◦
3. 用否定信号和狗带引进纠正 , 以正面奖赏适放和舒缓压力
当我在训练自已的工作或比赛犬时 , 首先会以正面奖赏确认训练法教导犬儿各种指令 , 直至犬儿对指令完全明白才会开始使用压力 ◦ 在我第一次使用压力时 , 犬儿必需经明白 “Here” 的指令 ◦ “Here” 的意思是狗只正身坐在主人前 , 精神完全集中于主人双眼 ,目不转睛 ◦ 注意力 (Attention) 是判断训犬员对犬儿操控功夫最明显的准则 , 犬儿在全神灌注盯着主人时 , 服从性与效率一定比东张西望时高 ◦ 在工作与比赛中大部份时间犬只都必需将注意力完全集中在训犬员身上 , 所以注意力是我引进压力的第一个行为 。
首先 , 我为犬儿戴上普通狗带 , 在进入训练场前一刻再如常戴上电颈环或链环 ◦ 我指令犬儿 “Here”, 由于他已经从正面奖赏学会了 “Here”, 同时知道听从指令有好处,所 以在平常的训练环境下一定乐意服从 ◦ 这时在距离我约十公呎的助训员使用各种方法如呼唤 , 吹口哨等行为企图分散犬儿对我的注意力 , 当犬儿目光一脱离我时 , 我立即沉声说 “No”, 一秒后抖动狗带 ◦ 这时由于犬儿听到我不悦之声 , 而且受到纠正 , 通常注意力会迅速返回我处 , 就在这时我柔声说 “Free”, 然后立即掏出猎靶与犬儿玩耍一番 , 舒缓压力 ◦ 如此重复这过程三至五遍 , 每天渐渐提高助训员难度和延长犬只集中时间 , 在不同时间和场地练习十天 , 每次在施压后 , 犬儿再集中精神时 , 都给与赞许或奖赏 , 如果犬儿在我说 “No” 后立刻望回我处 , 我就不需施压 , 而直接奖励他 , 在此阶段的目标是要犬儿在有高度分散注意力的事物下都目不转睛望定主人 ◦
4. 将狗带和电颈环的轻微闪动电流一并使用
训练至此 ,犬儿已经开始明白到听从指令不但可获得奖励 , 而且能避免压力 , 而每次压力来临前必有警告 , 使他有机会改变行为 , 这是引进电颈环的时候了 ◦ 由于电不是犬只会在天然环境接触到的事物 , 所以训犬员在引进电环时必需清楚令犬儿明白电力是来自主人的压力 ◦ 引进程序与上一部相同 ◦ 训犬员指令犬只 “Here”, 助训员分散犬儿注意力 , 训犬员沉声说 “No”, 然后抖动狗带 , 与此同时以电颈环最微弱的舜间电力刺激犬儿 , 当犬儿注意力回到训犬员时 , 立即得到奖赏 ◦ 这小小步骤将狗带的抖动和电颈环配对在一起 , 使犬只清楚明白电压与狗带一样 , 是来自主人的纠正压力 ◦ 训犬员需将电力调校至犬儿有反应而又最低的水平 , 使犬只不会过份受压 ◦
5. 将否定信号和电颈环一并使用
经过大约五天 , 如果训练员将系统正确练习 , 应该已经成功把电颈环引入 ◦ 从此在训练犬儿已懂得如何逃避电力的指令时不需再用狗带 ◦ 只用 “No” 和最适量的电压 , 但引进新的要求例如速度和准确性时 , 必需还是在初期配合狗带使用 ◦
6. 教导犬儿于其他指令亦需集中注意力
当犬儿已经明白在 “Here” 必需将注意力完全集中在主人身上 , 是时候把注意力普及于其他指令了 ◦ 在护卫与服从比赛中 , 左侧随行的注意力非常重要 , 但在军警犬和日常家庭犬的训练 , 随行时并不需要注意力 , 训犬员可以将注意力引用于“Sit” 或者“Down” 等指令来提高对犬只的控制 ◦ 训练方法和第3 至5 部骤一样 ◦
7. 以电颈环提高速度和动力
训练至此 , 如果犬儿能对训练员目不转睛地进行 “Sit”, “Here” 和 “Heel” 等指令 , 训犬员可以开始对这些动作逐一琢磨 , 提高其速度与动力 ◦ 以 “Sit” 为例 , 这阶段的目标是要犬儿在听到 “Sit” 后立即坐下 , “Sit” 对犬只的意思 , 随了是获得奖赏的机会 , 更是逃避电力的途径 ◦ 训犬员首先把狗带和电颈环戴上犬儿 , 训练员指令一声 “Sit”, 若犬儿在半秒后臀部还未接触地面 , 训练员立即抖动狗带和按动电流 , 当犬只臀部一触及地面 , 训犬员立即说 “Free”, 让犬儿咬捕猎靶片刻 ◦ 重复过程两次 , 然后脱下狗带 , 只利用电颈环再练习两次 , 使用的电力必需适当 ◦ 经过大约三天 , 犬儿开始提高坐下的速度 , 训犬员可以缩短 “Sit” 与启动电流的时间 , 使犬只反应越来越快 , 最终目的是要求不需启动电流犬儿亦能以最快速度坐下 ◦
8. 正确运用 , 潜能无穷
电颈环的正确运用 , 可以将犬只训练带至更高层次 ◦ 我以上所叙述的 , 只不过是正确应用颈环的基础 , 电颈环还有连续刺激的功能 , 把犬只的准确性和动力进一步提升 , 由于使用过程比以上谈及的更加深奥复杂 , 令初学朋友容易出错 , 所以暂且不谈 , 有机会我回香港时与大家分享 ◦
训练动物的系统和方法多不胜数 , 无论运用任何训练系统 , 正面也好 , 负面也好 , 奖赏和压力只是初期会经常出现的项目 , 当犬只开始明白到主人的要求 , 奖赏和压力就渐渐淡出 , 不是每次都需要使用 , 训练的最终目标是要犬只可靠地服从指令 , 而且热爱工作 , 充满活力 ◦ 这一点训练员请紧记心中 ◦
负面学习与常被误解的电颈环 3 :
电颈环独特的优点
电颈环在训犬员的正确运用下 , 能发挥其他工具无法取代的优势 ◦
1. 训练员纠正犬只时无需任何身体动作
这优点非常重要 , 尤其是警犬和服从比赛犬 , 可效性是必具条件 ◦ 但如果犬只惯性受到训犬员用手或狗带纠正 , 每当训犬员的手一抖动时犬儿就可能畏缩 , 一来影响出赛水准 , 二来犬儿因为经常提防训犬员的身体动作 , 对其注意力及表情都有负面效果 ◦ 其实这是大部份训犬师经常讨论的问题 , 「如何纠正犬只 , 提高其可效度与注意力 , 而同时又能保持其活力和速度 ◦」 就以今年FCI 世界赛为例 , FCI 是全球最高威望的赛事 , 但在 FCI 中九乘赛手仍需利用身体语言和各种花招提示或操控犬只 , 多只赛犬更有困难仅靠听觉分辨 “Sit” 和 “Down” 等指令 , 可见训练基础的重要性 , 而正确运用电颈环 , 可以提高犬儿可效度和注意力 , 同时避免牺牲动力与活力 ◦
2. 长距离无需狗绳纠正犬只
犬只是极具智慧的动物 , 很快能察觉出狗绳是训练员用作控制其行为的工具 , 没有狗绳时大多数犬只会偶尔试探主人 , 开始时可能只是延迟正确行为或敷衍主人 , 如果得以成功, 可能会提升至完全违抗指令 ◦ 如果犬儿拒绝归来 , 单只是一次 , 不但为主人带来极大烦恼 , 更加可能构成犬儿本身或公众危险 ◦ 正确的使用电颈环 , 可以于远距离无线操控犬只 , 使他习惯任何地方都必需服从指令 ◦
3. 教练在指导训犬员时可以为其纠正犬只而不被犬儿察觉
在一些练习中例如搜索靶手 , 训犬员可能完全看不见犬儿 , 但教练或靶手可代以操作遥 控 , 肯定犬儿正确行为 ◦
4. 电颈环每次释放的电力都可以调校至同一标准
力度一致的电压不会由于训练员的心情增强或减弱 , 令纠正信息更清楚 ◦
5. 训犬员不需要体力纠正犬只
一些负面学习中的技法例如教导犬只在随行时抖动狗带和转步 , 需要训练员的一定体力和敏捷度 , 在犬只明白训练员的要求后 , 电颈环可以取代体力上的元素 ◦
因滥用电颈环而生的问题 :
1. 犬只过度受压 (太强 , 太久 , 太频密)
2. 犬只 压后没有适放和舒缓的途径
3. 犬只知道戴上电颈环必需听命, 没有颈环就能为所欲为
4. 犬只不明白为何受压
5. 犬只不明白如何逃避电流
6. 犬只变得毫无动力
7. 犬只变得更加凶恶顽强
训犬员用电颈环时需知 :
1. 必需按部就班 , 在教练指导下有层次地使用 , 切忌贪图快捷
2. 电颈环是用于提高犬只训练水准的工具 , 不是训练员发泄或报服的私器
3. 用电颈环的原则 , 是要对狗用只施加最微弱的压力 , 甚至只是压力前的先兆 , 就得到最理想的指定行为
4. 在未开始使用电力前 , 犬儿需佩戴关掉了的电颈环起码三星期 , 是以适应颈环的存在
5. 狗只必需明白 , 电力是发至训犬员 , 不是从天而降
6. 在未开始使用电颈环前 , 犬只必需清楚知道训犬员的要求
7. 训犬员必需与教练小心计划训练程序 , 使犬儿最终能没有佩戴电颈环都可达到一致水准
8. 电颈环只是训工具之一 , 若过份依赖或非用不可 , 则表示训练系统不够周密
负面学习的独特优点 :
1. 提高行为的可靠性
2. 提高准确性
3. 即使犬只缺乏天生动力都能运用
4. 可迅速压制一般惯于挑战主人的家犬
5. 对付侵略其他犬只等顽劣行为极其迅速有效
负面学习的缺点 :
1. 容易被误解和滥用
2. 错误运用可能令训犬员对自已和犬只训练全失信心
3. 极端压力会损害犬儿与主人关系
4. 一但错用可能无法补救
5. 犬只可能变得消极被动或受压时攻击训犬员
6. 犬只长期生活在压力中可能会生病甚至死亡
7. 单靠负面学习难以提高犬动力与活力
8. 单靠负面学习难以教导极奇复杂的行为
9. 负面学习中最难掌握的是训犬员的情绪和施与压力的强弱
10. 受动物品种影响 , 例如家猫很难以负面学习来训练 , 但对正面奖赏的确认训练法效果很好
其实简单来说 , 负面学习就是正面奖赏的对比 ◦ 正面奖赏中的指令 , 是给犬儿一个奖励的机会 , 做对有奖 ◦ 而负面学习中的指令 , 是给犬儿一个逃避压力的机会 , 做对没有压力 ◦
在八十年代 , 一些对负面学习及正面奖赏均有资深经验而富有想象力的护卫犬赛手开始将两者有条理地一拼配合使用 ◦ 经过历年来在训练理论上与比赛实践上不断钻研和雕琢 , 加上声盒和电颈环的引进 , 如今世界上少数训犬名家如我的恩师Julien Steenbeke 和 Mario Verslijpe 已经将训犬一学进化成极奇精密复杂的系统了 ◦ 如果有层次地将声盒配合电颈环一拼使用 , 既可提高犬只在工作中的动力和活力 , 亦能保持速度与可靠性 , 是近五年来动物训练界的一大突破 ◦
高度进化而成的奖压激励法 (Click & Nick System)
奖压激励法中的Click 是代表运用声盒 (Clicker) 时的确认信息 , 而 Nick 是表示利用电颈环闪动刺激时的信号 ◦
奖压激励法的必要条件 :
1. 正确行为可得到奖赏
2. 错误行为会带来压力
3. 在初期每当犬只受压后而服从指令 , 奖赏除了是压力消失外 , 犬儿有时还会得到额外奖励如食物 , 玩耍 , 和猎靶 等 , 是以减压
4. 每当压力发生前必有否定信号 (Aversive Marker) , 使狗只能避免受压
5. 训练员必需教导犬只 , 使其清楚明白怎样在预兆信号后逃避压力
6. 压力的运用不是训练员对犬只的情绪发泄 , 而是纪律的执行
7. 犬只有权选择顺从指令而免受压力 , 或违抗指令而不停受压 , 而且压力会续渐提高
决策权最终由训犬员操控
其实 , 我在之前讲解运用电颈环的系统中 , 已经灌入了很多奖压激励法的元素 ◦ 动物训练中最具挑战性的 , 莫过于令受训动物做到所需行为 , 而且热衷工作 , 活力十足 , 只有训练员将正与负达到平衡状态 , 才能将动物的所有潜能发挥自如 ◦