
正面奖赏与确认训练法:
为什么要训练犬只?
人类对动物的训练其实已经有很长的历史◦只要有动物工作或作为伙伴的地方就通常介入训练的元素◦动物种类由家畜中的犬只,马匹,驴子,耕牛,骆驼,到半驯化的大象,鹦鹉,甚至全野生的海豚,猎鹰等,都是人类的训练对像之一◦训练动物的原因和要求有很多,但总是离不开下列三大主要元素:
1. 提高动物的合作性与服从性
2. 提供对动物精神上有利的刺激
3. 维持动物生理上的健康
其他训练因素包括在动物行为,心理,遗传学上的实验,研究,和观察等◦
训练动物的系统和方法多不胜数,这篇文章是我特别为了提倡确认训练法而写的◦确认训练法是我训练温驯稚气的家庭犬,和培育凶猛刚烈的护卫赛犬时其中一个重要学习程序◦ 动物训练中的灵魂不能够在笔墨上一一细致地表达,训练员必须在与犬只沟通中及自我反省时领略其意◦希望大家在阅读此文后能在训练时得到启发◦更希望几位在香港采用此法的训犬师能指导有兴趣的初学朋友◦由于香港在训练动物上的书籍不多◦所以我会利用一些英语的专有名词,方便各位在网上参考◦部分读者可能会对这些专有名词比较陌生,但不用太在意,只要明白训练系统的过中道理便可◦
什么是正面奖赏?
正面奖赏(Positive Reinforcement)是动物训练方法中的一种◦简单来说,正面奖赏的原则是对动物解释到“你做对了我要求的工作,就可以得到你喜欢的奖赏◦”奖品可以是食物,猎靶,玩耍,抚摸,或称赞等◦
传统正面奖赏的例子
你要教狗儿坐下,可以用右手持食物让饥饿的狗儿嗅过,经过一会儿,当他只能嗅到食物的气味而不能吃到食物时,他大有可能会作出不同的反应和行为◦你亦同时可以用持着食物的右手去吸引犬儿头部和身体的动作◦当你提高右手时,犬儿可能会自然地举头向上而臀部坐下◦你把握时机,当他坐下的一瞬间,你说“SIT”同时立即给他食物,完成整个过程◦训练员时间性的掌握和手,口,眼的配合是成功最重要的条件◦如是者经过多次重复练习,你的狗儿开始明白到“SIT”,坐下,和食物的关系◦
我说犬儿开始明白到“SIT”,坐下,和食物的关系,而不是说犬儿已经懂得“SIT”的口令是因为这时犬儿只是知到在指定情况下(当你提高持有食物的手,在没有分散注意事物的环境中),听到“SIT”时有可能会坐下◦这与真正懂得“SIT”的口令有极大的分别◦如果真正懂得“SIT”,犬儿在训练员任何日常情况中一声“SIT”后会立即笔直地坐下,训练员无需任何身体语言和动作来暗示犬只,这才是真正口令的理解◦
那怎样才能教晓犬只真正对口令的理解呢?
家犬互相沟通的方法与其祖先狼一样,主要依赖嗅觉(气 味)与视觉(身体语言)◦虽然听觉(声音)亦是犬只其中一项重要的沟通桥梁,但犬只的吠,哮,哨,叫,与呜声跟人类复杂多变的语言截然不同◦所以当犬儿与人类沟通时,因为不懂得我们说什么,绝大部分时间都是集中探索我们的体味和观察我们的行为◦一些我们自己平常没有留意到的小动作,都完全落入我们的犬只眼内◦如此,若要把犬儿训练得在全无训练员身体动作提示下,只需一声口令就同时完成指定工作,我们必需训练犬儿习惯专注听从口令, 而不理会我们的小动作◦
确认信号的重要性
确认信号(Marker Signal)的运用已经不是什么新奇的发明,但能真正掌握这工具而发挥自如的训犬师又不多◦所谓确认信号,是指任何可以确定行为的标记,包含声音,影像,触摸,气味等◦其实我们平时最常听到犬主用的“Good Boy”,就是确认信号的一个举例◦但是既然几乎每个犬主都对犬儿说“Good Boy”,为什么他们不是每个都能成功训练犬只呢?
首先,我们必须了解确认信号的必要条件:
1. 一贯
2. 简短
3. 快速
4. 清晰
5. 连接于犬只的生理需要(食物,猎靶,玩耍,,温暖等)
6. 仅限于奖赏正确行为的信息
确认信号必须一贯,简短,快速, 和清晰◦初学训犬的朋友可能未必察觉到,实在“Good Boy”两字既不简短又不快速,而且因训犬员当时的心情,令声调,语气,和音节都未能达到一贯和清晰◦要明确地用此两字作为确认信号,对初学者实在不容易◦但是最大问题还并非在于“Good Boy”,而是训犬员根本就未曾将“Good Boy”与犬只的生理需要连接在一起,而且大多数犬主在平常与犬儿沟通和玩耍时又经常滥用“Good Boy”,令本来用作确认信号的两字早已失去其独特价值◦
因此,若要在训练犬只时事半功倍,减低时间和加速进展,在进行正面奖赏时必用有效的确认信号,并必须在一开始时就把确认信号与犬只的生理需要连接在一起, 限于奖赏正确行为的信息◦
可能一些读者阅读到这儿开始感到有多少混乱◦何谓把确认信号与犬只的生理需要连接在一?首先,我们暂时不谈这个, 让我先用日常生活作一举例◦
金钱的重要性相信大家都同意◦我们利用金钱可以替换的物质多的是,生活必须品例如食物, 水源 , 衣服 , 和房屋等 , 也能够用金钱换来 ◦ 金钱不能当饭吃或当水喝 , 但是一谈到金钱 , 我们便不自觉地联想起它可以带来的生活方式, 社会地位 , 和物质享受等 ◦ 再言归正传 , 其实动物的确认信号就相等于我们的金钱 , 因为我们从小就接受了金钱的地位◦ 对有些人来说 , 金钱比任何事物更重要 ◦ 而动物的基本生理需要与我们的几乎一样 , 都是食物 , 水源 , 和粞息之所等 ◦
确认训练法
正面奖赏中最具突破性的确认训练法(Marker Training) 或声盒训练法(Clicker Training)的概念是源自美国心理学家Burrhus Frederic Skinner 的推断学习法(Operant Conditioning) ,再由美国科学家 Keller Breland , Marian Breland Bailey , Bob Bailey 与 Karen Pryor 在六十年代发展出来 ◦ 确认训练法初期流行于训练海兽, 训练员用哨子作为确认信号, 以鲜鱼作奖赏 ◦ 直至九十年代各界犬只训练师开始领悟确认训练法的独特优势,都纷纷采用确认信号 ◦
正面奖赏与确认训练法2:
既然确认信号是这样有用的工具, 那怎样运用呢?
1. 首先 , 我们需要挑选一个清晰, 快速 , 简短 , 和一贯的特殊信号 ◦ 在九十年代初 , 支持以确认信号进行正面奖赏的训犬师开始流行一种叫声盒(Clicker) 的工具◦ 声盒 , 是一个约两吋长, 一吋阔的塑胶小盒 , 内藏有弹性的金属片 ◦ 当训练员用手指按下时会发出清脆的“卡喇” 一声 ◦ 声音清晰 , 快速 , 简短 , 和一贯 ◦ 完全乎合确认信号的要求 ◦
2. 把确认信号与犬只的生理需要(食物) 连接在一起 ◦ 食物的大小在乎犬只 ◦ 食物的选择必须是犬儿强烈偏好 , 柔软 , 和易于吞食的诱饵 , 是以维持犬儿的动力和节省训练的速度 ◦ 对一只二十公斤的中型犬可以用大约一吋乘一吋的切片香肠作为奖赏 , 不可过大 , 否则犬儿吃饱便失去动力 ◦ 把确认信号和食物连接的程序十分简单 , 在狗儿饥饿时 , 掏出声盒和香肠 , 先按声盒发出“卡喇” 一声 , 然后立即给狗儿食物奖赏 ◦ 每堂 做八至十次 , 每次练至犬儿最兴奋时停止 , 每天可以做二至三次 ◦ 经过两 , 三天后 , 你会发现当声盒发出“卡喇” 一声时 , 犬儿会突然精神为之一振 , 可能全神贯注地望着你, 或双耳向前跳动 , 作出十分期待的表情 ◦ 这表示你已经将确认信号与食物以条件反射的方式(Classical Conditioning) 连接在一起 ◦ 从这一刻起 , 声盒发出的“卡喇”一声就代表食物, 这是游戏开始的时候◦
3. 其实 , 当你将声盒与食物连接在一起时 , 在这儿已经酝酿着一个奇妙的副作用 。由于你在这过程中不说话 , 亦不发出任何身体语言, 犬只会特别留意自已的身体动作 , 猜测怎样能使你按下声盒发出“卡 喇” 之声 , 令他得到奖赏 ◦ 而这个注意力如果经过巧妙的运用 , 将会成为你与犬儿沟通的重要桥梁 ◦ 因为在狗只专注地留意自己的举动时,你可以利用这个主动的心理来操纵其行为 ◦ 例如 , 你想犬儿坐下 , 你先要用声盒捕捉犬儿任何与坐下有关连的动作 , 如臀部向下蹲 , 抬高头 , 腿向后移等 , 只要犬儿有所行动, 你就按动声盒“卡 喇” 一声 , 然后立即给他食物奖赏 , 每次都逐渐地提高要求 ◦ 这过程叫作塑造 (Shaping) ◦ 声盒就像照相机一般能够捕捉犬只在一瞬间表现的行为, 使训练员能准确地令犬只知到哪一个动作能够获得奖赏 ◦ 经过若干确认后 , 犬只的行为会倾向和坐下有关连的动作 , 甚至可能真正地坐下 ◦ 如果在训练中突然得到突破 , 训练员必须在立即按动声盒后给狗儿特多奖赏 , 由平常的一片肠增加突然的六至八片 , 然后 停止当天的训练 , 令犬儿深刻地记得成功的经历 ◦
4. 如事者经过数天训练 , 犬儿会坐得越来越快 , 而且越来越频繁密 ◦ 你仍然在这过程中不说话 , 不发出任何身体语言 , 只是每次犬儿坐下时按下声盒 , 然后给予奖赏 , 有时候延迟给予奖赏的时间 ◦ 要求必须渐进式地提高 , 例如将犬儿坐下的时间延长 , 或改变训练场地, 或增加分散注意的事物 ◦ 训练员必须在训练前预先部处所有能够掌握的因素如环境, 噪音 , 其他犬只等 ◦ 如果到户外训练 , 更必须戴上狗带 , 防止狗儿任何不守纪律的行为 , 但这时候狗带只是用于限制犬儿的活动范围 , 使他不能逃走或分散注意力 ◦ 当犬儿进展至能在任何日常情况都会自动坐下时 , 你就可以开始将指令与行为连接 , 即是在犬儿自动坐下的一刻说“SIT” ◦ 大家是否留意到这方法和传统的模型训练(Modeling) 是完全相反的呢 ? 传统的模型训练是先由领犬员说 “SIT” , 然后用手按下狗儿臀部, 再给予确认信号 “Good Boy” ◦ 这方法当然有其好处 , 但是被训练的动物就从来没有自我思考和启发的得益 , 因为他就如木偶一般 , 只是被牵引着 , 心理上处于被动状态 , 未能得到对精神上有利刺激的优点 ◦ 其实犬只心理处于主动状态最重要的优势还不只这个 , 最重要的是这种通过确认信息和食物与犬只沟通的训练方法完乎合狼群的阶级语言 ◦ 具体来说 , 领袖级的狼向次级的狼沟通时是镇定沈着的, 而次级的狼为了表示对首领的尊敬 , 在被动状态时通常会压低自己身体姿势或反转肚子向上 , 而主表 示顺从时就是像训练时一样 , 精力充沛地展露着各种不同动作与行为 , 摇头摆尾 , 是以讨好首领 ◦ 这瞬间训犬员给予确认信号时 , 除了确认犬儿的动作 , 还确认了这时候犬儿主动顺从的心理 ◦ 当训犬员用手给予犬儿食物报酬时 , 更加明显地表达出训练员掌握了食物的分配权 , 再次加强了首领的地位 ◦
5. 这种倚靠动物主动显示各种行为的训练方法叫作流 览 确 认 (Scanning) ◦ 流览确认是确认训练法中最具挑战性的一派 , 因为训练员必须对时间性的控制瞭如指掌 , 并且从累积的经验中能够预料到动物将会发出的行为, 需要强烈的触觉与观察力 , 才能发挥自如 。 确认训练法的应用中还有目标确认 (Targeting) , 非常适合初学者使用 ◦ 所谓目标确认 , 是指当被训练的动物用身体某部分碰到指定目标时 , 就可得到训练员的确认信号而获得奖赏 ◦ 听来没什么特别 , 其实这个最平凡的概念 , 是近四十年来动物训练界其中一个最惊人的突破 ◦ 大部分海兽训练员就是全凭这个概念 , 训练海豚及海狮进行各种极奇复杂和高难度动作 ◦ 这方法能够实践在犬只训练的地方极多 , 例如 , 我们可以利用目标确认 , 教导犬儿以鼻子跟随一根小棒作为目标 , 只要他每次用鼻子碰到指挥棒时 ,我们按动声盒 , 给予奖赏 。 如果我们要犬儿随左则前进 , 只要拿着指挥棒在左则 , 犬儿鼻子碰到指挥棒 , 按动声盒 , 奖赏 ◦ 如果我们要犬儿伏下 , 只要拿着指挥棒敲动地面 , 小狗跟随目标 , 声盒 , 奖赏 ◦ 读者请用心发挥你的想像力 ◦ 若我们能善用目标确认 , 凭着这个概念 , 不是可以发展出无数动作吗 ? The Sky Is The Only Limit!

