加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Hebb的突触学习定律

(2013-04-20 05:31:40)
标签:

donaldoldinghebb

突触

神经网络

记忆

文化

分类: 分子生物学专业

    Hebb定律,又名赫步定律,Hebb是在1949年提出了突触学习的模型,这个模型被称为“Hebb定律”。

    赫布(Donald Olding Hebb,1904-1985)是加拿大著名生理心理学家。在1949年出版的《行为的组织》中,赫布提出了其神经心理学理论。
    他提出细胞联合理论,来解释知觉及在大量脑组织损伤条件下仍能保持一定智力水平的现象。
    他强调早期经验对智力发展的重要性,以及正常环境刺激是保持心理健康的重要因素。
    1960年当选为美国心理学会主席,1961年获美国心理学会颁发的杰出科学贡献奖,1979年当选为国家科学院院士。
    赫布认为神经网络的学习过程最终是发生在神经元之间的突触部位,突触的联结强度随着突触前后神经元的活动而变化,变化的量与两个神经元的活性之和成正比。
Hebb的突触学习定律

Hebb的突触学习定律

    Hebb学习规则是一个无监督学习规则,这种学习的结果是使网络能够提取训练集的统计特性,从而把输入信息按照它们的相似性程度划分为若干类。这一点与人类观察和认识世界的过程非常吻合,人类观察和认识世界在相当程度上就是在根据事物的统计特征进行分类。
    所謂的赫布(有的称海扁)學習法,就是說如果兩個神經元常常同時產生動作電位,或是說同時激動 (fire),這兩個神經元之間的連結就會變強,反之則變弱。根據這個學習法,神經元之間的連結,就根據神經元本身的活動 (firing activities),自行調整連結的強弱,連結的強弱,又回來影響往後神經元接收刺激之後產生的反應,表現在行為上,就產生一種學習的效果。如果舉個例子來說,譬如說「臥冰求鯉」是神經元A,「打雷」是神經元B。臥冰求鯉,和打雷如果常常發生,我們就會把這兩件事情歸類成有某種關聯,即使我們還不知道兩者是甚麼樣子的關聯。
    Hebb突触强化过程示意图
1、与靶神经元连接强壮的神经元的激活,可以使得靶神经元激活。
2、与靶神经元连接微弱的神经元的激活,不能使得靶神经元激活。
3、两个输入神经元同步激活,可以使得靶神经元激活。
4、持续进行同步训练,当靶神经元激活的时候会强化所有使其激活的突触连接强度。
5、原来输入微弱的神经元,经过训练,连接在靶神经元上的突触变的强壮,也可以单独使靶神经元激活。
Hebb的突触学习定律

    请注意图中突触的大小变化!
    由赫布提出的Hebb学习规则为神经网络的学习算法奠定了基础,在此基础上,人们提出了各种学习规则和算法,以适应不同网络模型的需要。有效的学习算法,使得神经网络能够通过联结权重的调整,构造客观世界的内在表征。
    受巴甫洛夫著名的狗实验的启发,Hebb的理论认为,在同一时间被激发的神经元间的联系会被强化。比如,铃声响时一个神经元被激发,在同一时间食物的出现会激发附近的另一个神经元,那么这两个神经元间的联系就会强化,形成一个细胞回路,记住这两个事物之间存在着联系。
    不是所有输入信号都能激发神经细胞产生自己的信号。神经元就像个微处理芯片,它通过突触接收大量的信号。并且不断地把从突触接收到的输入信号进行整合。但不同的是,微处理器有许多输出途径,神经元则只有一个,就是它的轴突。所以,神经元对输入信号的反应方式只有一个:要么通过轴突激发一个冲动,向回路中相邻的一个神经元发出信号,要么相反,不发出信号。
     
    10 billion neurons in human brain,billion synapses in human brain10,000 synapses per neuron。
Hebb的突触学习定律

    当神经元接收这样一个信号时,它的树突上的跨膜电位差轻微地升高,这种膜电位的局部改变被称为神经元突触的"激发"。当突触快速、高频地激发,就会发生一过性强化,即在短时记忆形成过程中观察到的变化。
    但是通常单个突触短暂地激发不足以使一个神经元发放冲动,即术语称的动作电位。当神经元的许多突触一起激发,共同的作用下就会改变神经元膜电位,产生动作电位,把信号传递到回路中的另一个神经元。
    Hebb认为,就像管弦乐队的一个不合拍的演奏者一样,如果神经元上的一个突触不能和其他的突触同步激发,就会被当作蹩脚的角色剔除。但是那些同步激发的突触(其强度足以使神经元发放动作电位)就会被强化。这样一来,大脑根据神经冲动流的方向,发展神经回路,逐步精化和完善,建立起大脑神经元间的网络联系。
    从Hebb的理论出发分析该过程的确切机制,你会再次面对这样的问题,即在大脑铺设网络联系过程中,能强化或减弱突触联系的酶和蛋白,必定是由某种特定的基因合成的,所以我们就开始寻找能激活这种基因的信号分子。
    因为大脑中,神经系统中的信号表现为神经冲动的活动,所以Hebb提出了一个假设,冲动发放必定能打开或关闭神经细胞中特定的基因。为验证这个假设,Hebb和实验室的博士后学者 Kouichi Itoh进行了下面的实验:取出胎儿小鼠的神经元进行体外细胞培养,在培养皿中以电极刺激神经细胞。以不同形式剌激使之发放动作电位,然后检测时形成神经回路或者适应环境有重要作用的基因所转录的mRNA总量,结果证明我们的假设是正确的。我们只需通过选择电生理刺激器上适宜的刺激频率就能打开或关闭特定的基因,就像你选择特定的频率收听某个无线电台的广播一样简单。

    1973年Bliss和Lomo第一次阐述了在哺乳动物的脑中存在的长时程增强机制(LTP:Long-Term Potentiation)。

    这些发现十分重要,它们奠定了在神经生物学分子层次上研究学习的基础。在神经生物学中,学习定义为人或动物通过神经系统接受外界环境信息而影响自身行为的过程,学习在脑中分子层次发生的过程,是神经元突触处连接的变化。

    在hebb的实验中,被试者在被隔离12、24、48小时后,被要求做简单算术、字谜游戏和组词等测试.结果发现,被隔离的时间越长,测试的成绩越差。有的被试者变得很难集中注意力,并容易激动,还有对刺激过敏、紧张焦虑、情绪不稳、思维迟钝等症状。奇怪的是,有的还出现了错觉和幻觉。仪器显示出他们的脑电波比隔离前明显减慢。隔离时间如果过长,有些人会无法忍受,要求中途退出实验。

  这个实验达到极端会是怎样呢?德国法西斯曾经做过这样的实验:他们把两个犯人各自关在一间房子里,与外界完全隔绝。经过较长的时间,一个人发疯了;另一个人自己和自己下棋,被放出来时成了一流棋手。

  这些实验告诉我们,人如果不能持续地从外界获得刺激,身心就会变得不正常。这个定律叫做“感觉剥夺定律”。

    广义的突触可塑性包括突触传递可塑性、突触发育可塑性和突触形态的可塑性,一般如未作特殊说明,即指突触传递可塑性,突触可塑性是神经科学领域近年来进展最快、取得成果最大的研究领域。其主要表现形式-长时程增强(LTP)和长时程抑制(LTD)现象已被公认为是学习记忆活动的细胞水平的生物学基础。随着有关研究的深入,现已发现突触传递的可塑性除了与学习记忆功能关系密切外,还参与了感觉、心血管调节等其他重要的生理或病理过程。 

  神经元具有活动依赖性的可塑性变化。突触传递的可塑性指突触前神经元的反复活动,导致突触传递效能产生的改变。其中在给予强直刺激的条件下,有突触后电位增大的长时程增强和突触后电位减少的长时程抑制。突触前细胞的重复刺激可以增加突触效应并使突触后兴奋。

    突触可塑性(Synaptic plasticity):在神经系统科学中,突触可塑性是指神经细胞间的连接,即突触,其连接强度可调节的特性。突触可塑性的产生有多种原因,例如:突触中释放的神经传递体数量的变化,细胞对神经传递体的反应效率。突触可塑性被认为是构成记忆和学习的重要神经化学基础。

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有