标签:
数学思想儿童少年教育趣味数学学习公社教育 |
妞妞刚开始学习英语的时候,总会自己创造一些稀奇古怪的词汇。爸爸管这些叫“恐龙语”,因为这有些像她的电动小恐龙的嘶叫。这种稀奇古怪的语言只有爸爸听得懂,所以这也就成了爸爸和妞妞之间说秘密的专用语言了。爸爸决定给妞妞讲讲密码的学问,算是今天的趣味数学的话题。
“妞妞,你知道什么是密码吗?”爸爸问。
“密码就是用别人不知道的词语代替别人知道的,这样的话就只有两个人能听得懂,也就保密了。这太简单了。”妞妞一边想一边回答说。
“说的有道理,密码是一门非常有用的学科,涉及到大量的数学知识,比如数论、概率与统计、代数与抽象代数等等。爸爸还是先给妞妞讲一个密码的故事吧!”一听说有故事,妞妞的眼睛就发亮。“上个世纪三四十年代发生的第二次世界大战,是盟国包括美国、苏联、中国、英国、法国等对阵德国、意大利、日本组成的轴心国,世界大战是人类历史上的巨大悲剧,造成了数千万计的人类死亡。战争期间,隐藏在英国的德国纳粹特工非常厉害。他们刺探盟军机密军以事情报后,会将这些情报用各种方式传递给他们隐藏在中立国的负责人,由他们通过秘密电台发回德国。
他们传递情报的手段千奇百怪,比如肉眼看不见字的隐形的墨水,乐谱活页夹层、加厚明信片中间极薄的纸片,写成国际象棋棋谱的情报,普通信函中每一个单词第一个字母组成情报等等。
有一次,盟军的检查员截获了一张服装设计图纸,非常怀疑里面藏有机密情报,可是有无论如何都找不到情报在哪里。
这张设计草图上上面有3位年轻美丽的模特,她们穿着时髦的服装。表面上看起来,设计草图很寻常,一点问题都没有,也没有夹层,没有特别的文字。然而就是这张看似“清白”的图纸,包含着重大的军事情报。
当时的英国情报机构,就是后来的‘007’所在的机构中一位经验丰富的特工发现了端倪。三位模特衣服上的长短条纹,联系起来看似乎就是某种密码。英国安全局迅速破译这些密码,‘大批敌方援军随时可能到来’,从这张设计图纸上密码破译员们读出了这样的信息。原来纳粹特工利用莫尔斯电码的点和长横等符号作为密码,把这些密码做成装饰图案,藏在图上诸如模特的长裙、外套和帽子等图案中。”
“莫尔斯电码是什么呀?”妞妞问道,心里非常惊讶特工隐藏文件的方式,自己连钱包还会丢,太不好意思了。
“就是美国人莫尔斯发明的一种普遍使用的电报编码方法。这个方法由点(.)、划(-)两种符号组成。其中点为基本信号单位,每一划的时间长度相当于3点。在一个字母或数字内,各点、各划之间的间隔应为两个点的长度。字母(数字)与字母(数字)之间的间隔为7个点的长度。
代表每个字母的莫尔斯电码是这样的。”爸爸在纸上写下如下的文字:
A .-B -...C -.-.D -..E .F ..-.G --.H ....I ..J .---K -.-L .-..M --N -.O ---P .--.Q --.-R .-.S ...T -U ..-V ...-
W .--X -..-Y -.--Z --..1 .----2 ..---3 ...--4 ....-5 .....6 -....7 --...8 ---..9 ----.0 -----? ..--../ -..-.() -.--.-
“实际上我们可以使用除无线电之外的许多方法传递莫尔斯电码,比如灯泡、手电的开关,手动拍击物体,画上线条的长短等等,而且它简单易记,所以特别受欢迎,以至于连间谍都使用。”
“这是什么东东呀?看上去好古怪!可是要是谁都知道的不就不是密码了吗?”妞妞开始反问。
“对,确实如此。不过要说密码就得先说编码,莫尔斯码是一种公开的英文字母编码,我们汉字也自己的编码。早的时候长途电话不普及,远距离的通信就会用到无线电报。发电报的时候,先把需要发送的文字写好,按每个汉字多少钱一起交给电报员。电报员先在一个电码本上查找每一个字相应的四位码,变成一段全是数码的文字,再通过无线电发出去。收到的地方再根据同样的一本电码本,反找出相应的文字,写在电报纸上,送到指定接收的人手里。”
“这么麻烦!发条短信不就好了吗?我春节的时候还给湖南姑姑发了短信呢!”妞妞觉得那时候的人太可怜了。
爸爸听了妞妞的回答觉得很有趣,确实对她们而言通信落后是难以理解的。“妞妞说的对,短信和电报非常相像,不过编码和解码的工作不再由人来做,而是由我们手机里面的程序自动来做了。”
“哦,汉字的电码是什么样的呢?”妞妞还是好奇地问。
“比如爸爸的名字谢永红,电码分别是 6200 3057 4767,每个四位的数字代表一个汉字。”爸爸心里想要不是美国使馆签证要这几个电报码,恐怕爸爸找到电报码的样子是不太可能的,现在还有电报业务吗?“如果我们先把汉字变成用汉语拼音,然后再编码,那和英文字母的编码就更加相像了。”
“四位数字可以代表1万个汉字!”妞妞的反应总是很快。
“妞妞算得很对,电报一般都简短,因为是按字收费的,爸爸记得每个字收一角四分钱,一个十个字的电报就要一块多钱,这对于当时的普通人月收入才36元来说是很昂贵的,所以一般不会有复杂的文字。常见的电报的样式是‘母病速归’这类的。但是电报码并不是密码,因为我们可以很容易就获得编码本,而且他本身也是作为民用的公开标准码。我们说的密码是秘密的编码方式,只有说的和他愿意让听的知道这个秘密。”
“就像我们的‘恐龙语’吗?”妞妞的眼睛里放出亮光。
“对呀!这种密码是最基本的密码,因为同样的字对应的密码是一样的,人们根据字出现的频率就能倒过来推断出这个密码代表的到底是什么字。”
“这又怎么推断呢?”妞妞嘟嘟囔囔地说。
“这样吧,我们还是以英语的26个字母为例好不好,中文文字的原理是一样的,不过更加复杂。”爸爸希望能把问题说得简单明了一些,“因为自然英语语言中每一个字母出现的概率不是一样的,甚至相差很远,比如e是英语中最常用的字母,其出现频率为八分之一。在密码中他们出现的频率与我们日常语言中出现的频率是完全一致的,所以我们完全可以肯定密码中出现最多的一定是代表e。如果密码破译者能根据频率数破译出9个最常用的字母e,t,a,o,n,i,r,s和h,他就可解密70%的密码。这是最古老的破密手段,但到今天依旧是许多破密系统的基础。”爸爸看着妞妞,希望妞妞不至于被搞糊涂。
妞妞不说话,静静地听爸爸讲话。“根据这个道理,我们还可以分析英文单词和单词中的字母组合,从它们出现的频率来推断密码的原文。例如,据统计英语一半以上的单词是以t,a,o,s或w开头的,仅10个单词(the,of,and,to,a,in,that,it,is和I)就构成标准英语文章四分之一以上的篇幅,我们可以按相应的出现频率解密相应的单词。同时英语中相连出现的两个字母th,he,in,er,an,re,ed,on,es,st,en,at,to,nt,ha,nd,ou,ea,ng,as,or,ti,is,et,it,ar等,以及三字母the,ing,and,her,ent等都可以进行相应的频率分析。”
“中文密码就是分析中文字和词的频率,对吗?”妞妞看来是理解了。
“对,不过中文的字太多,说起来很麻烦,它和英文字母和单词的原理是完全一样的。不过我们的中文文字频率表要厚的多。”
“爸爸,我明天会给你写一封密码信,看你能不能够破译,怎么样?”妞妞总是希望能让爸爸为难,不过这个愿望到现在为止还没有实现过。
“好,爸爸一定努力破密!”