科学家揭开规制基因突变隐藏的数学

标签:
it杂谈 |
科学家揭开规制基因突变隐藏的数学
2023/8/13
一个基因尽管突变来保持功能的能力显示一个与基础数学的惊人联系。

一个基因序列在它不能做它的工作之前能承受多大破坏?一个基本的数学方程式把持答案。
科学家们已经发现,来自一个 “纯” 数学分支的关键函数能预测基因突变多经常导致功能中的变化。
这些由所谓的数字和函数摆出的规则也规制蛋白质折叠、计算机编码和物理学中的某些磁状态的某些方面。
主要研究作者瓦伊哈弗莫汉提说,“我们正试图来做的是为在自然界中已经被观察到的许多这些趋势找到一个普遍的解释”
,他是哈佛医学院和麻省理工学院的理论物理学家、博士和医学博士候选。
对每个基因型------一个给定基因的DNA的字母------有一个表型或最终结果:一种新的蛋白质或甚至一个调节另一组基因的基因的案例中的行为。一个给定的基因型能在它的表型改变之前累积许多突变,这种中性突变的积累是一个进化进行的主要方式。
莫汉提说,“我们想理解对突变实际的表型多强健的?原来是强健性已经被观察到是相当高”。换句话说,构成DNA的代码的许多“字母”或碱基对能在做输出之前变化。
由于这种强健性不仅在基因学中蹦出,而且也在物理学和计算机科学等领域中,莫汉提和他的同事怀疑它的根源可能位于可能序列的基础数学中。他们将这些可能的序列想像为一个多维的叫一个超体立方体(hybercube)的立方体,在这个不可能来可视化的立方体上每一个点为一种可能的基因型。莫汉提说,有相同表型的基因型最终应该一起聚集,问题是这些集群会形成什么形状?
答案原来被在数论中找到,数论是与正整数的属性有关的数学领域。一个表型对突变的平均强健性原来是被叫一个数字和的函数定义。这意味着通过在立方体上添加代表每个基因型的数字,你能到达基因型的平均强健性。
莫汉提说,“让我们说有五种映射一个特定表型的基因型”。例如,五个字母的DNA序列,每个序列都有一个不同的突变,但它们仍然为相同的蛋白质编码。
研究人员发现,将用于代表这五个序列的数字相加给你这些基因型在它们的表型转变之前能取的平均突变数。
这导致了第二个有趣的发现:这些数字绘制出来在图表上的总和形成了一个所谓的牛奶布丁曲线,一条以一种法国甜点命名的分形曲线(看起来像一个花哨的模制布丁)。
莫汉提说,在一个分形曲线中,“如果你放大曲线它看起来刚好宛如你被缩小出去相同,你能继续无限、无限和无限的放大,它会是相同的”。
RELATED CONTENT
—The world's most beautiful equations
—Mathematicians discovered a computer problem that no one can ever solve
—DeepMind
cracks 'knot' conjecture that bedeviled mathematicians for
decades
莫汉提说,这些发现揭示了一些关于纠错的有趣秘密。例如,研究人员研究的自然系统当设置数据存储时往往与人类做的不一样的处理错误,例如在数字消息或CD或DVD上。在这些技术示例中,所有错误都被平等对待,而生物系统倾向于比其他序列来保护某些序列。
莫汉提说,这对基因序列并不奇怪,其中可能有几个关键序列,然后是其他对主要基因功能更外围的序列。
莫汉提说,了解这些中性突变的动力学最终对预防疾病可能是重要的。病毒和细菌迅速的演变,它们在这个过程中积累许多中性突变。例如,如果有一种来防止这些病原体不落在大海捞针所有谷壳中有益突变的方法,研究人员可能能够阻止病原体的来变得更传染性或对抗生素产生抗药性的能力。
研究人员于7月26日在