基于多智能体强化学习的乳腺癌致病基因预测

引用本文
刘健, 顾扬, 程玉虎, 王雪松.
基于多智能体强化学习的乳腺癌致病基因预测. 自动化学报, 2022,
Liu Jian, Gu Yang, Cheng Yu-Hu, Wang
Xue-Song. Prediction of breast cancer pathogenic genes based on
multi-agent reinforcement learning. Acta Automatica Sinica, 2022,
48(5): 1246−1258 doi:
10.16383/j.aas.c210583
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210583?viewType=HTML
文章简介
关键词
乳腺癌, 致病基因, 基因排序, 多智能体强化学习, 演示学习
摘
通过分析基因突变过程, 提出利用强化学习对癌症患者由正常状态至患病状态的过程进行推断, 发现导致患者死亡的关键基因突变. 首先, 将基因视为智能体, 基于乳腺癌突变数据设计多智能体强化学习环境; 其次, 为保证智能体探索到与专家策略相同的策略和满足更多智能体快速学习, 根据演示学习理论, 分别提出两种多智能体深度Q网络(Deep Q networks, DQNs): 基于行为克隆的多智能体DQN和基于预训练记忆的多智能体DQN; 最后, 根据训练得到的多智能体DQN进行基因排序, 实现致病基因预测. 实验结果表明, 提出的多智能体强化学习方法能够挖掘出与乳腺癌发生、发展过程密切相关的致病基因.
引
基因突变是由DNA分子中碱基对发生增添、缺失或替换而引起的基因结构变化. 基因突变具有随机性, 是一种可遗传的变异现象. 致病基因突变通过阻止一种或多种蛋白质正常工作扰乱正常的发育过程或导致疾病. 癌症是由控制细胞功能的基因突变引起的一系列相关疾病的统称. 导致癌症的基因突变可能遗传自父母, 也可能是人体自身受致癌环境或致癌物质刺激导致细胞分裂时产生的错误. 一般来说, 癌细胞比正常细胞有更多的基因突变. 乳腺癌是世界上最常见的疾病之一, 2018年新增乳腺癌患者约20亿人. 医学领域的多项研究表明, BRCA1、BRCA2和PALB2基因的突变会导致乳腺癌风险增加, 其他与乳腺癌患病风险相关的基因突变包括ATM、TP53、PTEN等. 因此, 从乳腺癌组学数据中挖掘出与其密切相关的致病基因对乳腺癌的临床诊断、预后和治疗有着深远意义.
在生物信息学中, 癌症致病基因预测通过基因排序方法实现. 基于网络相似度的基因排序算法通过分析多种基因-疾病网络中的局部、全局信息, 计算基因与疾病之间的相似性, 从而对基因进行排序. 例如, Kohler等提出重启随机游走算法利用网络全局拓扑信息对致病基因进行预测; Xu等提出多路径随机游走的网络嵌入模型对异构网络进行致病基因预测. 这些方法过度依赖网络拓扑信息, 不能对网络外的基因进行预测, 且对癌症数据中的噪声比较敏感. 随着机器学习理论的发展, 基于机器学习的基因排序方法利用监督学习或非监督学习方式实现基因预测, 能够挖掘到与癌症相关的致病基因, 被广泛应用于癌症致病基因的预测. 例如, Han等将图卷积网络和矩阵分解结合提出一种疾病基因关联任务框架; Natarajan等将推荐系统中的归纳矩阵补全用于预测基因与疾病的相关性.
在乳腺癌致病基因预测方面, 自然启发式算法应用较广, 例如粒子群优化(Particle swarm optimization, PSO)、遗传算法等. Sahu等提出一种基于PSO的基因选择算法, 首先采用k均值聚类方法对数据集进行聚类, 利用信噪比评分对聚类簇中的基因进行排序, 然后从每个聚类簇中收集得分最高的基因生成新的特征子集, 最后将新特征子集作为PSO的输入, 生成优化后的特征子集. Malar等通过将关联特征选择方法和改进的二进制PSO结合选择致病基因, 同时解决了微阵列数据的高维性问题. 为了消除对乳腺癌无意义的基因, AliazKovic等将遗传算法用于提取乳腺癌数据中的重要信息, 挖掘与乳腺癌生物过程相关的致病基因. Sangaiah等将特征加权和基于熵的遗传算法结合起来, 提出一种乳腺癌致病基因预测的混合方法. Alzubaidi等将遗传算法与互信息结合应用于乳腺癌致病基因选择. 通过遗传算法将基于互信息的基因选择算法转化为全局优化算法, 能够有效选择基因. 避免算法陷入局部最优. Alomari等结合最小冗余、最大关联算法和花授粉算法来确定包含更多癌症信息的基因子集. Hamim等提出一种基于决策树模型的乳腺癌致病基因选择策略, 该策略包括两个阶段: 基于Fisher评分的过滤阶段和基于C5.0算法的基因选择阶段. Liu等为了提高基因选择效率, 将基因评分与深度神经网络产生的基因重要性相结合, 同时考虑癌症亚型间的差异性和亚型内基因间的相关性来选择乳腺癌三阴性亚型的最优致病基因子集. Zhao等基于信息熵的不确定性系数被用来定义基因间是否存在逻辑关系, 进而构建基因逻辑网络, 最终通过比较对照组与实验组网络之间的差异程度, 提取乳腺癌致病基因.
上述预测方法都是基于已有癌症组学数据进行基因预测, 这些组学数据来源于对癌症患者的测序. 换言之, 这些方法仅能根据目前已发病患者的基因突变状态来分析基因与癌症之间的关联, 无法预知患者发病前的基因突变状态, 而发病前的基因突变状态与发病基因突变状态之间的差异才是癌症发生的关键.
强化学习是一类结合了优化控制思想和生命体学习行为的机器学习方法, 其要求待处理的问题环境拥有马尔可夫性质, 即当前状态仅受上一状态的影响, 与其余状态无关. 强化学习希望智能体在指定的状态能够得到让回报最大化的动作, 并通过智能体与环境的交互进行学习, 从而改变特定状态选择某个动作的趋势. 强化学习还是一种拥有自主决策能力的算法, 它使智能体通过在环境中的不断试错得到回报值和下一时刻状态的观测值, 最终学习到一个能够获取较大折扣累积回报的策略. 强化学习已被成功应用于多个研究领域, 例如, 数据驱动控制、多机协同决策、交通控制等.
本文通过分析基因突变, 发现其过程满足马尔可夫过程, 且基因突变与癌症之间的关联性可以通过强化学习中累计回报函数构建的方式进行计算. 因此, 基于乳腺癌突变数据, 本文设计一套强化学习环境与算法对患者从正常基因突变状态至死亡基因突变状态的过程进行评估、决策, 旨在为癌症致病基因预测提供新思路, 并挖掘出导致乳腺癌死亡状态的致病基因. 实验结果表明, 提出的强化学习算法能够挖掘出与乳腺癌密切相关的致病基因.
图
图
图
作者简介
刘
中国矿业大学讲师. 2018年获中国矿业大学博士学位. 主要研究方向为机器学习和生物信息学.
E-mail: liujiansqjxt@126.com
顾
中国矿业大学博士研究生. 2016年获中国矿业大学学士学位. 主要研究方向为深度强化学习.
E-mail: guyang@cumt.edu.cn
程玉虎
中国矿业大学教授. 2005年获中国科学院自动化研究所博士学位. 主要研究方向为机器学习和智能系统.
E-mail: chengyuhu@163.com
王雪松
中国矿业大学教授. 2002年获中国矿业大学博士学位. 主要研究方向为机器学习和模式识别. 本文通信作者.
E-mail: wangxuesongcumt@163.com
相关文章
[1]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210555?viewType=HTML
[2]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c201059?viewType=HTML
[3]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200045?viewType=HTML
[4]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190012?viewType=HTML
[5]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180372?viewType=HTML
[6]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200159?viewType=HTML
[7]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180759?viewType=HTML
[8]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170246?viewType=HTML
[9]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c160664?viewType=HTML
[10]
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.y000003?viewType=HTML
[11]
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.02021?viewType=HTML
[12]
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01969?viewType=HTML
[13]
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.00850?viewType=HTML
[14]
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00976?viewType=HTML
[15]
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00289?viewType=HTML
[16]
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2008.00113?viewType=HTML
[17]
http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0367?viewType=HTML
[18]
http://www.aas.net.cn/cn/article/id/16352?viewType=HTML
[19]
http://www.aas.net.cn/cn/article/id/15536?viewType=HTML
[20]
http://www.aas.net.cn/cn/article/id/16094?viewType=HTML