机器学习最有前途的应用领域之一是精准医学,即患者接受针对其个人疾病特征的治疗和护理。比如精准肿瘤医学的目标是根据肿瘤分子特征来制定癌症治疗方案,它是体现机器学习优势的一个典型例子。在目前的临床实践中,个体的分子标记,如体细胞突变和基因表达水平,经常成为选择治疗方案的依据。然而,由于其他基因组和表观组位点上的差异,每个患者的反应往往大相径庭。精准肿瘤医学更复杂的问题在于存在有数百种潜在药物,但并非每种药物的组合都能检测出所有疾病特征。
机器学习得以攻克此难关是通过开发对个体差异具有鲁棒性的多因素预测模型。例如,机器学习中的单用途模型可预测生物学变化带来的功能性后果,例如基因突变如何影响剪接和基因表达以及转录因子结合。机器学习模型还可以预测癌细胞系的药物反应,将预测结论从细胞系延伸到肿瘤,并根据临床反应数据预测患者对治疗的反应。未来精准治疗建模将可能满足多尺度多目的需求。多尺度建模将使用大型生物数据集来研究生物体在不同时空域的生长和发育,比如目前已建立的计算模型可以研究人类病毒的相互作用、细胞-细胞相互作用、肿瘤-免疫细胞相互作用,甚至整个细胞。
虽然当多尺度模型足够精准时其预测可直接用于治疗,但精准度欠缺时机器学习也能生成一个治疗方案的排名列表,供受过专业培训的医生参考以便做出最终决策。这种混合策略有许多优点,比如机器学习可以显著减少需要考虑的治疗组合方案,并识别一些人工分析容易忽略的治疗组合。我们还可以添加一个实验验证步骤,以便证明所选治疗方案的有效性。
人们还通过机器学习对已出版的文献和患者数据库进行自动挖掘。早期使用自然语言挖掘文献信息、近期的研究已经使用EHRs结构化信息来预测疾病的发生。