技术进步使临床试验数据量激增。目前高保真成像测试可以生成组织和器官的二维、三维甚至四维(第四维是时间)大图像,分子信息分析可以评估成百上千的基因和蛋白质。机器学习能对这些数据中与疾病和治疗相关的诊断特征进行自动分析。
利用深度学习从生物医学图像中提取信息是当前最活跃的研究领域之一。近期文献报道使用机器学习的计算机辅助检测(CAD)软件可以解释放射图像,其水准与医学专业人员相当。例如,基于深度学习的CAD软件能够高精度检测糖尿病视网膜病变,还能识别所有级别的浸润性和原位乳腺癌。机器学习受益于大型数据集,并且随着训练数据集的大小增长,其准确性将不断提高。
分子信息分析可以识别基因突变,并量化各种样本(包括血液、唾液和组织)的基因表达水平和蛋白质丰度。机器学习可发现与各种疾病状态相关的复杂生物标记集,提高这些数据的利用率,以达到为患者迅速确诊并制定有效治疗策略的目的。在癌症治疗中已使用血液中的DNA甲基化和核小体定位来预测肿瘤组织的起源,量化活检和其他组织样本中的细胞激活水平,利用磁共振图像预测脑癌的基因组特征,并基于多组学或影像学特征预测癌症患者的预后。除了癌症,机器学习还被用于分析血液中的mRNA来识别睡眠障碍患者,并预测睡眠不足对健康产生的负面影响。通过整合多种数据类型和生物标志物,机器学习比人工分析更准确也更全面。
未来人机联合诊断方法可能会很普遍,因为它利用了人和计算机的优势。在这种协作方法中,医生将通过整合所有可用信息(包括机器学习系统提供的信息)进行最终诊断。机器学习系统将通过自动化常规诊断、标记出需要更多人工输入的特殊病例以及提供在诊断中有用的附加信息发挥关键作用。此外,机器学习系统可以使用医学专业人员不熟悉的特征来进行诊断,当然我们需要事先评估这些特征的生物学意义。因此,综合医学专业人员和机器学习中先进算法知识的方法将能够改进诊断的效率和准确性。