医学影像的目的,是用非侵入方式取得人体及其内部组织影像(如X线检查、CT、B超、胃镜肠镜、血管造影等),以实现逆问题推演。来源于不同成像技术的图像数据之间差距极大,异构明显。现阶段,医学影像数据约占所有医学数据的九成,多数医院的各种医学影像数据已激增至PB级。这种数据,除了高维度、高稀疏和海量性的特点外,还具有多态性(即时序性和非时序性共存、数字型数据和非数字型数据共存)。另外,在图像特征表达上还呈现三种复杂性:一是灰度分辨率高,普通灰度图像中的颜色特征已不再适用;二是需要计算机重建图像,这是因为CT、磁共振等的成像原理是基于人体组织的密度差异,这些都需要经过计算机重建;三是人体解剖区域的客观表达是有其特定医学涵义的。
目前,深度学习算法已能在大规模医学图像数据集中应用,提取图像中各实体之间、图像之间的相互关系以及其他模式或关系。换句话说,就是已能从图像中提取能代表区分该图像结构内容的特征向量,对这些特征向量所在的空间进行比较、分析它们之间的距离或相似关系;并通过对图像内容的分析、索引、摘要、分类和检索等操作,进一步发现感兴趣的隐藏知识。已有的应用有:皮肤癌[8]筛查、眼部疾病(如先天性白内障[9]、糖尿病眼底黄斑病变[10])或心血管疾病(如先天性心脏病、主动脉或心脏瓣膜疾病)诊断[11]等,这些由算法辨识的准确率都在90%以上。另外,谷歌的Deep Mind已经开始将更为精确、全面的3D图像(光学相干断层扫描OCT)应用到确定头颈部肿瘤放疗或开刀的范围上[12]。(www.xing528.com)
然而,机器学习算法需要有大规模的训练集和多次迭代。以在《自然》杂志上发表的皮肤癌筛查与在《美国医学会杂志》上的糖尿病眼底黄斑病变辨识为例,两者分别使用了129 450和128 175张临床图像。上述顶级论文的相继发表使得由数据驱动的人工智能领域受到追捧,根据清科集团私募通数据[13],国内投资案例已从2014年的281起激增到719起,增长155.9%;投资总额从2014年的54.87亿元上升至159.50亿元,增长190.67%。由此,工业界高度期盼医疗影像大数据共享。值得一提的是,华东地区自2011年起,已由上海申康医院发展中心推动建立区域医疗多病种影像特征库工作[14];而京津冀三地的卫生计生委已于2017年1月正式实施医疗机构医学影像检查资料共享试点工作,首批试行的医疗机构共102家。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。