斯坦福吴恩达团队公布最大医学影像数据集,4万张为人体上肢端的X光片

作者:动脉网 2018-01-19 15:31

{{detail.short_name}} {{detail.main_page}}

{{detail.description}} {{detail.round_name}} {{detail.state_name}}

{{detail.province}}-{{detail.city}}
{{detail.setup_time}}
融资金额:{{detail.latest_event_amount}}{{detail.latest_amount_unit}}
投资方: · {{item.latest_event_tzf_name}}
企业数据由提供支持
查看

作者:Jackie Snow

Root 编译自 MIT Technology Review

内容来源:量子位

原文和图片来源链接:https://arxiv.org/pdf/1712.06957.pdf


据报道,全球现在超过17亿人的肌肉骨骼都出毛病,每年大概有3千万的急诊病例,而且这个数字还在往上走。骨骼方面的问题已经成为了最常见的慢性重症。


为了加快X光片的诊断速度,近日,动脉网获悉,斯坦福吴恩达领头的研究团队开源了含有4万张人体上肢端的X光片的数据集MURA,并用这个数据集训练CNN寻找并定位X光片的异常部分。


最后训练的结果,是该模型在手指和手腕X光片中的诊断表现比放射科医生要好些。


QQ图片20180119151932.png

经过MURA训练的模型可以准确定位出手腕和手指的异常部位 


不过放射医生依然能比模型更准确地诊断出手肘、前臂、手、上臂及肩膀的异常。


}P}E68_Q]3{~UWY9K4X6DZE.png

图中绿色字体表示表现最优,红色字体代表表现最差。模型对手指、手腕的诊断效果要比三位放射医生的效果都要好。手肘和前臂的诊断结果比人类都差。 


该神经网络含有169层。当输入多角度的上肢X光片时,模型就可以预测出异常的概率。


QQ图片20180119152139.png

模型预测X光片异常的工作流 


作为最大的医学影像数据集,MURA所含的4万张图都是由放射科医生一张张标注的。

XOS{}4YKGA{5_QMYR{BI)2I.png

人工标注的4万张X光片。左上,正常的手肘;右上,骨折的上臂;左下,骨骼退化的指端;右下,打了钢板和钢钉的尺骨和桡骨。 


这四万张图来自近15000份研究报告,其中9067篇为正常上肢骨骼肌X光片的研究,5915篇是异常研究。上肢包括肩膀、肱部、手肘、前臂、手腕、手、指端。


QQ图片20180119152350.png


现在,越来越多的数据集涌现出来,给深度学习提供了非常好的条件。AI算法在图像识别上能逐步超越人类很大程度上得益于这些数据集的开源。下面列举一些目前在医学影像数据集供大家参考。

QQ图片20180119152444.png

MURA目前是最大的开源医学放射图像数据集。第二大的数据集是Pediatric Bone,含有14236张图,可以根据手的X光片测出人的骨龄;0.E.1是关于膝关节的数据集,可用来查出膝关节炎。 


不过,依照目前AI发展的速度来看,医学院应该停止培养放射专业的学生了。多伦多大学计算机系教授Geoffrey Hinton在接受纽约客采访时认为。


数据集要等到2月才会公布,可以持续关注Stanford ML
https://stanfordmlgroup.github.io/projects/mura/


如果您想对接动脉网所报道的企业,请填写表单,我们的工作人员将尽快为您服务。


注:文中如果涉及企业数据,均由受访者向分析师提供并确认。如果您有资源对接,联系报道项目,可以点击链接填写基本信息,我们将尽快与您联系。

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

分享

微信扫描二维码分享文章

企业
对接
商务
合作
用户
反馈