大数据应用?先处理数据获取再说

今年3月 底,上海市第一妇婴保健院院长段涛在他的个人微信订阅号“段涛大夫” 里面,发布了一篇院长日记《令人失望的互联网创新》。上面那段话是这篇文章的结尾,也是段涛提出的一个挑战,希望那些有创新基因的公司能够完成这个挑战。
当 AlphaGo 大放异彩时,人工智能确实带给各个领域太多想象空间。尤其是在医疗领域,当 Watson 机器人在疾病诊断领域的能力已经可以媲美普通医生,它也许值得人们付出更多的金钱、精力以及激情去做更多探索。
故事.版本一
医疗人工智能的基础,是医疗大数据的挖掘和应用。有关医疗大数据,这是这几年互联网医疗领域流传最广的故事。虽然每一家创业公司的模式千差万别,但无一例外都会有一条:对大数据的挖掘和应用,虽然关于如何实现的部分往往语焉不详。这充分反映了两个问题:所有人都意识到了医疗大数据开发的价值,但开发的路径却难度很高。
于是,我们听到的第一代医疗大数据的故事就变成了以下这个样子:
①有关数据来源
中国互联网医疗可以说是白手起家,至今为止仍然不受传统医疗体系待见。所以,早期的医疗大数据基本上都只能来自互联网医疗公司自身的积累。这里的 “早期” 既指时间上的早期,又包括开发思路上的早期。那么,早期的数据来源大概有这么几类(欢迎补充):
在线咨询类公司——这类公司既有综合型的,又有垂直型的。数据积累的方式上主要是通过医患在线问诊的方式,建立患者个人的电子健康档案;
智能硬件类公司——纯粹的智能硬件在医疗领域的应用日渐式微,但越来越多的医疗服务开始结合智能硬件,比如血糖、血压、体温、心律等,数据积累方式主要是对用户体征数据的检测;
基因检测类公司——基因检测在近两年日 趋火爆,主要是受到检测成本降低和精准医疗的推动,门槛大大降低,使得越来越多的普通用户能够消费基因检测。
科研工具类公司——虽然与医患资源类公司一样是收集患者的疾病数据,但科研类公司收集数据的形式、应用明显不同,科研机构在数据积累过程中发挥了主导作用。
②有关数据应用
在医疗大数据版本一的故事里面,之所以是早期,主要是还是因为开发利用方式的早期。在这个阶段,虽然关于医疗大数据、人工智能已经有了概念,但在此时能接受这样故事的人毕竟还太少,也太遥远。于是,版本一里面应用医疗大数据的方式基本有这么积累:
服务于医疗本身——长期以来,患者个人是不掌握自己的医疗数据的。互联网医疗出现后,用户可以通过手机来收集自己的健康数据,帮助医生更好的了解自身的健康历史;
服务于医药企业——药企对数据的需求既强烈又多元,包括市场营销需求、新药研发需求、应用反馈需求等。因此,鉴于药企买单欲望强烈,很多数据应用商都主动向药企考虑;
服务于保险公司——这一点中美有些差异,美国保险公司对数据的应用主要是对医疗服务质量和费用的控制,而在我国,保险公司对数据的应用则主要是设计新的保险产品。
③有关应用现状
其实在版本一的故事里,已经有一些有了很好的应用效果,比如药物警戒,用医疗数据来弥补临床数据的缺陷,及时反馈药品不良反应、治疗效果等;再比如保险控费,用医疗大数据控制服务质量和费用,控制和减少保险欺诈行为等。这些领域之所有比较好的应用,主要是因为药企和保险公司的商业驱动力更强。当然,这也仅是在美国。
虽然我们前面罗列了不少有关医疗数据的来源和积累,但实际当中,这些案例都或多或少存在着问题。甚至由于这些问题的存在,版本一里面这些比较浅层次的数据应用都还处于非常遥远的阶段。
数据的完整和有效性——互联网医疗毕竟是新兴事物,用户有接受程度和使用习惯的问题,而且硬件设备也存在功能和精准度的问题。这使得数据收集面临着不完整且缺乏连续性的问题,而且大多数硬件设备没有取得医疗资质,采集的数据也无法做医疗级应用。
数据处于割裂的状态——互联网医疗产品主要收集的是患者在医院的健康数据,而对医院内的数据鞭长莫及。加上医院与互联网医疗无法打通,这导致了医疗数据在院内院外割裂存在的状况。而且由于医院本身信息孤岛的问题,患者在不同医院求医的数据也是碎片化存在。
数据规模仍然非常小——作为大数据应用,目前的医疗数据采集规模根本达不到 “大” 的程度。一个是很多创业公司的数据都是从头积累,再一个是市场认知度仍然有限,最典型的就是基因检测,很多公司的样本量还处在几十个、几百个的水平。这使得目前的医疗数据基本无法实现商业化。
 
【声明】:芜湖站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

相关文章