2013年10月17日,生物医学研究人员经常面对大量的信息,可以以多种形式积累:生命体征、血细胞计数、冗长的DNA序列,条形图,核磁共振,病人的人口统计资料,以及更多。如何使研究人员聚集,访问和分析所有数据,而不必成为专业的数据库技术人员自己?
一组信息学专家和费城儿童医院的生物医学研究人员(CHOP)提供了一个新的软件工具来帮助研究者争论的数据。他们的开源,高度互动的框架称为收获 旨在让用户迅速浏览不同类型和层次之间的数据。
“我们希望帮助研究人员探索他们的数据,而不是他们的数据库,”拜伦说鲁思,首席开发者收获在生物医学信息印章的中心(材)。鲁思是一个介绍中材的收获框架的共同作者,出现在今天的在线美国医学信息学会杂志。合着者迈克尔J.意大利添加“,研究机构通常是通过他们的信息技术人员合作,以提供一个单一的数据仓库,可能是过于通用为它的所有项目,或根据具体情况逐案制定一次性解决方案依据每个项目“。
独特的方法为特定的项目提供了通用的应用程序和定制
“我们在收获的做法不同的是,”说意大利,英国工业联合会的应用研究的经理。“我们决定把重点放在最终用户,推广应用工具包与多个合作者的任何生物医学的研究,但还允许各个软件开发和数据管理人员可以自定义为特定项目的软件“。
嘉实,说意大利,“不只是收缩包装,随时可以去软件。”他估计,收获通常提供80%的工作,把它留给任何机构的软件开发人员框架适应项目的需求,在每个项目的主要研究者的合作。收获是开源的,所以用户可以免费看bug报告,检查软件补丁,并得到用户的更广泛的社区分享的修复和自定义。
丰收的一个重要特点是对数据库中的所有患者的汇总报表不同级别的数据,从单个病人的病历中顺利机动能力,以及亚群中的用户之间可以构造查询大卸八块数据 - 分组科目,例如,按年龄或种族,调出个体的血液测试结果或核磁共振,或包括或不包括特定诊断。
收获的一个优点是,它提供透明性和可视性数据的方式,是熟悉的谁是投资于特定疾病或项目的研究员。“收获采用方便和清晰的界面,以查看和探索正越来越多地在其他使用的数据行业,如社交媒体,“说资深作者和中材总监Peter S.白,博士。”我们已经发现,这往往可以帮助用户快速熟悉与他们所看到的数据,这增加了他们的信任资源的可能性甚至可以诱因,因为它的发展作出贡献的项目。“
嘉实开发商说,他们的工具,反映了在电子健康记录和基因组技术大数据时代的研究日益复杂,在上世纪80年代和90年代,大部分的联邦研究遵循假设驱动模式,着眼于预先定义的测量值的患者人群中。目前,很多数据库收集大量多种数据类型有什么是显著较少的先入之见。
“收获允许用户制定和细化问题甚至探讨数据,并对他们的前几分钟,重要的不明显的一个不同的观点,“意大利说。
软件应用在多个集合数据
在中材团队最初设计嘉实从AudGenDB,由国立耳聋及其它通讯障碍资助的听力数据库管理数据。
在当前的文件中,研究小组通过其与其他收藏的数据进行数据的速度运行,对收获进行评价:
cardiodb,临床数据存储从47000砍的儿科心脏病患者
OpenMRS,公开数据集控股的实验室结果,感染状况和电子健康记录的其他临床结果
中材现在申请收获更多的藏品,包括儿科纵向数据资源,创建存储从成千上万的儿童衍生出国家新生儿筛查项目检测条件的临床数据的长期的信息系统。
“虽然这些集合包含不同类型的数据,收获的工具是足够灵活以适应这些不同的场景,同时保持一致的基本组成部分,”鲁思添加。
收割工作已经主要集中在终端用户到这一点。未来的工作包括一个更大的专注于软件开发和应用支持人员谁是负责建立和维护收获的应用程序。“然而,当我们考虑的生命周期一份收获的应用程序,我们希望它尽可能方便管理员和软件开发者获得收获到研究者的手上,“意大利说。
更多信息
美国国立卫生研究院(授予DC012207)和劳伦斯Altschuler领导主席赋予基金在儿童医院支持这项研究。合着者露丝,意大利和怀特分别杰弗里·W·潘宁顿,米勒杰弗里,斯泰西Wrazien,珍妮弗·G. Loutrel,和E布赖恩·克伦肖,全部来自费城,白色的儿童医院是通讯作者。
“收获:为开发基于Web的生物医学数据发现和报告应用程序的开放平台,”美国医学信息学会杂志,网上公布10月16日,2013年阅读抽象。
接触
约翰Ascenzi,费城儿童医院,267-426-6055,ascenzi@email.chop.edu
(注:转载时请注明复诊网)