您当前所在的位置:上海信德项目数据分析师事务所 > 行业新闻 > 用大數據解譯DNA獲重大突破

行业新闻

用大數據解譯DNA獲重大突破

关键词:

项目数据分析

2014-12-20

在“阶段性 科技日報多倫多12月18日電 (記者馮衛東)人類攜帶了數以百萬計的DNA代碼,但一直以來並無有效的方法來告訴人們哪些基因突變引起癌症,抑或只是簡單的耳垢潮濕。由多倫多大學電腦工程師領銜的一個研究小組在18日出版的《科學》雜志上稱,他們已開發出的一種獨一無二的過濾技術可最終解決上述問題,從而在與至少兩個其他國際小組的同類研究競逐中力拔頭籌。

  這個新的計算系統類似於通過強大的互聯網搜索引擎搜尋答案,其梳理了人類基因組各種具有實質意義的突變。該技術最終可將醫學研究成果通過定向方式轉化為疾病的遺傳根源。研究成果表明,在沒有患者及其病情相關信息的情況下,被命名為SPANR(基於拼接的突變分析)系統准確地証實了94%的常見疾病背后的基因“元凶”。該系統還可用於識別使人們更健康、更聰明、更快樂的生物性狀。

  主持該項10年研究計劃的多倫多大學工程學和醫學教授布倫丹·弗雷說,該系統是全球首個能夠有效挖掘基因組的工具。其核心是被稱為“機器學習”的計算技術,通過人工智能編程來進行檢測並破譯。機器學習的復雜形式——深度學習技術已廣泛應用於語音和圖像識別軟件及Siri等虛擬助手流行應用程序。

  SPANR系統旨在檢測調控基因的DNA廣大區域中的小故障,而這些區域曾被天真地認為是垃圾。利用數據和算法進行訓練后,該系統可根據每個突變對細胞行為的改變能力進行分析和排名。突變的排名越高意味著越有可能導致疾病。

  擁有加拿大生物計算領域首席科學家身份的弗雷教授表示,雖然計算機被用於讀取基因組已有相當長一段時間了,但是利用計算機來解譯基因組尚屬首次且表現相當出色。

  研究發現了與結腸癌、胰腺癌和脊髓性肌萎縮症(嬰兒死亡的首要原因)相關的新突變基因,還發現了從未曾與自閉症關聯的另39個基因,且被認為與兒童時期形成該病緊密相關,而此前,隻有幾十個基因被明確與自閉症綁定。研究合作者、專注研究自閉症的多倫多病童醫院應用基因組學中心主任斯蒂芬·謝勒稱,該系統令人信服地展示了機器學習在生物學領域展示的強大威力。

  弗雷教授說,遺傳研究通常需要收集和比較數萬名病患和健康人的基因組,但即使如此多的樣本也不足以精確地找到與疾病相關的模式或突變。SPANR系統或可給此類遺傳研究帶來急需的高精度。

  弗雷教授認為,機器學習將引領個性化醫療時代,未來的疾病治療可根據一個人的DNA展開,醫生在理論上將能夠使用SPANR系統快速產生任何病人的重大基因突變列表。他預計,未來10年,人們可以在智能手機中安裝這種應用程序,彼此分享和比較基因突變,並通過交換其疾病和性狀細節“圍觀”這些突變的真實含義。

  人們已經開始將自己的遺傳密碼上傳到谷歌雲。去年夏天,谷歌透露,其已推出自己的基因組項目以對健康人的生物標志進行編目。這個月,加拿大黑莓公司也宣布,其最新款“Passport”智能手機將包含一個癌症基因組瀏覽器,以便醫生能即時訪問患者的基因數據。弗雷教授說,所有這些大數據都將需要某種形式的深度機器學習來解譯。

  總編輯圈點

  人類DNA被稱為“生命之書”,科學家們正竭力破譯它,要弄清到底是哪些基因突變導致了疾病。26個字母能創作出多種文本模式,基因組是由30億個化學鹼基對組成,其可能存在的模式數量要比宇宙中的原子數目還多。有賴於此前人類基因組的測序工作,機器學習有了建模所需的原始數據。依靠這款“生物瀏覽器”,或許未來人們很自然地掏出手機瀏覽各自基因突變的異同,而具有某些共同突變的人們還會熱烈討論他們的“恐高”症。”地卸去稳定房价繁重工作之后,住房和城乡建设部(下称“住建部”)可以把有限的精力集中到与住房问题相关的制度建设上来。于是,缴存余额接近万亿元的住房公积金监管,再度面临变局。

住建部已经向各地住房公积金管理中心发出通知,要求在2014年12月底前,将开展信息系统贯彻落实《住房公积金基础数据标准》工作的方案,向省、自治区、直辖市住房和城乡建设主管部门上报,并报住建部公积金监管司备案。

这意味着因技术、执行障碍而耗时三年未能完成的住房公积金百城联网工作再次启动。在完成技术标准的统一之后,统一接入住建部住房公积金监管信息系统的技术障碍将彻底破除。而在此前,标准不统一,一直是地方政府未能将本地住房公积金数据系统和住建部实现联网的主要理由。

月底上报

“部里面通知的要求是月底之前把方案报到市里面,我们住房公积金数据标准统一这方面的工作一直开展得比较顺利,所以不存在什么障碍。”12月17日下午,北京市住房公积金管理中心的一位内部人士告诉记者,同时,这一工作方案还被住建部要求向公积金监管司同时备案。

两位住建部内部人士向《中国经营报》记者证实,住建部已经发出通知,要求要在2014年12月底前,将开展信息系统贯彻落实《住房公积金基础数据标准》(下称《标准》)工作的方案,向省、自治区、住房和城乡建设主管部门上报。

同时,住建部还要求,直辖市和新疆生产建设兵团公积金中心直接报住房城乡建设部住房公积金监管司。各省、自治区住房城乡建设厅要拟订三年内完成贯彻《标准》的工作计划,并与住建部建立联动机制,共同提供指导和咨询服务,促进工作顺利开展。

按照住建部要求的总体精神,贯彻《标准》的工作方案须包含以下几部分:第一,本地住房公积金管理系统数据标准与《标准》之间的不符状况;第二,按《标准》调整本地管理系统参数的工作量、所需工作时间;第三,按《标准》调整本地管理系统参数的工作安排。

在此之前,住房公积金基础数据标准宣贯工作会议在四川峨眉山召开,在这次会议上,作为全国缴存余额超过万亿元的住房公积金主管部门,住建部要求在2017年底前实现本辖区内所有公积金中心完成《基础数据标准》贯标工作。

“北京、武汉、南宁等城市的问题都不大,没有太大的数据标准差异,但是,全国其他城市的系统数据标准,要统一到《标准》上来,还是有比较大的工作量的,所以在规定的2017年全部完成的基础上,又规定了一个工作方案上报的时限,就是为了让地方公积金管理中心有紧迫感,有利于整体任务的完成。”

明确分项

2004年,原建设部下发《关于印发〈二○○四年建设部归口工业产品标准制订、修订计划〉的通知》(建标〔2004〕65号,下称65号文);2009年,住建部下发《关于同意调整住房公积金管理信息系统标准名称和编制单位的函》(建标标函〔2009〕57号,下称57号文)。根据这两份文件,《住房公积金基础数据标准》编制完成。

记者了解到,《标准》的主编单位为住建部信息中心;北京市住房公积金管理中心、参编单位为广西壮族自治区南宁市住房公积金管理中心和湖北省建设信息中心。因此,这些城市对于《标准》的情况较为熟悉,在本轮数据标准统一的过程中,这几个城市的数据标准,与《标准》差距不大。

2009年《标准》编制工作全部完成,并形成正式文稿。但是,此后,这份标准一直未被作为强制标准实施,而是作为推荐标准向地方政府推荐使用。直到2014年,这一标准才转为强制标准,住建部要求在全国范围内,从10月1日开始正式实施。

住房公积金基础数据由公共、归集和提取、个人住房贷款、建设项目贷款、财务、结算等六部分组成,包含29张数据表,394个数据项,241个代码。《数据标准》适用于住房公积金信息系统建设中基础数据的创建、检查、存储、传输、共享和集成。

在此基础上,《标准》还分项单列了缴存单位总账信息、缴存个人总账信息两项内容。缴存个人总账信息应由缴存人在住房公积金管理中心记录的归集账务汇总数据构成,包括个人本年补缴的住房公积金数额、个人本年汇缴的住房公积金数额、个人自账户开立之日起住房公积金汇缴金额的总和等。

除此之外,还包括个人自账户开立之日起住房公积金补缴金额的总和、个人月缴存额的单位部分、个人本公积金年度住房公积金累计提取金额、个人本公积金年度住房公积金累计转入金额等信息。

“这些信息都通过统一编码的方式,通过一个编码,就可以实现信息的准确调取。通过这个方式,是否存在漏缴、超缴住房公积金等情况,就可以一目了然,同时,住房公积金的使用也回留存下痕迹。”一位参与标准编制前期讨论的专家告诉记者。

再启联网

记者了解到,在通知地方公积金管理中心在月底上报调整工作方案的同时,住建部已经对地方政府提出要求,各地公积金中心信息系统在贯彻《标准》过程中,要同时接入全国统一的住房公积金银行结算数据应用系统,与受托银行进行直联支付结算,实时获取银行结算数据,实现资金、业务和财务信息的自动平衡匹配,建立先进、实用、安全的信息系统。

这涉及到住建部三年前启动的一项工作。2012年,住建部部长姜伟新做出工作部署,要求进一步推进住房公积金运行监管系统建设,力争2012年年末覆盖到全国100个城市(详见2012年2月11日《住建部拟对百城住房公积金进行联网安全监控》)。

然而,这项工作进展并不顺利。在住建部2014年布置的重点工作里,仍然包括住房公积金联网监控的有关工作,而这已经是第三年了。与往年不同的是,住建部这次并未向地方政府明示完成联网的城市个数。

 

在住房公积金基础数据标准宣贯工作会议上,湖北住房公积金的一位人士介绍,目前全国各地,住房公积金的信息化系统林林总总,有些是基于银行系统开发的,有些是中心委托软件公司开发的,数据结构及数据定义缺乏统一的标准和规范。这种发展状况严重制约了公积金的信息化管理,也带来了一系列的管理隐患,出现很多数据口径的偏差,直接导致统计口径偏差和统计数据失真。在地方政府住房公积金管理系统不能全国联网的理由中,数据标准不统一,是主要被提及且确实现实存在的理由之一。

“如果能够尽快完成数据标准的统一,那么地方政府就不再有借口和理由对联网这件事拖着不办了。”一位不愿具名的住建部人士称。

我要评论(114生活网会员可直接登录,如果还不是114生活网会员,请点击注册新用户!
  • 评论内容:
联系我们更多
上海项目数据分析师事务所
项目数据分析

联系人:李小姐
电 话:13764413656
邮 箱:672503501@QQ.COM
地 址:徐汇区中山南二路1007号敦煌大厦810室
客服中心
信德事务所:
点击这里给我发消息
网上有害信息举报
x

填写举报信息

提示:请填写您的实名信息,中国114黄页承诺对您的信息进行保密