通信世界网消息(CWW)2017年5月25日,由中国国际大数据产业博览会、人民邮电出版社、中国计算机学会大数据专家委员会主办, 信通传媒·《大数据》承办的“第二届大数据科学与工程国际会议”在贵阳召开。中科院微生物所网络信息中心主任马俊才作了“WDCM:微生物领域的全球数据合作”的主题演讲。以下为演讲实录:
感谢有这样的机会介绍一下我们在微生物领域开展大数据的工作,今天有两个方面不但是仅仅介绍微生物,我们同样关心大数据如何与产业组合起来,所以第二个内容是根据我们的想法做了一些调整,在生物技术和生物产业上进行介绍。
现在我们讲生物就是动物和植物,不见得很多人知道微生物,微生物的数量一般人类认识的微生物只占微生物总量的1%,人类使用的微生物只占人类认知的微生物的0.1%,而微生物的特点我们看看PPT,微生物的特点是什么环境里面都有微生物的身影,他顽强的生存,不论是刚才看到的核辐射,还有多么冷的地方和热的地方都有各式各样的微生物,同时微生物与我们的人类生活息息相关,我们平常吃的酱豆腐,我们喝的啤酒和生物制药都要用到我们的微生物。
举一个例子,最著名的微生物就是青霉素,这样的微生物的菌种和后续人类开发的生物技术起到了什么作用?使我们的人类的生命在当时延长了十岁到20岁,同时青霉素又在这样的一个领域里面形成了一个巨大全球性的市场,这样一个微生物的菌种在当时包藏在英国的保藏中心,为科学所使用,为产业所使用。微生物的另外一个特点不仅造福与我们的人类,同时也干很多的坏事,比如SARS,禽流感等等病毒也是微生物做的坏事,同时我们人类肠道里面有打雷的菌种,我们母亲怀孕我们的时候到我们生出来的两岁期间,你人生100天肠道里面形成的菌群体系对你很重要,我们经常说母亲的味道,喜欢吃母亲的味道,其实不是你喜欢吃那样的味道,是微生物喜欢吃。
微生物有方方面面保藏的地方,不同的微生物需要不同的保存条件,所以从数据的角度来说,随着我们的学科的发展,随着我们对微生物认知的发展产生了大量的数据,同时微生物不仅是科学基础的材料,为我们人类所用,同时由于他的代谢产物的多样性,尤其是反之速度的高速性在产业上得到了应用。这个片子是我们上午讲的,陈老师说的我们现在人类已经精准医学非常时髦,人类已产生的测序的数据目前我们可以读懂数据只有2%和3%的数据是有用的,97%的数据根据我们目前的研究或者我们研究的能够,对于这97%的数据我们是不懂的,换一句话你这个钱花了目前只可以读懂3%,但是这3%,产生了40到50位的诺贝尔奖的获得者,今天这个里面有很多的科学家也是从事生物信息的,体要成为1400名之一,我个人的建议是你去研究我们的微生物,这个是我们的大肠杆菌,这个是酵母,微生物是最简单的,如果你对这样的技术以微生物为材料去开发更好的算法和大八的平台,将来可以节更好的成为1400名之一,哪怕你前面坐的人挡住了你的视线,但是你把这些弄明白了说明会跑得更快。
我们现在承担世界微生物中心,这个是国际教科文组织下建立的全世界唯一的微生物中心,现在在落户在我们的微生物所,也是我们生命科学院里面的数据中心,这样数据中心在全世界有一定的管理,全世界75个国家的和地区的保藏中心在我们中心注册,刚才说的青霉素保存在英国的保藏中心,同样这个保藏中心在我们这里注册,那样微生物是我们保藏中心一株微生物。
我们倡导了一系列的国际合作计划,全球的保藏中心菌种是出售的,你把全世界的目录的数据贡献出来,我们建立一个全球的目录,每一条记录对应了一个保藏中心,那个国家保藏中心的一株活的微生物,刚才说的青霉素菌种查到英国保藏中心的编号,可以买大活的菌种,到今天我们倡导的数决平台已经有43个国家的110个机构参加,全世界39万的微生物的资源在我们的中国的平台,这39万的微生物菌种卖给人家人家怎么用,被人家申请了多少的专利,发表了多少的文章,乃至全世界哪些科学家研究这39万株我们都可以在平台超到这个数据。
这个是我们中国科学院微生物研究所,我们号称世界上最大的微生物保藏机构之一,还有比我们大的欧美的保藏中心参与到我们的数据平台,还有小的发展中国家的保藏中心,我们号召一个国际计划不给人家一分钱,人家凭什么把数据提供给我们的数据平台,我们组建一个大数据的平台的时候我们如何吸引别人的数据?我们是一个成功的案例,我们的所有的数据是公开的。刚才说了43个国家的110多个机构,美国、墨西哥,德国、法国、韩国都参加到我们中国倡导的合作计划,刚才说了,任何一株菌你都可以检索,你点击这个菌种之后可以看到保藏中心在哪里采集的,同时用户发表了什么文章,那个人的文章里面拿到了这个菌都有信息。
刚才说了为什么我们中国倡导的这样的大数据平台那么多的国家参加?我们是一个为数据提供者来做增值服务的平台,我们现在做我们的微生物的大数据,微生物的大数据不仅是资源的大数据,分类的大数据,以及与这些资源相关的文献专利以及功能组学的数据,你可以通过一个资源找到这个功能,同时通过这个功能可以花钱得到实物的资源。在我们的大数据平台不仅有全世界实物的资源,我们有600万的文章,我们有核酸的序列,把我们的数据更好的关联起来,这个是我们前期做得很好的工作。
基于大数据的平台我们可以得到很多的功能,我们看到全世界微生物的菌种里面在科学文章里面最活跃菌是什么,全社会那个菌申请的专利最作我们可以进行挖掘,比如美国ATCC13032号菌种专利数量图,这个菌是专利里面出现最多的,这个菌被申请了两、三千次的专利,每年这个菌所产产生的序列都可以得到,我们不仅生成这样的分析,我们还可以形成报告,这个菌有2000多个专利,这些专利是那些国家申请的,他们用这个菌干什么都可以在大数据的体系里面得到。我们建立这样的微生物的评价平台为我们的客户服务,刚才说到欧美国家为什么进入进来?日本的保藏中心不仅保藏微生物,还保藏动物和植物,他的三类全部在全球的前三名,我告诉他,日本保藏的中心的菌种在全世界有3000多篇文章的发表,描述了你4000种菌,全世界有144个专利,同时提到了你微生物的菌种,全世界与你相关的期刊,一个期刊上有2000多篇文章与你的菌种有关,我们提供这样的报告,你在全世界最著名的菌是什么,你的菌发表了多少文章及综合影响力是什么。还有德国,这个是德国的保藏中心,我告诉他从你中心成立以后,你的菌种向世全世界出售,我们这样的数据就可以挖掘。
那穷国为什么进来?我们可以很轻易的帮助中小国的体系,它可以与全世界进行交流,可以让发展中国家和发达国家进入到这个平台,我们这个平台这么多国家参与,我们的微生物原始的采集的菌种目前涉及到171个国家,同时现在大家都知道,生物资源以已经不在是发达国家所谓倡导的,生物资源是大家共同的遗产,发达国家使用生物资源的要更加尊重原产国的利益,要有利益的反馈,所以在2014我们倡导了建立一个全球的微生物的实物资源的获取跨国转移和使用状况的监控,我们提出所有的GUID,全世界进入我们平台的微生物菌种我们给唯一的ID,这样唯一的ID未来将作为专利和文献以及跨国转移的唯一的ID体系,我们可以通过我们的数据挖掘体系知道提过有多少的微生物的菌种保藏在泰国的保藏中心,泰国有2014种菌保藏在别的中心。我们不仅为科学服务,我们为国家利益服务,我们为产业服务。
数据标准也是很重要,我们不仅开发数据标准成为行业的标准,现在我们ISO组织开发新的IC276 IBOTECHNOLOGY标准,同时我们的数据平台是一个开放的数据平台,所有的数据是开放的,与全世界主流的网络是合作的,我们来自美国的访问是最多的,因为我们与NCBI是合作的,我们与欧洲的网络都在建立一系列的合作关系,同时我们不仅做干好事的微生物,同时,坏的微生物我们也建立了很好的数学模型,开发了很好的数学体系,发表了很好的文章,针对这样的病情我们得到了很好的科学依据。
目前美国启动了国家微生物组的平台我们也启动了,国家领导对微生物组启动也很关心。我们世界WDCM有自己的研讨会,有培训班,培训班不仅在中国办,在其他国家也办培训班,以前都是国际组织建立国际组织在中国的分支机构,现在我们是国际组织,我们走出去建立我们国际组织在不同的国家的分中心,跟一系列的国家网络建立我们的分中心的体系。去年的9月份我们刚刚召开了世界微生物中心成立50周年的大会,一系列的国际主席都参加我们的大会。WFCC8位理事会都参加了我们的学术研讨会,基于大数据的体系,我们发布了中国微生物资源的发布报告,新闻联播也进行了报告。最后还有几分钟的时间介绍生物产业,生物产业是我们的新兴产业,生物产业在未来几年占到GDP的5%到6%,所以生物产业的发展是很快的,我们也一直思考,生物产业里面我们的信息平台如何去为企业,为我们国家的特色园区,为政府的科研机构和金融机构提供更好的服务。
包括园区在我们这里有一个二级的页面,包括园区里面几百家的企业统一发布,比如我们的国家园区进来之后自有的管理平台,我们想为园区的服务也是我们中国的重要的特色,为企业的服务也是,企业注册之后可以得到这样的功能,每一个企业在后台有自己管理的权限,可以找资金,找服务,找服务,在这个数据平台可以实现,还有成果对接,最新的成果在我们里面可以发布,专家可以对成果进行评价,专家的每个人的对应的介绍也有专家也可以管理的自己的信息,企业也可以与专家进行互动,可以进行提问,这些动能在我们这里都可以实现。同时我们战略情报分析报告,对一系列现在很时髦的技术形成了一系列的分析报告,我们也可以受国家的委托和企业的委托定制和开发面向产品和技术的报告,比如生物丁醇是很热的技术,国内外现在都有什么技术,都有什么厂家,主要的技术的热点是什么,已经有关的专利是什么,目前你投资有什么风险或者什么机会,市场规模是什么在这个报告里面都可以得到,同时对丁醇专利的分析也可以得到。
科学院的整个科技服务的平台也是由我们开发,任何一个科研院所可以把技术放进来,任何一个企业找专家也可以做到,微生物的菌种可统一购买从下单到最后购买是21天,我们希望寨生物技术里面是一个大数据的平台,同时也是一个永不落幕的交易会,我们得到了863的支持,同时也得到了国际上的组织和相关的机构大力的支持,同时我们团队的年轻伙伴们也非常的努力,我在这里一并表示感谢。