Industry News
深度解读《科学数据管理办法》大数据洞察(赵国栋 )2018-04-19

深度解读《科学数据管理办法》


《科学数据管理办法》(下简称“《办法》”)是确立大数据国家战略以来,首个国家层面出台发布的类目数据的管理办法,因此《办法》体现的原则、实践中取得的经验,都极具启示意义。

之前的科学数据管理工作,令出无门、各行其是,严重制约了科学研究。我在2013年编著《大数据时代的历史机遇》时就曾在书中论述过数据治理乱象问题:

“譬如气象部门详尽的天气观测数据,是研究大气规律、做天气预报的第一手资料。但是这些数据因为各种各样的原因在气象局那里睡大觉。理论上讲,科学院的大气物理研究所是可以拿到这些观测数据的,否则大气所的科学家们怎么支持气象局的工作啊?根据‘有关部门的有关规定’,大气所的确也能够接触到这些数据。但实际操作中,要拿到这些有用的数据,不拖个半年是不行的,而且就算到手了,也是鸡零狗碎的,没什么用途。这就是典型的‘数据割据’现象。”

概括而言,数据治理有三大问题,最严重的就是这段引文强调的数据割据现象。《办法》体现的原则,一系列的规定,可以说彻底解决了科学数据领域的数据割据难题。

《办法》虽然没有明确提出数据所有权等高度敏感的问题,但是体现了“谁拥有、谁负责”、“谁开放、谁受益”的原则。这个原则和中关村大数据产业联盟(下简称“联盟”)一直倡导的数据所有权、使用权、受益权分置的原则高度吻合。我们以此可以推测,在后续各类数据的确权过程中,会贯彻这一原则。这个原则的确立,无疑对于各类数据企业,有极为重要的意义。对于最终解决数据资产的确权开了一个好头。

《办法》明确提出 “开放为常态、不开放为例外” 的原则。这个原则,同样意义深远。过去数据开放一直步履艰难,其中一个重要的原因,就是国家安全范围的边界模糊。谁也担不起“破坏国家安全”的帽子。有了这个原则,大家不用再担心了。当然,国家安全是至关重要的,但是有分级管理来确认。确认可能危害国家安全的,咱们就遵照分级管理的路子,依法行事即可。这个原则,不仅仅适用于科学数据,既然开了好头,一定就会贯彻到其他类目数据管理办法中。

《办法》确立了“科学数据中心”的地位、组织和职责,这个新设立的组织,无疑是落实《办法》的核心部门。鄂维南院士提出 “用科学的方法研究数据,用数据的方法来研究科学” 的观点。前者包括统计学、机器学习、数据挖掘、人工智能等领域,后者包括象生物信息学、天体信息学、数字地球等领域。这些都是数据科学的有机组成部门,只有把他们放在一起,才构成数据科学的全貌。有了“科学数据中心”,鄂院士的远见,有了国家级的承载平台。数据科学,作为一门新兴的基础学科,将会推动、带动相关学科的发展。

《办法》在发布之日起,就正式实行了。相信我国各学科的交叉、融合、发展,在科学数据中心的支持下,会发生质的突破。其他类目的数据管理办法,相信也在酝酿起草之中。这些举措,都是扎扎实实落实国家大数据战略的顶层设计、制度基础。如此快速出台《科学数据管理办法》,要为中国速度点赞!