从本源唤醒熟睡的数据-亚洲ca88官方网站

发布时间:2023-01-05 07:09:01 来源:亚洲ca88官方网站

  近年来,因“原始数据丢掉,作业无法重复”构成的撤稿作业层出不穷。例如,2020年1月,2018年诺贝尔化学奖得主Frances H. Arnold撤掉了2019年5月宣布于《科学》的一篇论文,原因是缺失了要害的原始数据,致使研讨效果无法重复。

  “只宣布论文不揭露研讨数据,或许会导致科学研讨效果无法复现,不只下降论文可信度,还或许衍生学术不端等行为。但怎么让科学家自愿同享科研数据是长时间以来难解的问题。”《我国科学数据(中英文网络版)》(以下简称《我国科学数据》)常务副主编、我国科学院计算机网络信息中心(以下简称网络中心)研讨员黎建辉在承受《我国科学报》采访时坦言。

  “科学家科研奉献和学术威望点评机制原封不动,是阻止科学数据敞开同享实践的一个根本问题。”《我国科学数据》主编、我国科学院院士郭华东以为,“数据出书可使数据到达可引证和永久可拜访的状况,促进数据赶快归入科研点评系统,是科研一起体的试金石、防腐剂。”

  跟着信息技能展开,数据存储和传达所面对的容量、时刻和空间藩篱已被打破,科学数据同享不只仅学术界枯苗望雨之盼,更是影响国家安全和科技前进的重要战略。

  作为《我国科学数据》的主办单位,多年来,网络中心积累了丰厚的数据资源,展开了一系列数据同享探究,但作用仍不抱负。“一方面科学家不愿意同享数据,另一方面数据同享没有正式的途径和规范的规范,而构成科学家将数据攥在手中的根本就是数据权属和激励机制问题。”黎建辉表明。

  2012年,世界数据期刊开端呈展开态势,国内科学数据敞开同享范畴的研讨者们也逐步认识到,数据出书是我国数据同享展开的必经之路。

  但是,请求刊号成为其时最难的事。“我国对刊号的批阅十分严厉。数据期刊作为新事物,请求刊号更是难上加难,许多人甚至不明白数据出书终究是什么。”黎建辉说。

  2015年,国家新闻出书广电总局展开网络接连型出书物规范办理试点作业。独具网络出书特性的《我国科学数据》捉住这一机会,正式获批刊号,成为我国首个专门面向多学科范畴科学数据出书的在线学术期刊。

  存储对数据宣布作业至关重要。为此,网络中心还自主研发了一套支撑数据出书的作业渠道,由我国科学数据在线作业渠道和科学数据存储库系统ScienceDB(科学数据银行,以下简称ScienceDB)一起构成。

  水兵大连舰艇学院教员郑崇伟长时间致力于海洋研讨。他发现,当海洋研讨人员需求数据时,一般先想到的是NOAA、NASA等安排,我国海洋数据在世界上的认可度还有待前进。“咱们期望将团队制造的海洋数据向世界同行同享,展示我国科研人员在海洋大数据研讨方面的活跃奉献,前进世界话语权。”

  但是,同享之路困难重重。“在数据出书之前,国外同行一般会经过邮件等方法向咱们索要数据,他们供给的数据上传网站极难登录,并且数据没有编号,咱们也无法奉告其数据怎么引证。”郑崇伟坦言,“《我国科学数据》及其存储渠道处理了咱们的烦恼,咱们的数据集有了身份证,不光引证规范起来,引证率也前进了许多。”

  2015年,我国科学院空天信息立异研讨院副研讨员邱玉宝完毕在地球观测安排的任职,开端对此前的课题效果数据进行整理。“一方面,期望数据有存储之地,节约查找时刻,也便于同享;另一方面,咱们想紧跟世界数据揭露同享的展开趋势。”

  在了解到网络中心展开数据出书并筹建了ScienceDB后,邱玉宝便凭借这个渠道揭露数据。让他没想到的是,数据揭露后得到多个渠道转载,《青藏高原MODIS逐日无云积雪面积数据集》(以下简称积雪数据集)是现在经过ScienceDB渠道下载量最多的数据集,还被科技部的多个国家级数据中心转储。

  “问渠哪得清多么,为有源头活水来。为唤醒熟睡的数据,《我国科学数据》期望为科研一起体运送源头活水,承载数据,问路未来。”郭华东表明。

  期刊姓名加不加“我国”?办英文的仍是中文的?做专业范畴仍是多学科范畴?

  在刊号管控严厉的布景下,假如期刊称号加上“我国”二字,则意味着刊号批复愈加困难。“有必要加我国,这是咱们的职责和任务。咱们要将我国的优质数据推出去,但并不意味着只限于我国的数据。”《我国科学数据》修改部主任孔丽华铿锵有力地说。

  “我国需求本乡的期刊,所以咱们摒弃了纯英文期刊的主意,创办了中英文双语期刊。”黎建辉说,“不只如此,咱们还期望推进多学科的数据同享,不局限于某个范畴。”

  为了更好地展示“我国”力气,网络中心自主研发了ScienceDB和我国科学数据在线作业渠道。“国外也有现成的出书渠道,但我国应该有自己的中心技能,并且国外渠道未必就彻底合适国内出书特征。”黎建辉表明,“咱们期望树立一个能为多种期刊服务、适用于多种不同审稿流程的渠道,而完结这种灵活性具有很大难度。”

  经过团队两年攻坚,数据出书渠道总算树立成功,处理了许多数据集的同享之困。“磨刀不误砍柴工,好的系统能够协助咱们做许多作业,后期能够省许多力。”黎建辉说。

  从2015年完结、揭露第一套数据集后,邱玉宝就开端连续经过此渠道同享科学数据,其间积雪数据集至今已被20多家国内外单位引证,不只在气候变化等范畴,在工程范畴也得到很好的使用,还有学者根据这套数据完结了博士论文的中心章节。“作为一名科研人员和数据生产者,这是我没有预想到的,也促进我后续宣布更多数据。”

  “数据不只要揭露,还要高质量地揭露,只要高质量的数据才更具传达性和使用性。”在荣获“ScienceDB科学数据奖”个人成就奖后,邱玉宝慨叹道,“数据同享让数据不再停留在硬盘里,而是实实在在被他人在不同范畴真实使用,这是数据生命周期的完好价值链。”

  在郑崇伟看来,从体量大、信息密度低的原始数据中提取有用信息,并构成数据集,是高效展开海洋建造、完结我国海洋数据弯道超车的要害。“《我国科学数据》一站式处理了论文宣布和数据存储的问题,咱们研发的首套《海上丝绸之路海洋环境与新能源数据集》宣布后,得到世界同行的广泛使用和高度点评。”

  在黎建辉看来,《我国科学数据》不只仅一本期刊。“它是一个依照期刊形式推进数据同享的渠道,期刊仅仅演进的第一步,未来将凭借大数据等特征,将数据跟科研活动融合得愈加严密。”

  “论文出书有悠长的前史,构成了老练的出书系统,而数据出书不同,作为一个新事物,有必要树立一套新的数据出书流程。”黎建辉回想道。

  为更好地盘活数据、推进数据同享、前进数据出书速度,《我国科学数据》拟定了两个审阅阶段,第一阶段是预出书,第二阶段是同行评议。

  “预出书阶段归于技能审阅,提交的数据论文和数据集首先由修改部的数据审阅员和论文审阅员别离审阅,经过初审的会直接在网上发布,一般只需3天左右。”孔丽华说,“预出书不只能够让数据集得以快速发布和引证,学者还能对其敞开评论,并提出问题和主张。”

  “同行评议阶段归于专家审阅,经过初审的数据论文和数据聚会送至既有学科布景又了解数据的审稿专家,一般45天左右就能完结审稿。”孔丽华进一步解说。

  “数据期刊的展开要两条腿走路。从数据同享的初心视点,不能仅把它当作刊物,要做更多盘活数据的事;从办刊视点,又要注重刊物载体,尽力寻求优质的数据和更好的传达力。”她说。

  因而,修改部会环绕国家严重战略和世界前沿等主题自动组稿和约稿。“关于自在来稿,咱们不会只看被引率而容易拒稿,数据好不好用终究还要用户说了算。”孔丽华说。

  实际上,创刊初期,为了获得好稿源,黎建辉经常带着咱们四处“化缘”。“我国有丰厚的数据资源,与学术论文严密相关的数据集都躲藏在冰山之下,但其时咱们对数据出书没有认识,理念疏通后也就瓜熟蒂落了。”

  到2020年12月底,《我国科学数据》现已正式出书了专题特征数据集17期,期刊出书与论文发布算计约335篇,数据总量到达762.86GB。

  跟着期刊的展开和办刊理念的前进,投稿体会成为期刊越来越重视的方面,这也成为期刊扩展稿源、维系作者的“软实力”。

  数据出书流程不像论文出书那样被作者所熟知。郑崇伟回想说:“第一次向《我国科学数据》投稿时,数据描绘、规范格局上传等都是第一次触摸,修改十分细心地供给数据论文模板,并同享经历、自动供给协助。”

  “整个投稿进程如沐春风。”郑崇伟点评道,“这支部队谨慎担任,他们就像背靠背作战的战友相同,不光不会加压,还经常问询咱们的进展,自动为咱们处理各种问题。关于已出书的数据集,他们活跃帮咱们宣扬,自身很苦的活儿一下有了温度。”

  在作者“如沐春风”的体会之后,是修改团队不知疲倦的支付。“从盯梢研讨项目、策划主题、跑专题、联络专家、承认组稿,到收稿审阅、同行评议、主编终审,再到修改排版、终究出书,甚至出刊后宣扬推行等,实际上,期刊修改的作业十分繁琐。”孔丽华说。

  但让她欣喜的是,这支修改部队虽小但“精”,“所有人都勤勤恳恳、用心干事,期望能为我国数据同享和数据出书奉献自己的力气”。

  关于期刊未来展开,黎建辉表明,“一是要继续扩展稿源,丰厚稿源的学科类型;二是站位要愈加高远,环绕国家严重战略和世界前沿展开数据同享推进作业;三是推进数据引证的剖析和统计作业,这是促进科学家同享数据的有用激励机制。”

  《我国科学数据(中英文网络版)》由我国科学院主管、我国科学院计算机网络信息中心主办、世界科技数据委员会(CODATA)我国全国委员会合办,是现在我国仅有专门面向多学科范畴科学数据出书的学术期刊,当选我国科学引文数据库(CSCD)来历期刊、地舆资源范畴高质量科技期刊(2020年)。

上一篇:数据办理才能成熟度模型DCMM一文读懂 下一篇:OFweek通讯网
分享到: