数据科学峰会:做好数据科学工作,是挖掘数据生产力的关键
科技日报记者 张佳星
“数字中国建设不只是存储平台、计算平台、东数西算等硬件,还需重视软实力建设。”在百分点科技日前主办的“2023数据科学峰会”上,北京大学数学科学学院、光华管理学院教授,中国科学院院士陈松蹊认为,落实数字中国建设的整体布局规划,关键工作之一是通过数据科学来释放数字生产力。
北京大学数学科学学院、光华管理学院教授,中国科学院院士陈松蹊现场报告
近日,中共中央、国务院印发的《数字中国建设整体布局规划》要求,加快提升数据资源规模和质量,有效释放数据要素价值。
随着各行各业数智化转型的深入,数据已经成为经济社会发展的关键生产资料,如何释放其数据生产力成为推动数字技术和实体经济深度融合、加快数字技术的创新应用的新命题。
关键要研究“怎么算”
“要真正把数据的生产力释放出来,光有大量的存储和算力还不行,还要搞清楚如何发挥存储、算力的最大效能,研究‘怎么算’才是关键。”陈松蹊说,用好数据要素,数据科学的研究是当务之急。
他认为,当前数字中国建设的工作大多着力于硬件建设工作,且目前 “硬实力”的建设已经具备一定规模,应继续推进软实力的建设,即数据科学在不同行业应用,需要把收集的数据用起来,分析出个门道,释放它们的潜在生产力。
百分点科技董事长兼CEO苏萌表示,数据科学在过去50年里从1.0的小数据时代、2.0的大数据时代走入了3.0的AI时代,未来将迈向数据原生时代。当前新的技术和应用带来更加丰富的数据、多模态的数据类型,如何使得现有海量数据可分析、可解释、可利用,进而参与到真正的预测和决策场景中,需要数据科学的研究。
数据科学究竟要如何解决当前数据生产力挖掘中的痛点呢?苏萌认为,当下市场需求不再是断点式技术和工具,而是端到端的数据科学解决方案,在长链条里实现数据价值。随着数据科学通用工具的一体化和平台化、领域知识的程序化和服务化,交互方式的自然语言化,数据科学技术将像互联网一样普惠大众,业务和决策人员将可以跨过程序员直接与数据进行交互,提高分析和决策效率。
对于数据科学的未来挑战和发展趋势,苏萌表示,有别于人类活动真实产生的数据,未来AI生成的数据会带来很多的困扰,因此评估数据质量是实现数据价值的基础。其次,数据科学将会与领域知识更加深度融合,进而使得领域知识自动地抽取、知识的构建以及领域知识和人类的交互和服务成为重点。此外,数据科学技术在不断地迭代升级,它也会作为重要的生产力来推动商业模式和企业组织的变革。
加强数据科学研究的团队和平台建设
如何加强场景驱动的数据分析等数据科学“软”实力建设?陈松蹊认为,挖掘数据生产力的关键是构建数据文化。数据科学团队的建设非常重要,研究应贯穿数据采集、数据分析到管理决策的全流程,让统计师、数据分析师从始至终介入数据的价值挖掘。其次应重视数据科学咨询,以数据科学咨询为主体的机构需要了解实体企业的业务模式和核心诉求。
上海纽约大学全球杰出商学讲席教授陈宇新也认为,目前数据领域的应用型人才较多,进一步原创性的突破则需要从更基础的数学理论上发掘潜力,需要更多的原始创新人才。对于数字经济来说,数据质量的认证将会变得非常重要,认证和确认数据源可靠性的技术或服务将会兴起。
数据科学研究是一项与市场联系紧密的应用型研究领域。陈松蹊认为,实体经济已经开始认识到数据的价值,但如何把数据转化成生产力,这需要数据科学、数据企业的帮助,如打造专业化、智能化、个性化的数据科学方案系统,通过模型开发和数据训练,达到一个优秀统计师与数据工程师的水平。
为此,百分点科技推出一站式数据价值实现平台——百分点数据科学基础平台,服务于数据工程师、数据分析师和数据科学家,助力便捷高效地将数据转化为业务知识并辅助决策和行动,最终释放数据价值。据介绍,数据科学基础平台不断沉淀领域中的数据科学知识,包括程序性知识、事实性知识和概念性知识。传统企业的数字化转型面临着冷启动问题,平台能够借助行业内已有的专业知识为其破局。同时,数据科学基础平台内置了智能辅助开发系统,可以自动化地辅助开发者选择方案以及完成数据适配,并智能化地进行方案精调和改进,并能够在数据治理的多个环节依托知识库及语义理解等智能技术帮助开发者提高效率。
(图片由会议主办方提供)