河南省数据要素高质量开发利用对策研究
近年来,人工智能技术发展迅速,驱动数据要素市场呈现爆发式增长,从通用大模型的不断成熟,到聚焦应用场景的行业大模型的探索发展,高质量数据正成为人工智能大模型快速迭代、产业智能化转型的核心“燃料”。河南省具有海量数据资源和丰富应用场景优势,应积极推动数据要素开发与利用,为河南省人工智能发展筑牢基础。
一、河南省数据要素开发利用现状
(一)数据要素规模巨大
河南是全国人口大省、经济大省和工业大省,在经济社会发展领域蕴藏着海量数据资源,具备打造完备数据服务生态的基础优势和良好条件。一是数据资源丰富。作为人口大省,河南拥有庞大的数据量和多样的应用场景,通过整合来自政务、工业、农业等多个领域的数据资源能够有效促进数据要素的技术创新。二是数据要素市场初具规模。以郑州为例,郑州数据交易中心已设立“三农”、交通、金融、通信、能源等行业数据专区。截至2024年4月,郑州数据交易中心挂牌数据资源和上架数据服务共1185件,解决流通场景需求100余种,合作伙伴460余家,平台注册用户271个,成交数据交易共416笔,成交金额8.37亿元。三是数据标注产业优势突出。河南劳动力人口丰富、人力资源成本相对较低,在发展数据标注产业方面有着显著的比较优势,目前涵盖人工智能训练过程中所需要的数据采集、标定、质量监控、私有化部署等服务,在智能驾驶、智能安防等方面具有成熟经验,与华为、阿里巴巴、百度等世界500强及行业独角兽企业达成战略性合作。
(二)数字基础设施建设加快
河南省高度重视数字基础设施建设,以5G、光纤宽带、工业互联网、数据中心等为代表的数字新基建取得快速发展。一是网络基础设施国内领先。全省5G基站达到21.05万个,居全国第5位,5G网络上、下行速率获评全国唯一“双卓越”省份。全省14个省辖市建成“千兆城市”,千兆以上用户占比达到32.9%,居全国第4位,千兆光网实现乡镇以上全覆盖。二是算力基础设施提速发展。先天算力智算中心、白沙智算中心等建成投用,中国算力平台(河南)启动试运行,国家超算郑州中心、中原人工智能计算中心获批建设国家新一代人工智能公共算力开放创新平台,全省已建、在建和拟建的算力中心超过100个,标准机架数达到15万架,形成算力规模约4500P Flops。三是融合基础设施持续提升。全国路网客户服务数据中心、安罗智慧高速等重点项目加快建设,智慧高速通车里程居国内前列。基本建成覆盖全省的公共智能充电网络,累计建成公共充电桩9.3万个,高速公路服务区充电设施覆盖率达到100%。
(三)数据应用场景丰富
河南省人工智能应用场景丰富,在工业、农业、交通、医疗、教育等重点行业形成了一批人工智能示范应用场景,有效促进了经济社会数字化、智能化发展。一是基础支撑能力不断增强。培育建设数字中原等省级数字化转型促进中心15家、制造业数字化转型示范区20个,在智能制造、数字农业、智慧文旅等重点领域打造了一批数字化转型典型应用场景。二是制造业转型升级全面推进。构建涵盖1个综合性平台、50个细分行业领域平台的工业互联网平台体系,接入设备883万台(套),部署APP应用3600多个。天瑞信科工业互联网平台入选国家跨行业跨领域工业互联网平台,中信重工矿山装备、一拖现代农业装备等工业互联网平台入选国家工业互联网试点示范项目。三是服务业数字化转型进程加快。数字文旅产业出圈出彩,国家文化大数据体系省域中心加快建设,“一机游河南、一图览文旅、一键管行业”智慧文旅平台上线运行,培育出以龙门石窟、云台山、清明上河园为代表的智慧景区。
二、河南省数据要素开发利用存在的问题
(一)数据供给质量有待提升
高质量数据要素供给体系的构建,核心在于激活高质量数据要素源头,当前河南省数据供给还存在开放程度不够、缺乏标准、特色数据开发不足等问题。一是数据开放程度不够。当前河南省数据共享开放阻力大、顾虑多,数据供给的规模和质量不足,资源培养的渠道和方式不丰富、不便捷等问题普遍存在。主要表现为缺乏动力不愿开放,伦理风险导致不敢开放,技术不够不会开放三个方面的问题。二是数据质量缺乏标准。数据采集、处理和应用方面缺乏统一的标准和治理体系以及不同地域、不同行业间存在业务模式和利益诉求差异,导致公共部门数据供给质量不高,企业数据失真、失准及一致性差,“数据孤岛”现象严重。三是特色数据开发不足。河南省拥有丰富的特色行业数据资源,但在农业和文化等领域的数据资源开发存在明显不足,导致大量特色数据资源未能得到有效利用。
(二)数据流通仍不够畅通
由于交易体制的不健全、交易市场培育的滞后,河南省数据流通仍存在不少“堵点”,难以发挥数据的价值。一是数据交易缺乏系统谋划。从管理部门看,工信、数据局等部门职能有交叉,出现“多龙治数”局面;从市场主体看,郑州数据交易中心、豫信电科集团等数据交易业务边界不清晰。二是数据交易市场培育滞后。目前国家数据局的各项工作的推进和体制机制的布局,比如数据标注产业的试点、数据要素典型案例等重大体制机制的布局,河南均处于落后和失权(话语权和主动权)的行列。三是数据交易的制度体系不够健全。目前河南省涉及数据流通的数据产权制度还不完善,给数据流通交易的实际操作带来不便。场内数据交易流程成本高,数据提供方进场动力不足;场外交易中缺少专业的法律审查,数据产权确认存在风险隐患。
(三)数据开发利用环境有待完善
当前河南省数据开发利用的环境还有待完善,主要体现在技术、市场、人才等方面。一是推动数据要素技术开发运营的水平还比较低。区块链、隐私计算、多方安全计算等技术与实现支持河南省人工智能发展的目标还有不小差距。相关技术在软硬件优化适配、工程化创新突破方面也存在探索不足的情况。二是数据要素应用的市场还处在培育阶段。大部分企业对于数据价值的认识与挖掘不够深入,对数字化转型存在疑虑,不能转、不愿意转、不敢转。部分企业虽然拥有大量数据,但缺乏相应的数据分析技术和实力,数据无法转化为实际的业务价值。三是数据创新人才短缺。现有的教育体系和培养机制尚未充分适应数据创新领域的发展需求,导致潜在的人才难以获得全面而深入的知识和技能。
三、推动数据要素高质量开发利用的对策建议
(一)深挖数据资源,提升供给质量
鼓励政府和企业加大数据公开力度,挖掘特殊数据资源,做大做强数据标注产业,全面提升河南省数据供给质量。一是鼓励政府、企业加大数据公开力度。加快建设政府数据开放平台,为社会公众获取公共数据提供便利。鼓励探索企业数据授权使用新模式,引导龙头企业、平台企业、中小微企业开展双向公平授权,共同合理使用企业数据。建立数据联管联治机制,实现政府、企业和社会组织之间的数据共享和互通,打破数据孤岛,提升数据资源的利用效率。二是挖掘特殊数据资源。积极争取国家部委和央企数据本地化运营的机会,争取部委数据中心落地河南。重点加强与水利部、黄委会等沟通合作,以郑州数据交易中心为主体,申报组建黄河流域数据交易所。围绕农业数据资源智能检索、农作物物联网识别、农业自然灾害预警等,建设农业大数据推广应用平台。三是发展数据标注产业。加大数据标注专业技能人才培训,为推动数据要素高质量供给提供有力支撑。建设数据精细化标注平台,开发智能云数据管理服务系统,研究平台和服务系统激励机制,鼓励企业研究互联网数据全量实时更新技术、多源异构数据整合和分类方法,研发数据清洗、标注、分类、注释和内容审查等算法及工具。
(二)创新产权制度,明确权利归属
围绕数据要素市场化配置完善数据管理制度体系、推动数据资产价值化。一是完善数据管理制度体系。按照数据分类分级保护制度,建立重要数据具体目录、场内交易清单、场外交易备案管理制度。依托数据要素综合服务平台,建立跨部门协同监管机制,保障数据来源可确认,使用范围可界定、流通过程可追溯、安全风险可防范、数据使用可控可计量。二是推动数据资产价值化。明确数据资产的权属和权益分配机制,为数据交易提供清晰的产权基础。将公共数据授权运营成效纳入政府考评指标,推动医疗健康、文化旅游、农业农村、交通运输等行业数据和个人数据进行价值转化运营。三是积极开展数据交易。将数据产品、数据服务等纳入政府采购目录,使用财政资金购买数据产品和数据服务应当通过交易场所进行,通过政府行为引导场内合规交易。积极培育数据流通和交易服务生态,吸引更多的数据服务商、中介机构等参与数据交易,形成完整的数据交易服务链。
(三)加强政策引导,提升流通效益
抢抓政策机遇期和发展窗口期,深度融入全国数据要素统一大市场建设,积极打造全国重要的数据交易平台。一是优化数据运营体系。引导企业开展数据资源入表、数据资产评估,优化金融服务,为社会主体提供数据资产登记服务,发放数据资产登记证书。培育数据资产创新应用的市场体系,加强对数据资产主体、评估主体、专业服务机构的准入管理。二是设立数据资产创新应用的专业服务机构。鼓励成立数据银行、数据信托、数据券商等专营机构。支持郑州数据交易所设立专业的数据资产交易板块,建设数据资产流通、托管、处置有关基础设施。探索设立数据法院,确保资产隔离和重组流通的有效性。三是加快数据要素市场与金融、商品、资本市场互联互通。稳妥推动数据交易所与证券交易所、期货交易所、银行等成熟的金融市场实现连接,探索将数据资产创新应用有关工作与标准化金融工具相结合,推动数据要素市场化配置改革。四是培育数据要素市场发展生态。深化河南省数据要素市场培育城市试点工作,推广数据要素市场城市运营中心模式,建设城市数据专区,尽快实现地市数据运营的市场化落地、场景化开发,服务全省数字经济发展。
(四)完善基础设施,优化发展环境
进一步完善数据基础设施建设,为数据要素的开发和利用提供良好环境。一是完善算力基础设施。前瞻谋划和系统布局新型算力基础设施体系,统筹推进通用算力、智能算力、超级算力基础设施建设,加快打造先进算力设施集群。对接融入国家“东数西算”战略布局和全国一体化算力网,强化先进算力、绿色电力基础设施协同规划布局,积极承接东部地区中、高时延业务需求,努力打造全国重要的算力高地。二是加快建设安全可信的数据基础设施。发展数据空间、高速数据库,推动匿名化、联邦学习、多方安全计算等隐私计算功能和区块链技术应用,增强数据利用可信、可控、可计量的能力,让公共数据“流得动”。搭建新型数据服务网络,充分利用现有标识解析体系等网络设施,构建数据标识体系,培育基于数据标识的数据资源目录、数据模型共享库、数据交互中间件、数字钱包等数据产品。
(作者:王梁,省发展战略和产业创新研究院高级经济师 )
编辑:付婷