国家数据局:分三类建设高质量数据集赋能AI发展

责任编辑:王鹤迦 2025.04.30 08:04 来源:通信世界网

通信世界网消息(CWW)数据是训练AI能力的“原料”之一。在第八届数字中国建设峰会29日举行的“高质量数据集和数据标注”主题交流活动上,由国家数据局指导的全国数据标准化技术委员会提出,将强化标准引领,分三类建设高质量数据集。

一类为“通识数据集”,包含面向社会公众、无需专业背景即可理解的通用知识,主要用于支撑通用模型落地应用。

一类为“行业通识数据集”,包含面向行业从业人员、需要一定专业背景才能理解的行业领域通用知识,主要用于支撑行业模型落地应用。

一类为“行业专识数据集”,包含面向特定业务场景相关人员、需要较深的专业背景才能理解的行业领域专业知识,主要用于支撑业务场景模型落地应用。简单举例,互联网百科、问答等为“通识数据集”;行业研究机构报告等为“行业通识数据集”;医院科室特定疾病病例等为“行业专识数据集”。

国家数据局相关负责人表示,从发展趋势来看,人工智能模型对数据集的需求正从“通用知识”向“专业知识”延伸拓展,经过专家精细化标注的数据集已成为AI价值实现过程中不可或缺的基石,下一步将积极引导做好高质量数据集和数据标注建设工作,为人工智能技术创新和产业应用提供坚实的数据基础。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容