市政务和数据局关于组织高质量数据集征集工作的通知20250519
市政务和数据局关于组织高质量数据集征集工作的通知
各有关单位:
根据省高质量数据集建设征集组织工作要求及我市高质量数据集建设推动需要,现在全市范围内组织高质量数据集征集工作,有关事项通知如下。
一、申报要求
请各单位组织本行业、本区域、本单位企事业单位梳理高质量数据集建设情况,积极开展推荐报送。征集数据集类型可分为通用数据集、行业数据集、场景数据集等,可包括结构化数据、文本、视频、音频、图像等单一模态或多种模态数据。申报的数据集应具有较高的应用价值,可供人工智能大模型和机器人开发训练,支持业务应用场景落地。数据集应具备定期更新机制,符合国家数据安全与合规相关要求。
二、申报时间及方式
请各申报单位于5月20日上午12:00前,将有关推荐材料正式报送我局(详见附件1-2)。纸质材料邮寄至市政务服务和数据管理局(深圳市福田区莲花街道福中三路市民中心C区1040,联系电话:0755-88127457),包括盖章纸质版一式两份和一份光盘(包含word可编辑版和盖章PDF版),并同步发送扫描件和电子版到指定邮箱xushaoqing@sz.gov.cn,电子版文件以“单位名称+高质量数据集”命名,邮件主题请注明“高质量数据集+推荐单位名称+联系人+联系电话”。申报单位涉及多个数据集的,每个数据集提交一份申报书。请各单位报送后持续做好相关数据集建设情况跟进和培育推动。
附件:1.广东省人工智能数据集申报书
2.广东省高质量数据集申报材料
深圳市政务服务和数据管理局
2025年5月16日
附件下载
附件 3
广东省高质量数据集申报材料
一、单位介绍(500字以内)
(介绍申报单位的具体情况,并提供单位营业执照以及信用中国网站截图。申报单位应在信用方面无不良记录,征集对象可同时申报多个数据集,涉及多家单位的,可根据实际情况联合申报。)
二、建设背景(300字以内)
(介绍数据集建设的行业背景及需求分析)
三、拟解决的关键问题(500字以内)
(介绍高质量数据集建设过程中存在的卡点、难点问题)
四、所采集的技术路线及建设方法(2000字以内)
(总结在高质量数据集建设所采取的技术路线和建设方法,建议通过架构图、流程图、模型图等配合描述)
5. 建设成效及主要创新点(800字以内)
(总结取得的经济效益和社会效益,以及数据集建设过程中的主要创新亮点,尽可能量化描述)
六、项目相关佐证材料说明
(包括技术路线、建设成效和申报表内容涉及的相关佐证材料)
广东省人工智能数据集申报书
名 称:XXXX
申报单位:XXXX
(盖章,支持多个单位联合申报)
2025 年 5 月 日
广东省高质量数据集申报表
案例名称 | |||||||||||
申报单位 信息 | 单位 (一) | 单位名称 | |||||||||
社会信用代码 | |||||||||||
通讯地址 | |||||||||||
单位性质 | £政府 £企业 £科研院所 £事业单位 £行业协会 £高校 £其他类型______________ | ||||||||||
数据管理能力 | DCMM评估:£暂未开展 £1级 £2级 £3级 £4级 £5级 其他情况说明__________________ | ||||||||||
数据安全能力 | DSMM评估:£暂未开展 £1级 £2级 £3级 £4级 £5级 其他情况说明__________________ | ||||||||||
负责人 | 职务 | 联系方式 | |||||||||
联系人 | 职务 | 联系方式 | |||||||||
单位 (二) | 单位名称 | ||||||||||
... | ... | ||||||||||
数据集 基本信息 | 类型 | £通用数据集 £行业数据集 £场景数据集 £其他____________ | |||||||||
规模 | _______________(单位:TB) | ||||||||||
模态 | £结构化数据 £文本 £视频 £音频 £图像 £其他_________ | ||||||||||
状态 | £在建 £已建 £新扩展 £其他__________________ | ||||||||||
数据集 应用信息 | 所属重点 行业领域 | £科学研究 £工业制造 £农业农村£智慧能源 £交通运输 £金融服务 £医疗卫生 £教育教学 £商贸流通 £人力资源 £文化旅游 £应急管理 £气象服务 £绿色低碳 £公共安全 £城市治理 口其他______________ | |||||||||
支撑人工智能算法模型训练 | (请填写申报数据集支撑人工智能算法、大模型名称及数量,若还没有明确的支撑应用,请填写“暂无”) | ||||||||||
交易流通情况 | (请说明申报数据集是否已在数据交易所上架交易,如有,请简要具体上架交易内容以及交易服务金额,并提供相关佐证材料) | ||||||||||
数据集 保障措施 | 敏感信息保护 | (请说明申报数据集是否涉及国家秘密、个人敏感信息,如有,请简要描述敏感信息保护的具体措施,并提供相关佐证材料) | |||||||||
安全风险评估 | (请说明是否有对数据集建设过程及内容开展安全风险自评估或第三方评估,如有,请简要描述安全风险评估的过程及成效,并提供相关佐证材料) | ||||||||||
质量管控策略 | (请说明是否有对数据集开展质量管控措施以及评估策略,如有,请简要描述数据集质量控制的过程及成效,并提供相关佐证材料) | ||||||||||
自主供给可控 | (请说明数据集的采集和处理过程能否实现自主供给,或存在外部数据断供断链风险) | ||||||||||
案例简介 及主要成效 | (请简单描述本次申报案例的简要描述,包括数据集建设目的、应用场景以及主要成效等) | ||||||||||
声明 | 1.我单位对本次申报的数据集合法性、真实性、完整性和有效性负责,与其他单位或个人无知识产权纠纷 2.经国家、省企业信用信息系统查询,本单位不是严重失信主体。 3.该数据集符合国家数据安全与合规相关要求,不包含违反社会主义核心价值观的内容。 |
市政务和数据局关于组织高质量数据集征集工作的通知-深圳政府在线_深圳市人民政府门户网站 https://www.sz.gov.cn/cn/xxgk/zfxxgj/tzgg/content/post_12180358.html