2024年7月,由科大讯飞股份有限公司主导,联合中国电子技术标准化研究院共同提出的国际标准 ISO/IEC 5259-4:2024《人工智能-分析和机器学习的数据质量-第4部分:数据质量过程框架》(Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 4: Data quality process framework)正式
发布。该标准也成为
首个由中国牵头的人工智能领域数据质量国际标准,标志着中国在全球AI领域数据标准化进程中迈出了坚实的一步。
该标准适用于监督学习、无监督学习、半监督学习、强化学习以及分析中所用数据的质量控制,为各类组织提供了通用方法和指南。这些指导原则覆盖了数据的全流程,如数据的获取、准备、标注、评估、使用等。
该标准于2020年8月获批立项,从工作组提案、技术委员会讨论、国家成员体投票、国际标准草案投票到批准出版印刷,历经了多次讨论和修改,最终于2024年7月由ISO/IEC正式
发布。
数据是新一代人工智能中最重要和最关键的基础要素之一,尤其是在现在生成式人工智能的浪潮下,数据质量的好坏直接影响着人工智能系统生成内容的质量和可信度。在人工智能技术创新和应用落地的过程中,科大讯飞一直高度重视数据治理,严格控制数据质量,以高质量数据驱动AI技术在更广泛领域的应用,促进AI产品和服务更可用、更可靠、更可信,为社会创造更多价值。
下一步,科大讯飞将充分发挥标准对人工智能发展的支撑引领作用,立足国内需求、兼顾国际趋势,以中国智慧推动全球人工智能产业高质量发展。