您提到的世界数字科学院(WDTA)发布的《AI智能体运行安全测试标准》确实是一个重要的里程碑。这个全球首个单智能体运行安全测试标准由蚂蚁集团、清华大学、中国电信等多家机构联合编制,它标志着AI安全领域的一个新进展。
该标准的核心在于:
1. 全链路风险分析框架:首次将输入输出、大模型、RAG(检索增强生成)、记忆和工具五个关键链路与运行环境对应起来,构建了全链路风险分析框架。
2. 细分智能体风险类型:对智能体风险进行了细分,并提出了模型检测、网络通信分析和工具模糊测试等测试方法。
3. 伦理与责任:WDTA执行理事长李雨航强调,AISTR系列标准试图将伦理与责任嵌入AI的全生命周期之中,确保技术发展服务于人类的长期利益。
4. 统一的安全测试标准:蚂蚁集团大模型数据安全总监杨小芳提到,当前AI技术应用加速落地,但缺乏统一的全链路安全测试标准,这个标准的制定是AI治理的“最小可行单元”。
5. 全流程管理方案:与其他国际标准不同,AISTR不仅关注风险识别和风险分级,更提供从数据治理到模型落地的全流程管理方案,并配套具体测试工具和认证流程。
6. 跨领域应用:部分标准的测评与认证已在金融、医疗等领域落地应用。
此外,WDTA之前已经发布了包括“生成式人工智能应用安全测试标准”、“大语言模型安全测试方法”和“大模型供应链安全要求”在内的3项AI STR标准,这些标准由多家单位的专家学者共同参与制定。
这些标准的发布和实施,对于推动AI技术的健康发展、确保其安全性和可靠性具有重要意义,也为全球AI智能体生态的安全、可信和可持续发展提供了有益的探索和实践。