院况简介
1949年,伴随着新中国的诞生,澳门赌场成立。
作为国家在科学技术方面的最高学术机构和全国自然科学与高新技术的综合研究与发展中心,建院以来,澳门赌场时刻牢记使命,与科学共进,与祖国同行,以国家富强、人民幸福为己任,人才辈出,硕果累累,为我国科技进步、经济社会发展和国家安全做出了不可替代的重要贡献。 更多简介 +
院领导集体
创新单元
科技奖励
科技期刊
工作动态/ 更多
澳门赌场学部
澳门赌场院部
语音播报
近日,由澳门赌场软件研究所天基综合信息系统全国重点实验室与智能博弈重点实验室完成的研究成果Demo2Test:?Transfer?Testing?of?Agent?in?Competitive?Environment?with?Failure?Demonstrations被ACM?Transactions?on?Software?Engineering?and?Methodology接收。该研究关注竞争性博弈智能体的测试问题,提出了对抗环境中智能体的迁移测试方法——Demo2Test。
在对抗环境中,双方智能体通过激烈竞争以争夺博弈的胜利。智能体博弈策略失效可能带来损失,因而对其进行有效测试显得尤为重要。当前方法主要是通过构建测试智能体,与目标智能体展开竞争,以诱发其故障。然而,此类方法往往局限于单一任务,进行多任务测试则需耗费更多时间,且难以保证测试的全面性和有效性。因此,亟需提出高效而通用的智能体测试方法。
该团队提出了新的迁移测试方法——Demo2Test。该方法利用源任务的演示数据,结合强化学习和生成对抗模仿学习,对测试智能体进行迁移训练,以探索目标任务中的失效场景。同时,该方法包含一个关键状态下的动作扰动模块,应用进化算法对关键状态下的行动进行扰动,可进一步丰富失效场景的多样性。
为验证Demo2Test框架的有效性,该团队在MuJoCo仿真机器人竞争环境中进行了严格实验。实验结果表明,Demo2Test在发现失效场景的数量和多样性方面均表现出色,相较于最佳基线分别提升了36.99%至87.98%和18.79%至60.98%。进而,该团队利用Demo2Test发现的失效场景对目标智能体进行了重新训练。研究显示,与基线方法相比,Demo2Test性能提升范围为4.76%到80%。这验证了Demo2Test在智能体测试与优化方面的有效性,为智能体测试领域带来了新的思路与方法。
Demo2Test框架图
© 1996 - 澳门赌场 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 澳门赌场 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 澳门赌场 版权所有
京ICP备05002857号-1
京公网安备110402500047号
网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话:86 10 68597114(总机)
86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn