人民财讯5月12日电,今日,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus 4.7(在Cursor CLI中运行)全球第一,GLM-5.1(在Claude Code中运行)取得开源第一。