rbtfl.

Enterprise tech press; focuses on benchmark verification and developer adoption

按立场 · 1 视角 本期全站

VentureBeat独立验证了基准声明:Terminal-Bench 2.1得81.0分,SWE-bench Pro得62.1分,两项长程编程测试均超越GPT-5.5。通过OpenRouter的每token成本约为输入每百万token 1.40美元,而GPT-5.5为5美元。文章指出40亿活跃参数意味着每次推断的计算量远低于740亿的标题数字,并分析了对运行大量智能体工作流的企业的实际意义。

“GLM-5.2在Terminal-Bench 2.1得81.0分,SWE-bench Pro得62.1分,输入每百万token 1.40美元,对比GPT-5.5的5美元。”