Qwen3.5 综合能力跑分对比
Qwen3.5
GPT-5.2
Claude 4.5
MMLU-Pro
知识推理
Qwen3.5
87.8
GPT-5.2
86.5
GPQA
博士级难题
Qwen3.5
88.4
Claude 4.5
87.9
AIME 2026
数学竞赛
Qwen3.5
91.3
GPT-5.2
96.7
Claude 4.5
93.3
IFBench
指令遵循
Qwen3.5
76.5
GPT-5.2
75.4
Claude 4.5
58.0