graph TB subgraph GPT54["🟢 GPT-5.4 领先"] G1["GDPval 知识工作 83.0%"] G2["OSWorld 桌面操控 75.0%"] G3["Terminal-Bench 终端 75.1%"] end subgraph Claude["🔵 Claude Opus 4.6 领先"] C1["SWE-Bench 代码修复 80.8%"] C2["MMMU Pro 视觉理解 85.1%"] C3["多文件重构 最佳体验"] end subgraph Gemini["🟡 Gemini 3.1 Pro 领先"] GE1["GPQA Diamond 科学推理 94.3%"] GE2["ARC-AGI-2 抽象推理 77.1%"] GE3["BrowseComp 网页浏览 85.9%"] end style GPT54 fill:#0d2137,stroke:#10a37f,color:#e0f7fa style Claude fill:#0d2137,stroke:#d97706,color:#e0f7fa style Gemini fill:#0d2137,stroke:#4285f4,color:#e0f7fa