- 新增 GPT-5.4 深度解析文章,涵盖六大核心能力详解 - 添加 SVG 格式的 GPT-5.4 能力全景图 - 添加 Mermaid 格式的模型家族关系图 - 添加 GPT-5.4 六大能力思维导图 - 添加 Computer Use 工作流程图 - 添加 OSWorld 桌面操作基准测试图表 - 添加 上下文窗口演进对比图 - 添加 上下文压缩原理图 - 添加 Tool Search 机制对比图 - 添加 可配置推理深度图 - 添加 GDPval 对比图表 - 添加 三方模型对比图 - 添加 API 定价对比图 - 添加 Mermaid 配置文件和样式文件 - 添加模型选择指南 SVG 图片
55 lines
3.6 KiB
XML
55 lines
3.6 KiB
XML
<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 1200 700" font-family="'Inter', 'SF Pro', system-ui, sans-serif">
|
||
<title>GPT-5.4 能力全景:专业工作、编码、计算机操控、工具使用与长上下文</title>
|
||
<defs>
|
||
<linearGradient id="bg" x1="0%" y1="0%" x2="100%" y2="100%">
|
||
<stop offset="0%" stop-color="#040816"/>
|
||
<stop offset="100%" stop-color="#111827"/>
|
||
</linearGradient>
|
||
</defs>
|
||
|
||
<rect width="1200" height="700" fill="url(#bg)"/>
|
||
|
||
<text x="600" y="56" fill="#F8FAFC" font-size="32" font-weight="800" text-anchor="middle">GPT-5.4 能力全景</text>
|
||
<text x="600" y="84" fill="#94A3B8" font-size="15" text-anchor="middle">这不是常规升级,而是一次模型产品线的重置</text>
|
||
|
||
<g transform="translate(90,130)">
|
||
<rect width="1020" height="90" rx="16" fill="#0B172A" stroke="#22D3EE" stroke-opacity="0.45"/>
|
||
<text x="28" y="38" fill="#67E8F9" font-size="20" font-weight="800">1. 专业知识工作</text>
|
||
<text x="28" y="64" fill="#E0F2FE" font-size="14">GDPval 83.0%,投行建模 87.3%,演示文稿、文档、事实准确性均大幅超越 GPT-5.2。</text>
|
||
<text x="946" y="56" fill="#67E8F9" font-size="28" font-weight="800" text-anchor="end">83.0%</text>
|
||
</g>
|
||
|
||
<g transform="translate(130,250)">
|
||
<rect width="940" height="82" rx="16" fill="#0B1A16" stroke="#10B981" stroke-opacity="0.45"/>
|
||
<text x="28" y="35" fill="#6EE7B7" font-size="19" font-weight="800">2. 编码与智能体循环</text>
|
||
<text x="28" y="60" fill="#D1FAE5" font-size="14">SWE-Bench Pro 57.7%,与 GPT-5.3-Codex 持平,同时在研究和工具使用上覆盖面更广。</text>
|
||
<text x="866" y="53" fill="#6EE7B7" font-size="26" font-weight="800" text-anchor="end">57.7%</text>
|
||
</g>
|
||
|
||
<g transform="translate(170,360)">
|
||
<rect width="860" height="82" rx="16" fill="#1A1205" stroke="#F59E0B" stroke-opacity="0.45"/>
|
||
<text x="28" y="35" fill="#FCD34D" font-size="19" font-weight="800">3. 原生计算机操控</text>
|
||
<text x="28" y="60" fill="#FEF3C7" font-size="14">OSWorld-Verified 75.0%,支持基于截图的浏览器和桌面操作,通过 Computer Use API 实现。</text>
|
||
<text x="786" y="53" fill="#FCD34D" font-size="26" font-weight="800" text-anchor="end">75.0%</text>
|
||
</g>
|
||
|
||
<g transform="translate(210,470)">
|
||
<rect width="780" height="82" rx="16" fill="#111827" stroke="#818CF8" stroke-opacity="0.45"/>
|
||
<text x="28" y="35" fill="#C7D2FE" font-size="19" font-weight="800">4. 工具使用与 MCP</text>
|
||
<text x="28" y="60" fill="#E0E7FF" font-size="14">BrowseComp 82.7%,MCP Atlas 67.2%,支持大规模延迟工具目录的 Tool Search 机制。</text>
|
||
<text x="706" y="53" fill="#C7D2FE" font-size="26" font-weight="800" text-anchor="end">82.7%</text>
|
||
</g>
|
||
|
||
<g transform="translate(250,580)">
|
||
<rect width="700" height="82" rx="16" fill="#1A1020" stroke="#F472B6" stroke-opacity="0.45"/>
|
||
<text x="28" y="35" fill="#F9A8D4" font-size="19" font-weight="800">5. 长上下文与推理</text>
|
||
<text x="28" y="60" fill="#FBCFE8" font-size="14">上下文窗口 105 万 tokens,输出 12.8 万 tokens,但远端检索质量仍有下降。</text>
|
||
<text x="626" y="53" fill="#F9A8D4" font-size="26" font-weight="800" text-anchor="end">1.05M</text>
|
||
</g>
|
||
|
||
<path d="M600 220 L600 250" stroke="#22D3EE" stroke-width="2" stroke-dasharray="6 6" opacity="0.5"/>
|
||
<path d="M600 332 L600 360" stroke="#10B981" stroke-width="2" stroke-dasharray="6 6" opacity="0.5"/>
|
||
<path d="M600 442 L600 470" stroke="#F59E0B" stroke-width="2" stroke-dasharray="6 6" opacity="0.5"/>
|
||
<path d="M600 552 L600 580" stroke="#818CF8" stroke-width="2" stroke-dasharray="6 6" opacity="0.5"/>
|
||
</svg>
|