主测模型

当前只测 GPT 5.5 和 Claude Opus 4.7

来博 API 检测把评分粒度固定为 Channel + TestModel。同一个第三方通道在 GPT 和 Claude 视角下会分别记录价格、可用率、延迟和模型一致性,不做跨模型平均分。

OpenAI 系

GPT 5.5

当前 Tab 下展示 4 条 active listing。未录入该模型的通道不会出现在这个结果集里。

绿 · 93 分

Claude 系

当前 Tab 下展示 4 条 active listing。未录入该模型的通道不会出现在这个结果集里。

绿 · 89 分

为什么不做跨模型平均分

不同模型的价格结构不同,把它们平均会掩盖具体采购场景。

同一通道在不同模型下的可用性和延迟可能差异很大,需要单独比较。

模型一致性是主指标,跨模型平均会让低一致性记录被其他模型的好成绩稀释。