Model Comparison

按性能、功能和定价比较 AI 模型

模型比较表

高级模型

模型
提供商
上下文窗口
输入价格*
输出价格*
最适合

Claude Sonnet 4.5

Anthropic

1M tokens

$3-6

$15-22.50

可靠的工具使用、复杂代码库

GPT-5

OpenAI

400K tokens

$1.25

$10

最新的 OpenAI 技术、三种模式

Gemini 2.5 Pro

Google

1M+ tokens

TBD

TBD

大型代码库、文档分析

Qwen3 Coder

多个

256K tokens

$0.20

$0.80

编码任务、开源灵活性

*每百万 tokens

预算模型

模型
提供商
上下文窗口
输入价格*
输出价格*
备注

DeepSeek V3

DeepSeek

128K tokens

$0.14

$0.28

日常编码的绝佳价值

DeepSeek R1

DeepSeek

128K tokens

$0.55

$2.19

预算推理冠军

Qwen3 32B

多个

128K tokens

不同

不同

开源、多个提供商

Z AI GLM 4.5

Z AI

128K tokens

TBD

TBD

MIT 许可、混合推理

*每百万 tokens

性能比较

速度与质量权衡

优先级
推荐模型
原因

速度

Cerebras 上的 Qwen3 Coder

可用的最快推理

质量

Claude Sonnet 4.5

对复杂任务最可靠

平衡

DeepSeek V3

低成本的良好质量

工具可靠性

按工具使用可靠性排序的模型:

  1. Claude Sonnet 4.5 - 最可靠的工具执行

  2. GPT-5 - 优秀但偶尔有格式问题

  3. Gemini 2.5 Pro - 适合标准工具

  4. DeepSeek V3 - 对基本工具可靠

  5. Qwen3 变体 - 复杂工具可能需要重试

成本计算器

典型任务成本

任务类型
Token 使用量(平均)
Claude Sonnet
DeepSeek V3
差异

简单 Bug 修复

5K tokens

$0.05

$0.001

便宜 50 倍

功能实施

50K tokens

$0.50

$0.01

便宜 50 倍

大型重构

200K tokens

$2.00

$0.04

便宜 50 倍

月度预算估算

预算
Claude 使用
DeepSeek 使用
混合策略

$10/月

~20 个功能

~1000 个功能

计划:DeepSeek、执行:Claude

$50/月

~100 个功能

~5000 个功能

关键:Claude、其余:DeepSeek

$100/月

~200 个功能

~10000 个功能

复杂:Claude、简单:DeepSeek

提供商比较

提供商功能

提供商
可用模型
计费
API 稳定性
支持

Cline

多个

基于积分

应用内

Anthropic

仅 Claude

基于使用量

邮件

OpenRouter

100+ 个模型

基于使用量

Discord

OpenAI

仅 GPT

基于使用量

论坛

本地

开源

免费

N/A

社区

提供商选择指南

根据以下选择提供商:

  • 简单性:Cline(无需 API 密钥管理)

  • 多样性:OpenRouter(访问所有模型)

  • 直接访问:单个提供商(Anthropic、OpenAI)

  • 隐私:Ollama 或 LM Studio(本地模型)

社区使用统计

来自 Cline 社区的实时使用数据:

Last updated