DeepSeek 对比 Claude 3.5 Sonnet：我的真实看法

📅3 hours ago⏱2 min read

我以为我已经准备好迎接我的第一份自由职业工作了。直到我看到了 AI 的成本。

我原计划在为一个排名项目使用 Claude 3.5 Sonnet。看到定价后我慌了。顶级模型的输出 token 成本高达每百万个 10.00 美元。我的客户预算非常有限。我承担不起在 token 上挥霍的代价。

我寻找了替代方案，发现有很多选择。有些模型的成本仅为 0.01 美元，而有些则高达 3.50 美元。我意识到知名模型与廉价模型之间的差距其实很小。

以下是我找到的价格对比：

• DeepSeek V4 Flash：输入 $0.27 / 输出 $1.10 • DeepSeek V4 Pro：输入 $0.55 / 输出 $2.20 • Qwen3-32B：输入 $0.30 / 输出 $1.20 • GLM-4 Plus：输入 $0.20 / 输出 $0.80 • GPT-4o：输入 $2.50 / 输出 $10.00

GPT-4o 的价格大约是 DeepSeek V4 Flash 的十倍。但质量差异并没有达到十倍。基准测试显示，廉价模型与知名模型之间的差距仅在几个百分点之内。

如果你每月运行 100 万次排名调用：

• GPT-4o 每月成本为 3,250 美元。 • DeepSeek V4 Flash 每月成本为 355 美元。

你每个月可以节省 2,895 美元。

以下是我在测试这些模型时学到的五个经验：

使用缓存。如果 40% 的提示词是相同的，你就能节省 40% 的成本。
使用流式响应。用户更喜欢看到文字逐个出现，而不是盯着加载图标发呆。
根据任务匹配模型。将昂贵模型用于复杂的推理任务，将廉价模型用于简单的分类或排名任务。
手动监控质量。在关注成本的同时，也要追踪用户满意度。
构建回退机制。在代码中使用第二个模型，这样当 API 达到速率限制时，你的应用不会崩溃。

从低成本开始。对于批量任务，使用 DeepSeek V4 Flash 等模型。将昂贵模型留给对质量要求极高的任务。

来源：https://dev.to/gentleforge/deepseek-vs-claude-35-sonnet-my-honest-take-as-a-new-dev-166l

可选学习社区：https://t.me/GyaanSetuAi

DeepSeek 对比 Claude 3.5 Sonnet：我的真实看法

Continue reading

我如何通过这种 RAG 设置将 AI 成本降低 60%

我如何低成本构建 WordPress AI 聊天机器人

我将 Qwen 与 GPT-4o 进行了基准测试

𝗜 𝗥𝗮𝗻 𝟭𝟬 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗧𝗵𝗿𝗼𝘂𝗴𝗵 𝟱 𝗖𝗼𝗱𝗶𝗻𝗴 𝗧𝗮𝘀𝗸𝘀

你日常工作真的需要最先进的 AI 吗？