Guide · 使用教程
DeepSeek API 接入教程:从免费 Chat 到低成本模型调用
这篇教程讲清楚 DeepSeek 的实用接入流程:选择 Chat 或 API、创建 Key、兼容 OpenAI SDK、选择模型、控制 token 成本,并规划模型迁移。
这篇教程会完成什么
这篇教程面向想试用 DeepSeek 的普通用户和开发者。你会理解什么时候用免费 Chat,什么时候用 API;如何用兼容 OpenAI SDK 的方式接入;以及如何控制 token 成本、选择模型和避免后续迁移风险。
DeepSeek 的价值主要体现在两端:普通用户可以免费体验中文问答和推理;开发者可以用较低成本接入大模型能力。如果你只是想偶尔问问题,Chat 就够了。如果你要把模型接进应用、自动化流程或内部工具,就需要 API。
开始前需要准备
你需要准备三个东西:DeepSeek 账号、API Key、一个可以运行代码的项目环境。如果只是体验 Chat,可以直接访问 chat.deepseek.com。如果要接入 API,需要进入 platform.deepseek.com 创建 Key,并确认当前模型名称和价格。
建议不要一开始就接到生产环境。先准备一个小脚本或测试项目,用 10 到 20 条真实业务样本测试输出质量、速度和成本。
第一步:先用 Chat 判断模型风格
在写代码前,先用 DeepSeek Chat 做几轮真实测试。不要只问“你好”或“写一首诗”,而要使用你真实业务里的样本。例如:
- 让它总结一篇中文长文。
- 让它把客服问题分类。
- 让它生成 FAQ。
- 让它解释一段报错日志。
- 让它改写一段营销文案。
这个阶段的目标是判断输出风格和能力边界。如果 Chat 的质量已经不能满足你的任务,API 接入也不会神奇解决问题。
第二步:创建 API Key 并配置 SDK
DeepSeek API 兼容 OpenAI SDK,因此迁移成本很低。Python 示例大致如下:
from openai import OpenAI
client = OpenAI(
api_key="你的 DeepSeek API Key",
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "你是一个严谨的中文内容助手。"},
{"role": "user", "content": "请把这段内容总结成 5 个要点。"}
]
)
print(response.choices[0].message.content)
实际模型名要以官方文档为准。DeepSeek 的模型 ID 可能会随版本调整,接入时不要只看旧教程。
第三步:选择模型
一般建议先用便宜、快速的模型处理大多数任务,再把复杂任务交给更强模型。
V4-Flash 适合日常聊天、批量摘要、分类、改写、客服问答和低成本任务。它的优势是便宜和吞吐高。V4-Pro 更适合复杂推理、代码、Agent、长链路任务和高质量输出。它更贵,但在复杂任务里更稳定。
不要只按模型名判断好坏。最可靠的方式是用你的真实样本跑一遍,比较准确率、格式稳定性、人工返工时间和最终成本。
第四步:控制 token 成本
DeepSeek 的成本优势很明显,但如果 prompt 写得很长、重复发送大量上下文,成本仍然会上升。建议从一开始就做三件事。
第一,固定 system prompt,不要每次拼接大量无关规则。第二,把长上下文拆成可复用的摘要或结构化字段。第三,记录每次调用的输入输出 tokens,按任务类型统计成本。
如果业务里有大量重复前缀,例如固定规范、固定示例和固定角色说明,注意利用缓存命中带来的成本优势。缓存是否有效取决于具体请求结构和官方实现,接入后要用日志验证。
第五步:处理模型迁移风险
AI 模型更新很快,DeepSeek 也不例外。旧模型 ID 可能映射到新模型,也可能在某个日期后退役。为了降低风险,不要在业务代码里到处硬编码模型名。
推荐做法是把模型名放进配置文件或环境变量,例如:
DEEPSEEK_DEFAULT_MODEL=deepseek-v4-flash
DEEPSEEK_REASONING_MODEL=deepseek-v4-pro
然后在代码里统一读取配置。这样官方调整模型时,你只需要改配置和测试,不用全项目搜索替换。
常见错误
第一个错误是只看价格,不看返工率。便宜模型如果输出格式不稳定,后续人工修复成本可能更高。
第二个错误是用太宽泛的 prompt。比如“帮我优化一下”不如“请把以下客服问题分类为退款、登录、价格、功能四类,并输出 JSON”。
第三个错误是不记录 token。没有日志,就不知道实际成本从哪里来。
第四个错误是不关注官方更新。模型名、价格、上下文和输出上限都可能变化,生产环境必须定期核对。
什么时候该换别的工具
如果你需要图片、语音、视频、办公套件集成或最成熟的消费者 AI 生态,ChatGPT 或 Gemini 可能更合适。如果你需要特别强的长文写作和安全边界,也可以对比 Claude。
如果你的需求是中文文本处理、低成本 API、大批量调用、代码辅助或自部署研究,DeepSeek 更值得优先测试。
FAQ
DeepSeek 接入的关键不是“换一个便宜模型”,而是建立一套可测试、可回滚、可统计成本的模型调用流程。先用真实样本验证,再小范围上线,最后逐步扩大调用量。
常见问题
- DeepSeek API 可以直接替换 OpenAI 吗?
- 很多基础聊天接口可以通过兼容 OpenAI SDK 的方式迁移,但模型名、参数、输出风格和边界仍需要测试。
- 应该先用 V4-Flash 还是 V4-Pro?
- 大多数低成本任务先用 V4-Flash;复杂推理、代码和高质量输出再测试 V4-Pro。
- DeepSeek 适合生产环境吗?
- 适合进入生产评估,但上线前要验证稳定性、延迟、成本、错误处理、合规和模型更新策略。