第一章:大模型集成概述
什么是大语言模型?
大语言模型(LLM)是基于 Transformer 架构的深度学习模型:
- 海量参数:数十亿到数千亿参数
- 预训练:在大规模文本数据上训练
- 涌现能力:展现出意想不到的能力
- 通用性:可处理多种任务
主流大模型(2025-2026)
国际模型
| 模型 |
公司 |
特点 |
适用场景 |
| GPT-5.4 |
OpenAI |
综合能力最强 |
复杂任务、专业工作 |
| GPT-5.4 mini |
OpenAI |
性价比高 |
编程、子代理任务 |
| Claude Opus 4.6 |
Anthropic |
长文本、安全、代码 |
企业应用、复杂推理 |
| Claude Sonnet 4.6 |
Anthropic |
平衡性能与成本 |
通用场景 |
| Gemini 2.5 Pro |
Google |
多模态、长上下文 |
多模态应用 |
| Llama 4 |
Meta |
开源、可商用 |
私有部署 |
国内模型
| 模型 |
公司 |
特点 |
适用场景 |
| DeepSeek-V3.2 |
深度求索 |
性价比极高、代码强 |
成本敏感场景 |
| DeepSeek R1 |
深度求索 |
推理能力强 |
复杂推理任务 |
| 通义千问 Qwen3 |
阿里巴巴 |
多模态、企业级 |
企业应用 |
| 智谱 GLM-4 |
智谱AI |
开源、学术强 |
学术研究 |
| Kimi k2 |
月之暗面 |
超长文本 |
文档分析 |
API 调用方式
OpenAI 格式(行业标准)
大多数大模型 API 都兼容 OpenAI 格式:
from openai import OpenAI
client = OpenAI(
api_key="your-api-key",
base_url="https://api.openai.com/v1" # 不同厂商修改此地址
)
response = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[
{"role": "user", "content": "你好"}
]
)
print(response.choices[0].message.content)
流式输出
stream = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[{"role": "user", "content": "写一首诗"}],
stream=True
)
for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")
价格对比(2026年3月)
国际模型
| 模型 |
输入价格 |
输出价格 |
特点 |
| GPT-5.4 |
$2.50/1M |
$15.00/1M |
最强能力 |
| GPT-5.4 mini |
$0.75/1M |
$4.50/1M |
性价比高 |
| GPT-5.4 nano |
$0.20/1M |
$1.25/1M |
最便宜 |
| Claude Opus 4.6 |
$5.00/1M |
$25.00/1M |
最强推理 |
| Claude Sonnet 4.6 |
$3.00/1M |
$15.00/1M |
平衡选择 |
| Claude Haiku 4.5 |
$1.00/1M |
$5.00/1M |
快速响应 |
国内模型
| 模型 |
输入价格 |
输出价格 |
特点 |
| DeepSeek Chat |
¥1/1M |
¥2/1M |
极致性价比 |
| DeepSeek Reasoner |
¥4/1M |
¥16/1M |
推理模型 |
| 通义千问 |
¥0.5/1M |
¥2/1M |
企业优惠 |
价格优化技巧
- 使用缓存:OpenAI/DeepSeek 支持 Prompt Caching,缓存命中后价格降低 75%
- 选择合适模型:简单任务用 mini/nano,复杂任务用旗舰
- 使用 Batch API:异步批处理可节省 50%
- 国内模型:DeepSeek 价格是 GPT-4 的 1/50
模型选型建议
| 场景 |
推荐模型 |
理由 |
| 复杂推理 |
GPT-5.4 / Claude Opus |
能力最强 |
| 代码生成 |
GPT-5.4 mini / DeepSeek |
性价比高 |
| 成本敏感 |
DeepSeek Chat |
价格最低 |
| 长文本分析 |
Kimi / Claude |
支持 100K+ 上下文 |
| 多模态 |
GPT-5.4 / Gemini |
图片/视频理解 |
| 私有部署 |
Llama 4 / Qwen |
开源可商用 |
小结
本章学习了:
- ✅ 大语言模型概念
- ✅ 2025-2026 主流大模型对比
- ✅ API 调用方式(OpenAI 格式)
- ✅ 最新价格对比
- ✅ 模型选型建议
下一章
第二章:OpenAI 集成 - 学习 OpenAI GPT-5.4 系列模型使用。