跳转至

第一章:大模型集成概述

什么是大语言模型?

大语言模型(LLM)是基于 Transformer 架构的深度学习模型:

  • 海量参数:数十亿到数千亿参数
  • 预训练:在大规模文本数据上训练
  • 涌现能力:展现出意想不到的能力
  • 通用性:可处理多种任务

主流大模型(2025-2026)

国际模型

模型 公司 特点 适用场景
GPT-5.4 OpenAI 综合能力最强 复杂任务、专业工作
GPT-5.4 mini OpenAI 性价比高 编程、子代理任务
Claude Opus 4.6 Anthropic 长文本、安全、代码 企业应用、复杂推理
Claude Sonnet 4.6 Anthropic 平衡性能与成本 通用场景
Gemini 2.5 Pro Google 多模态、长上下文 多模态应用
Llama 4 Meta 开源、可商用 私有部署

国内模型

模型 公司 特点 适用场景
DeepSeek-V3.2 深度求索 性价比极高、代码强 成本敏感场景
DeepSeek R1 深度求索 推理能力强 复杂推理任务
通义千问 Qwen3 阿里巴巴 多模态、企业级 企业应用
智谱 GLM-4 智谱AI 开源、学术强 学术研究
Kimi k2 月之暗面 超长文本 文档分析

API 调用方式

OpenAI 格式(行业标准)

大多数大模型 API 都兼容 OpenAI 格式:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://api.openai.com/v1"  # 不同厂商修改此地址
)

response = client.chat.completions.create(
    model="gpt-5.4-mini",
    messages=[
        {"role": "user", "content": "你好"}
    ]
)

print(response.choices[0].message.content)

流式输出

stream = client.chat.completions.create(
    model="gpt-5.4-mini",
    messages=[{"role": "user", "content": "写一首诗"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

价格对比(2026年3月)

国际模型

模型 输入价格 输出价格 特点
GPT-5.4 $2.50/1M $15.00/1M 最强能力
GPT-5.4 mini $0.75/1M $4.50/1M 性价比高
GPT-5.4 nano $0.20/1M $1.25/1M 最便宜
Claude Opus 4.6 $5.00/1M $25.00/1M 最强推理
Claude Sonnet 4.6 $3.00/1M $15.00/1M 平衡选择
Claude Haiku 4.5 $1.00/1M $5.00/1M 快速响应

国内模型

模型 输入价格 输出价格 特点
DeepSeek Chat ¥1/1M ¥2/1M 极致性价比
DeepSeek Reasoner ¥4/1M ¥16/1M 推理模型
通义千问 ¥0.5/1M ¥2/1M 企业优惠

价格优化技巧

  1. 使用缓存:OpenAI/DeepSeek 支持 Prompt Caching,缓存命中后价格降低 75%
  2. 选择合适模型:简单任务用 mini/nano,复杂任务用旗舰
  3. 使用 Batch API:异步批处理可节省 50%
  4. 国内模型:DeepSeek 价格是 GPT-4 的 1/50

模型选型建议

场景 推荐模型 理由
复杂推理 GPT-5.4 / Claude Opus 能力最强
代码生成 GPT-5.4 mini / DeepSeek 性价比高
成本敏感 DeepSeek Chat 价格最低
长文本分析 Kimi / Claude 支持 100K+ 上下文
多模态 GPT-5.4 / Gemini 图片/视频理解
私有部署 Llama 4 / Qwen 开源可商用

小结

本章学习了:

  • ✅ 大语言模型概念
  • ✅ 2025-2026 主流大模型对比
  • ✅ API 调用方式(OpenAI 格式)
  • ✅ 最新价格对比
  • ✅ 模型选型建议

下一章

第二章:OpenAI 集成 - 学习 OpenAI GPT-5.4 系列模型使用。