下载中心

📖 模型配置参考

代码设计师 —— 模型路由策略、模型池配置与服务端 API 对接

🔀 模型路由策略

基于任务特性自动路由到最优模型,在成本、速度和精确度之间找到平衡。

决策维度路由逻辑示例
语言中文提问/中文代码 → 优先国产模型(千问、DeepSeek);英文/多语言 → Claude、GPT中文 Bug 修复 → deepseek-chat
代码类型前端/样式 → Claude (Sonnet);后端/架构 → GPT-4o 或 DeepSeek;全栈 → Sonnet 或 GPT-4oUI 调整 → claude-3.5-sonnet
推理强度需要深度分析(等级 2+)→ 优先思维链模型(DeepSeek-R1、Gemini Thinking)根因分析 → deepseek-reasoner
上下文长度超过 32K → Gemini 1.5 Pro (200K) 或 GPT-4o (128K)全项目诊断 → gemini-1.5-pro
速度要求实时操作(等级 0)→ 快速模型(Haiku、Flash、qwen-turbo)格式化文本 → gemini-1.5-flash
成本预算紧张 → 国产模型或 4o-mini;重要任务 → 高端模型日常修复 → qwen-plus
🗂️ 分级模型池配置

为每个质量等级配置模型池,根据任务特性自动路由到最佳模型。

等级 0 – 纯机械操作

模型适合场景特点
gemini-1.5-flash英文环境、非中文文本处理极速、超低延迟
qwen-turbo中文文本格式化、简单翻译中文优秀、成本低
deepseek-chat简单脚本执行、文件复制等性价比高、代码基础好
gpt-4o-mini多语言混合环境OpenAI 生态、兼容性好
混合策略

按源语言自动选择,中文优先 qwen-turbo,英文优先 gemini-1.5-flash;若有代码片段则用 deepseek-chat。

等级 1 – 标准任务(默认)

模型适合场景特点
claude-3.5-sonnet前端/全栈开发、复杂工具调用编码最强、工具编排优秀
gpt-4o后端开发、多步骤任务推理全面、上下文 128K
deepseek-chat中文项目、成本敏感场景国产第一梯队、代码能力强
qwen-max中文复杂业务逻辑中文理解力顶级
混合策略

默认主力:claude-3.5-sonnet(处理大部分编码任务)。中文任务或国内 API:自动切换 deepseek-chat 或 qwen-max。超长上下文需求:任务描述超过 32K 时选用 gpt-4o。高并发或预算限制:降级至 deepseek-chat 或 qwen-max。

等级 2 – 深度分析/修复

模型适合场景特点
deepseek-reasoner (R1)复杂根因分析、逻辑推理思维链模式、逐步推理
claude-3.5-sonnet架构诊断、跨模块分析分析质量高、安全保守
gpt-4o长上下文全局分析128K 上下文、可加载整个模块
gemini-2.0-flash-thinking多模态分析(如图表、日志截图)推理+视觉、适合混合输入
混合策略

首选推理模型:deepseek-reasoner 进行步进式诊断。若推理失败或需外部知识:退至 claude-3.5-sonnet 或 gpt-4o。涉及大量日志/截图:调用 gemini-2.0-flash-thinking 进行多模态分析。

等级 3 – 战略/重构

模型适合场景特点
claude-3-opus安全关键决策、架构选型最保守、幻觉率最低
gemini-1.5-pro全栈代码库分析(200K+)超长上下文、可加载整个项目
gpt-4o多方案对比、重构计划均衡能力、极长上下文
deepseek-reasoner需要严格推理链的重大决策可审计的推理过程
混合策略

决策生成:双模型并行,claude-3-opus 和 gemini-1.5-pro 同时输出方案,由 PM 融合。长上下文加载:优先 gemini-1.5-pro 读取全项目代码。逻辑自洽检查:将方案输入 deepseek-reasoner 验证逻辑漏洞。降级保障:任一模型不可用时,gpt-4o 作为通用替代。

📋 实施建议
步骤说明
定义模型组每个等级一个模型组,列出候选模型及优先级
路由规则基于 task_description 的语言检测、关键词和上下文长度动态选择模型
Fallback 链若首选模型超时或返回错误,自动尝试下一个候选
成本控制统计每个等级的平均花费,必要时调整候选顺序
🔌 服务端 API 对接

多语言服务端接入模型配置服务接口,向客户端提供可用的 AI 模型列表及其配置信息。

接口概述

🎯

接口功能

该接口用于向客户端提供可用的 AI 模型列表及其配置信息,包括 API 地址、认证密钥、模型限制等。

📋

适用场景

  • 用户身份验证
  • 模型配置信息获取
  • API 密钥分发
  • 模型能力查询

数据结构规范

响应根对象

字段名类型必填说明
statusstring请求状态,成功时必须为"ok"
dataobject包含 token 和 models 列表的数据对象

Data 对象结构

字段名类型必填说明
tokenstring认证令牌,用于后续请求的身份验证
modelsarrayModel 对象的数组

Model 对象结构

字段名类型必填说明
apistring模型服务的 API 地址
typestring模型类型标识符
namestring模型的显示名称
keystring调用该模型所需的密钥
textstring模型的文本标识
levelnumber模型等级(整数)
maxTokensnumber模型支持的最大上下文长度

请求规范

请求信息

  • 方法:POST
  • URL:/api/user/login
  • Content-Type:application/json

请求参数

  • Username (string, 必填) - 用户名(首字母大写)
  • password (string, 必填) - 密码(全小写)
  • method (string, 必填) - 固定为"Login"
{ "Username": "admin", "password": "123456", "method": "Login" }

响应规范

成功响应(200 OK)

失败响应(400 Bad Request)

// 成功响应示例 { "status": "ok", "data": { "token": "your_generated_jwt_or_token_string", "models": [ { "api": "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions", "type": "qwen", "name": "qwen-plus", "key": "sk-your-actual-api-key-here", "text": "qwen-plus", "level": 0, "maxTokens": 256000 } ], "v-models": [ { "api": "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions", "type": "qwen", "name": "qwen-vl-plus", "key": "sk-your-actual-api-key-here", "text": "qwen-vl-plus", "level": 0, "maxTokens": 256000 } ] } } // 失败响应示例 { "status": "error", "message": "Invalid username or password" }

开发实现指南

🔷

.NET (C#) 实现

  • 使用 ASP.NET Core Web API
  • 通过 Controller 处理请求
  • 利用内置 JSON 序列化
  • 注意字段命名约定
🐘

PHP 实现

  • 使用 Slim 或 Laravel 框架
  • 通过 php://input 获取原始请求数据
  • 使用 json_decode/json_encode 处理 JSON
  • 设置正确的 Content-Type 头

Java (Spring Boot) 实现

  • 使用 @RestController 注解
  • 通过 @RequestBody 接收 JSON 参数
  • 利用 Spring 的自动序列化功能
  • 注意字段的 getter/setter 方法

测试用例

// 正常场景 - 输入 { "Username": "testuser", "password": "testpass", "method": "Login" } // 正常场景 - 预期输出 { "status": "ok", "data": { "token": "valid_token_string", "models": [{ "api": "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions", "type": "qwen", "name": "qwen-plus", "key": "sk-test-key", "text": "qwen-plus", "level": 0, "maxTokens": 256000 }] } } // 异常场景 - 输入 { "Username": "wrong", "password": "wrong", "method": "Login" } // 异常场景 - 预期输出 { "status": "error", "message": "Invalid credentials" }

部署注意事项

🔒 安全加固措施

使用 HTTPS 加密所有通信,对密码进行哈希存储,实施密钥轮换策略,定期进行安全审计。API 密钥不应硬编码在代码中。

⚡ 性能优化建议

使用连接池管理数据库连接,对频繁访问的数据进行缓存,异步处理耗时操作,优化数据库查询语句。