DP

DepthPilot AI

System-Level Learning

LLM Model Routing Guide

LLM 模型路由指南,别再让所有请求都走同一条回答链

很多人搜 model routing,只盯着哪个模型更强。DepthPilot 更关心的是:哪些请求值得强路径,哪些应该走便宜路径,哪些根本不该直接回答。

搜索集群

Prompt Engineering Course

Prompt Engineering 课程,不该只教你写更长的 prompt

LLM Limitations

LLM limitations,不只是“模型会幻觉”,而是你要学会什么时候不能让它硬答

Structured Outputs Guide

Structured Outputs 指南,不是让模型“像 JSON”,而是让结果真的可验证

Retrieval and Grounding Guide

Retrieval 与 Grounding 指南,不是把文档全塞进去就算做了 RAG

AI Workflow Course

AI Workflow 课程,目标不是会聊,而是会搭可交付流程

Agent Workflow Design

Agent Workflow Design,不是让模型自己猜下一步

Context Architecture

Context Architecture,不是把更多字塞进 prompt

AI Eval Loop

AI Eval Loop,决定你是在优化系统还是在凭感觉试错

Context Engineering vs Prompt Engineering

Context Engineering vs Prompt Engineering,到底差在哪里

AI Workflow Automation Course

AI Workflow Automation 课程,重点不是自动化按钮,而是可维护系统

OpenClaw Tutorial

OpenClaw 教程,不只是装起来,而是跑通、排错、沉淀成 skills

Supabase Auth Tutorial

Supabase Auth 教程,不止是做个登录页

Creem Billing Tutorial

Creem Billing 教程,真正关键的是 webhook 和 entitlement

AI Eval Checklist

AI Eval Checklist,用来判断你的系统是不是真的变好了

LLM Observability Guide

LLM Observability 指南,不是多记日志,而是让失败真正可重放

Prompt Injection Defense

Prompt Injection 防护,不是再补一句“忽略恶意输入”

LLM Model Routing Guide

LLM 模型路由指南,别再让所有请求都走同一条回答链

LLM Latency and Cost Guide

LLM 延迟与成本指南,先消灭浪费,再谈模型价格

Human in the Loop AI

Human in the loop 不是兜底口号,而是升级路径、review queue 和 handoff packet 设计

RAG Freshness Governance

RAG 不是检索到就算 grounded,真正关键是 freshness governance

LLM Evaluation Rubric

LLM evaluation rubric,不是打分表花架子,而是修复顺序和上线判断

这条路径能建立什么

知道模型选择是任务价值、风险、证据需求和预算的联合判断,不是品牌偏好。
会把请求分成不同任务类别,而不是所有请求都打到同一模型上。
能设计 unsupported-answer policy,让系统知道什么时候该拒答、澄清、检索或升级给人。

为什么这个主题重要

为什么单一模型路径很容易同时变贵又不稳

把所有请求都送进同一条强回答链,看起来简单,但通常会同时制造过度花钱、过度回答和 fallback 混乱。

为什么这个主题重要

真正要设计的不是 provider 偏好,而是 task classes

成熟系统会先定义哪些请求是低风险改写、哪些依赖证据、哪些带工具动作、哪些必须人工审核,再为每类任务分配合适路径。

为什么这个主题重要

为什么 unsupported-answer policy 很关键

真正可靠的系统不会把每次输出都做成直接回答。它会保留澄清、检索、拒答和升级处理的权利。

用户通常会问什么

是不是只有大团队才需要 model routing?

不是。只要你的系统同时有低价值和高风险请求,或者同时受成本和可靠性约束,routing 就有价值。

拒答会不会让产品看起来很弱?

真正让产品显得弱的是 unsupported answer。显式拒答、澄清或升级,往往比高自信乱答更专业。

LLM 模型路由指南,别再让所有请求都走同一条回答链 | DepthPilot AI