RAG 不是检索到就算 grounded,真正关键是 freshness governance
很多团队把 RAG 做成“能搜到一些文档”,然后就默认系统有了可靠知识。DepthPilot 关心的是:这些文档谁负责、多久过期、版本怎么治理、过时了怎么办。
搜索集群
Prompt Engineering Course
Prompt Engineering 课程,不该只教你写更长的 prompt
LLM Limitations
LLM limitations,不只是“模型会幻觉”,而是你要学会什么时候不能让它硬答
Structured Outputs Guide
Structured Outputs 指南,不是让模型“像 JSON”,而是让结果真的可验证
Retrieval and Grounding Guide
Retrieval 与 Grounding 指南,不是把文档全塞进去就算做了 RAG
AI Workflow Course
AI Workflow 课程,目标不是会聊,而是会搭可交付流程
Agent Workflow Design
Agent Workflow Design,不是让模型自己猜下一步
Context Architecture
Context Architecture,不是把更多字塞进 prompt
AI Eval Loop
AI Eval Loop,决定你是在优化系统还是在凭感觉试错
Context Engineering vs Prompt Engineering
Context Engineering vs Prompt Engineering,到底差在哪里
AI Workflow Automation Course
AI Workflow Automation 课程,重点不是自动化按钮,而是可维护系统
OpenClaw Tutorial
OpenClaw 教程,不只是装起来,而是跑通、排错、沉淀成 skills
Supabase Auth Tutorial
Supabase Auth 教程,不止是做个登录页
Creem Billing Tutorial
Creem Billing 教程,真正关键的是 webhook 和 entitlement
AI Eval Checklist
AI Eval Checklist,用来判断你的系统是不是真的变好了
LLM Observability Guide
LLM Observability 指南,不是多记日志,而是让失败真正可重放
Prompt Injection Defense
Prompt Injection 防护,不是再补一句“忽略恶意输入”
LLM Model Routing Guide
LLM 模型路由指南,别再让所有请求都走同一条回答链
LLM Latency and Cost Guide
LLM 延迟与成本指南,先消灭浪费,再谈模型价格
Human in the Loop AI
Human in the loop 不是兜底口号,而是升级路径、review queue 和 handoff packet 设计
RAG Freshness Governance
RAG 不是检索到就算 grounded,真正关键是 freshness governance
LLM Evaluation Rubric
LLM evaluation rubric,不是打分表花架子,而是修复顺序和上线判断
这条路径能建立什么
为什么这个主题重要
为什么做了 retrieval 还会稳定答错
因为 retrieval 只能从现有文档里选,不能替你判断哪些文档已经过时、哪些只是草稿、哪些不该再出现在回答里。
为什么这个主题重要
真正让 grounded 成立的是什么
不是“带了引用”,而是文档有 metadata、有 version、有 owner、有 review cadence,并且 workflow 对 stale evidence 有明确处理方式。
为什么这个主题重要
DepthPilot 怎么把它做成可实操的课
我们会要求用户真的建立 freshness register、refresh policy 和 stale-content triage,而不是把 freshness 停在口头提醒。
接下来去哪
用户通常会问什么
引用文档就等于 grounded 吗?
不等于。引用只能说明“引用了什么”,不能说明这份内容是不是当前有效、是不是正式版本。
最先该治理什么?
先定义 source class、owner、review date 和 expiry threshold,再决定 stale evidence 出现时系统怎么反应。