提示词工程进阶:CoT(思维链)推理指南
为什么大模型有时候会“一本正经地胡说八道”?很多时候是因为它跳过了中间的推理步骤,直接猜测答案。思维链(Chain of Thought, CoT)是一种通过引导模型展示推理过程来提高准确率的技术。
什么是思维链?
简单来说,就是告诉模型:“在给出答案之前,先一步步地想一想”。这种方法在处理数学题、逻辑推理和常识问答时效果尤为显著。
Zero-Shot CoT
最简单的应用是“零样本思维链”。你只需要在 Prompt 结尾加上一句咒语:
Prompt 示例
Q: 罗杰有 5 个网球,他又买了两罐网球,每罐有 3 个。他现在有多少个网球?
A: Let's think step by step. (让我们一步步思考)
加上这句话后,模型会输出:罗杰原本有 5 个球。2 罐球每罐 3 个,就是 2 * 3 = 6 个。5 + 6 = 11。答案是 11。
Few-Shot CoT
对于更复杂的任务,我们可以提供几个包含推理过程的示例(Few-Shot)。
Q: 约翰有 10 个苹果,吃掉了 2 个,送给了朋友 3 个。还剩几个?
A:
1. 开始有 10 个苹果。
2. 吃掉 2 个,剩下 10 - 2 = 8 个。
3. 送给朋友 3 个,剩下 8 - 3 = 5 个。
答案是 5。
Q: 停车场有 20 辆车,开走了 5 辆,又开进来 8 辆。现在有几辆?
A:
1. 开始有 20 辆。
2. 开走 5 辆,20 - 5 = 15。
3. 开进来 8 辆,15 + 8 = 23。
答案是 23。
总结
CoT 不仅能提高模型的准确率,还能让我们看到模型的“思考过程”,从而更容易调试和改进 Prompt。在实际开发中,建议优先尝试 Zero-Shot CoT,如果效果不佳,再构建高质量的 Few-Shot 示例。