Learn Prompting

提示工程指南

😃 基础

🟢 使用 ChatGPT 进行提示

🟢 提示工程

🟢 学习提示嵌入

🟢 角色提示

🟢 多范例提示

🟢 组合提示

🟢 规范化提示

🟢 聊天机器人基础

🟢 Giving Instructions

🟢 大语言模型（LLMs）中的隐患

🟢 Priming Chatbots

🟢 理解人工智能思维

🟢 开始你的旅程

🟢 The Learn Prompting Method

💼 基础应用

🟢 数据结构化

🟢 学习工具

🟦 代码辅助

🟦 Digital Marketing

🟢 不同的书写风格

🟢 总结文本

🟢 电子邮件的 Zapier

🟢 多项选择题

🟢 解答讨论性问题

🟢 用GPT-3构建ChatGPT

🟢 聊天机器人 + 知识库

🧙‍♂️ 进阶

🟢 思维链提示过程

🟢 零样本思维链

🟦 知识生成

🟦 最少到最多提示过程

🟦 Dealing With Long Form Content

🟦 Revisiting Roles

🟢 提示的关键要素

🟢 OpenAI Playground

🟢 LLM Settings

🤖 代理

🟦 LLMs使用工具

🟦 具有推理和行动能力的LLMs

🟦 代码推理

⚖️ 可靠性

🟢 提示去偏差

🟦 提示多样性

🟦 Prompt Ensembling

🟦 大语言模型自我评估

校准大语言模型

🖼️ 图片提示词

🟢 样式修饰符

🟢 质量增强器

🟢 修复变形生成

🟢 Midjourney

🔓 破解提示

🔨 Tooling

💪 提示微调

可解释的软提示

🎲 杂项

🟢 检测的欺骗

🟢 检测AI生成的文本

🟢 音乐生成

📙 Vocabulary Reference

📚 Bibliography

📦 Prompted Products

🛸 Additional Resources

🔥 Hot Topics

🤖 代理🟦 具有推理和行动能力的LLMs

具有推理和行动能力的LLMs

🟦 This article is rated medium

Reading Time: 1 minute

Last updated on August 7, 2024

桑德·舒尔霍夫

ReAct(reason, act)是一种使用自然语言推理解决复杂任务的语言模型范例。ReAct旨在用于允许LLM执行某些操作的任务。例如，在MRKL系统中，LLM可以与外部API交互以检索信息。当提出问题时，LLM可以选择执行操作以检索信息，然后根据检索到的信息回答问题。

ReAct系统可以被视为具有推理和行动能力的MRKL系统，。

请查看以下图像。顶部框中的问题来自HotPotQA，这是一个需要复杂推理的问答数据集。 ReAct能够首先通过推理问题（Thought 1），然后执行一个动作（Act 1）来向Google发送查询来回答问题。然后它收到了一个观察（Obs 1），并继续进行这个思想，行动，观察循环，直到达到结论（Act 3）。

ReAct System (Yao et al.)

具有强化学习知识的读者可能会认为，这个过程类似于经典的RL循环：状态，行动，奖励，状态，...。ReAct在其论文中对此进行了一些规范化。

结论

谷歌在ReAct的实验中使用了PaLM LLM。与标准提示（仅问题）、CoT和其他配置进行比较表明，ReAct在复杂推理任务方面的表现是有希望的。谷歌还对涵盖事实提取和验证的Fever数据集进行了研究。

ReAct Results (Yao et al.)

Footnotes

Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., & Cao, Y. (2022). ↩
Yang, Z., Qi, P., Zhang, S., Bengio, Y., Cohen, W. W., Salakhutdinov, R., & Manning, C. D. (2018). HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering. ↩
Chowdhery, A., Narang, S., Devlin, J., Bosma, M., Mishra, G., Roberts, A., Barham, P., Chung, H. W., Sutton, C., Gehrmann, S., Schuh, P., Shi, K., Tsvyashchenko, S., Maynez, J., Rao, A., Barnes, P., Tay, Y., Shazeer, N., Prabhakaran, V., … Fiedel, N. (2022). PaLM: Scaling Language Modeling with Pathways. ↩
Thorne, J., Vlachos, A., Christodoulopoulos, C., & Mittal, A. (2018). FEVER: a large-scale dataset for Fact Extraction and VERification. ↩