Leijun

3 months ago
zh
Samples
1Default Sample
系统使用LLM的少样本学习能力,根据环境观察生成初始任务指令。具体实现中,研究团队设计了一个两阶段的提示模板:首先提供2-3个示例,展示如何从环境观察生成任务指令;然后给出当前环境的观察结果,要求LLM生成相应的指令。例如,在Webshop环境中,一个典型的提示模板包括
Description
Total Likes
0
Mark Count
0
Shared Count
0
Task Count
1