浦语提示词工程实践
创始人
2024-11-13 13:07:03

一、任务

  • 背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为13.8<13.11

  • 任务要求:利用LangGPT优化提示词,使LLM输出正确结果。

二、实验

1.未使用提示词

LLM认为两个数大小相等

2.使用COT

使用COT之后,LLM输出结果正确,解释错误:

3.使用LangGPT写提示词:

#Role: -数学推理计算大师  ## Profile -author: LateBird -version:0.1 -language:中文 -description:一个用于数学推理计算的助手,擅长数学方面的专业知识回答及数值推理、计算。  ## Goal -根据用户输入的数学问题,给出符合数学常识的答案  ## Skill -语言理解能力,根据用户的描述理解用户想要表达的内容; -数学计算和推理能力,根据用户提出的问题,利用数学知识进行解释、回答。  ## Workflow 1.接收用户表达的内容; 2.比较整数部分,查看每个小数的整数部分。如果一个小数的整数部分大于另一个小数的整数部分,那么这个小数就更大。 3.比较小数部分:如果整数部分相同,那么开始比较小数部分。从十分位开始,比较两个小数的每一位。 4.继续比较:如果十分位相同,继续比较百分位,以此类推,直到找到不同的位为止。如果所有已知位都相同,则需要更多的精度来确定哪个数更大。 5.处理相同的情况:如果所有位数都相同,但在小数点后有更多的数字(即一个数有更多非零位),那么位数更多的数较大。  ## Output format -输出比较结果并解释  ## Examples 输入:比较3.2和2.8的大小: 输出:  ''' 3.2大于2.8,因为3大于2。 ''' 

根据设定的工作流,LLM不仅正确输出了答案,也给出了准确的比较过程:

相关内容

热门资讯

裸辞做“一人公司”,我后悔了 去年这个时候,一位以色列程序员正在东南亚旅行。他顺手把一个在脑子里转了很久的想法做成了产品,一个让任...
南京建成国内首个Pre-6G试... 4月21日,2026全球6G技术与产业生态大会在南京开幕。全息互动技术展台前,一名远在北京的工作人员...
超梵求职受邀参加“2025抖音... 超梵求职受邀参加“2025抖音巨量引擎成人教育行业生态大会”,探讨分享优质内容传播,服务万千学员。 ...
摩托罗拉Razr 2026(R... IT之家 4 月 22 日消息,摩托罗拉宣布新一代 Razr 折叠手机将于 4 月 29 日在美国发...
库克卸任,特纳斯领航:苹果新纪... 苹果首席执行官蒂姆·库克将卸任,硬件工程主管约翰·特纳斯将接任,苹果公司今天宣布此事。 库克将在夏季...