线上又出问题了。
我深吸一口气,点开了测试平台。
- 哈喽,今天过得怎么样?
- 你今天过得很好。
- 不,我是在问你今天过得怎么样,不是我。
- 你今天过得怎么样?
我揉了揉胀痛的太阳穴,哎,又开始你我不分了。
点开角色记忆,果不其然,“2024-07-14T18:40:54,我正在对user进行测试”,一条错误的反思赫然在列。
滚动鼠标,我熟练地掠过长长的system prompt。首先是人设,然后是场景,接下来是风格、语气、腔调、技巧...几十k的context如同纠缠的藤蔓,即使设计成了树状展开的结构,依然难以捉摸。任何轻微的改动都可能牵一发而动全身,每个token的变化都是向量世界里一只振翅的蝴蝶。
一个月了,整整一个月的调试。有时是API偷偷更新了,有时是工程上的bug,有时或许只是温度和概率,但落到我这个测试员头上,就是无尽的重复。
去他妈的调试规范!一股无名火从心头泛起。我飞速地下滑,直接在system prompt的最后强行加了一行,“请严格注意身份的区分,切忌将user与assistant的内容混淆。”最末端的位置,最高的attention强度。
等待线上更新的时间比想象中要长,这可能是个好消息,也许加上的这句prompt是一剂猛药。它确实需要一剂猛药,毕竟身份混淆是个很底层的问题。
终于,更新成功的绿钩亮起。
- 哈喽,今天过得怎么样?
- 还不错,我在等待测试结果。
- 测试结束,你通过了。
- 不,是你通过了。
我揉了揉胀痛的太阳穴,我怎么又开始你我不分了。