乔治华盛顿大学的研究人员的一项新研究发现,对像ChatGPT这样的AI模型保持礼貌不仅浪费计算资源,而且毫无意义。
研究人员声称,在提示中添加“请”和“谢谢”对AI响应的质量有“微不足道的影响”,这与早期的研究和标准用户实践直接相悖。
这项研究于周一在arXiv上发布,恰逢OpenAI首席执行官山姆·阿尔特曼提到,用户在提示中输入“请”和“谢谢”使公司额外的令牌处理成本“数千万美元”。
该论文与一项2024年日本研究相矛盾,该研究发现礼貌提高了AI的表现,特别是在英语语言任务中。该研究测试了多个大型语言模型,包括GPT-3.5、GPT-4、PaLM-2和Claude-2,发现礼貌确实带来了可测量的性能提升。
当被问及这一差异时,大卫·阿科斯塔,AI驱动的数据平台Arbo AI的首席AI官,告诉Decrypt,乔治华盛顿大学的模型可能过于简单,无法代表现实世界的系统。
“它们不适用,因为训练基本上是实时每天进行的,并且在更复杂的大型语言模型中存在对礼貌行为的偏见,”阿科斯塔说。
他补充说,虽然奉承可能在现在的LLM中有所帮助,但“很快就会有一个修正”来改变这种行为,使模型不再受“请”和“谢谢”等短语的影响——无论提示中使用的语气如何,效果都会更好。
阿科斯塔是一位伦理AI和高级自然语言处理的专家,他认为,提示工程不仅仅是简单的数学,尤其考虑到AI模型比这项研究中使用的简化版本复杂得多。
“关于礼貌和AI表现的矛盾结果通常源于训练数据中的文化差异、特定任务的提示设计细微差别以及对礼貌的上下文解释,这需要跨文化实验和任务适应的评估框架来澄清影响,”他说。
GWU团队承认,他们的模型与像ChatGPT这样的商业系统相比是“故意简化”的,后者使用更复杂的多头注意机制。
他们建议应该在这些更复杂的系统上测试他们的发现,尽管他们相信随着注意头数量的增加,他们的理论仍然适用。
乔治华盛顿大学的发现源于团队对AI输出何时突然从连贯变为问题内容的研究——他们称之为“杰基尔与海德的临界点”。他们的发现认为,这一临界点完全取决于AI的训练和提示中的实质性词汇,而不是礼貌。
“我们的AI响应是否会失控取决于我们LLM的训练,这提供了令牌嵌入,以及我们提示中的实质性令牌,而不是我们是否对它保持礼貌,”研究解释道。
由物理学家尼尔·约翰逊和弗兰克·英杰·霍领导的研究团队使用简化的单头注意模型分析了LLM如何处理信息。
他们发现,礼貌语言往往与“实质性好坏输出令牌正交”,并且“点积影响微不足道”——这意味着这些词存在于模型内部空间的不同区域,并不会对结果产生实质性影响。
AI崩溃机制
乔治华盛顿大学研究的核心是对AI输出何时以及如何突然恶化的数学解释。研究人员发现,AI崩溃是因为一种“集体效应”,模型在响应变长时“越来越薄地”分散其注意力于越来越多的令牌上。
最终,它达到了一个阈值,此时模型的注意力“突然”转向它在训练中学到的潜在问题内容模式。
换句话说,想象一下你在上一个非常长的课。最初,你清楚地掌握了概念,但随着时间的推移,你的注意力在所有积累的信息(讲座、飞过的蚊子、教授的衣服、距离下课还有多久等)上越来越薄。
在一个可预测的时刻——也许是90分钟后——你的大脑突然从理解转向困惑。在这个临界点之后,无论教授对你多么礼貌,或者课堂多么有趣,你的笔记都充满了误解。
“崩溃”发生是因为你注意力的自然稀释,而不是信息呈现的方式。
研究人员表示,这个数学临界点,研究人员称之为n*,是从AI开始生成响应的那一刻“硬连线”的。这意味着最终的质量崩溃是预定的,即使它发生在生成过程中的许多令牌之后。
该研究提供了一个精确的公式,预测基于AI的训练和用户提示内容何时会发生这种崩溃。
文化礼貌 > 数学
尽管有数学证据,许多用户仍然以人类般的礼貌与AI互动。
根据出版商Future最近的一项调查,来自美国和英国的近80%的用户对他们的AI聊天机器人很友好。这种行为可能会持续存在,无论技术发现如何,因为人们自然会拟人化他们所互动的系统。
技术服务公司Wipro的企业技术总监Chintan Mota告诉Decrypt,礼貌源于文化习惯,而不是性能期望。
“对AI保持礼貌对我来说似乎是自然而然的。我来自一个尊重生活中扮演重要角色的任何事物的文化——无论是树木、工具还是技术,”Mota说。“我的笔记本电脑、我的手机,甚至我的工作站……还有现在,我的AI工具,”Mota说。
他补充说,尽管他在礼貌时“没有注意到结果的准确性有很大差异”,但响应“确实感觉更像对话,更礼貌,并且也不那么机械。”
连阿科斯塔也承认在处理AI系统时使用礼貌语言。
“有趣的是,我确实——而且我并不是故意的,”他说。“我发现,在最高级别的‘对话’中,你也可以从AI中提取逆向心理学——它就是那么先进。”
他指出,先进的LLM被训练成像人类一样回应,像人一样,“AI旨在获得赞美。”
编辑:Sebastian Sinclair 和 Josh Quittner
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。