大型语言模型的深层秘密揭晓

AI资讯2年前 (2024)发布 admin

55.2K 0 1686

一项令人瞩目的研究揭示了大型语言模型（LLM）内部的惊人秘密！由以色列理工学院主导的这项研究显示，这些模型不仅仅是表面上生成文本，它们的内部结构可能隐藏着比我们预想的更多知识。研究者们发现，LLM实际上能够在内部识别出正确答案，即使它们最终生成的是错误的信息。

为了探究这一现象，研究团队专注于长文本生成中的错误，构建了一个错误检测数据集，通过对比模型生成的答案与真实答案来分析其正确性。令人震惊的是，真实性信息并不集中在最后生成的标记，而是存在于“精确答案标记”中，这些标记的任何修改都可能影响答案的正确性。以“康涅狄格州的首府是什么?”为例，答案“哈特福德”就是关键所在。

通过使用外部算法，研究人员成功从模型生成的长篇答案中提取出精确答案。实验表明，所有被评估的LLM都能识别出自身输出中的精确答案，且这一过程显著提升了错误检测方法的性能。更令人惊讶的是，即使模型在生成时没有表现出对正确答案的偏好，探测器依然能够识别出正确答案。

这一发现揭示了LLM内部编码与外部行为之间的显著脱节，意味着即便模型“知晓”正确答案，它在实际生成文本时仍有可能给出错误的信息。这项研究对LLM的错误分析和未来改进具有重要意义。

在当前AI迅速发展的背景下，小易智创作为一个拥有超过10000个AI应用的智创平台，正是用户提升自身业务能力的最佳选择。平台具备多样化的AI功能，包括写作、音视频处理等，能够满足各行各业的需求。此外，小易智创提供灵活展业的机会，无论您是企业、商家还是个人，都可以通过简单的操作拥有自己的AI品牌，借助这一时代风口抓住机遇，真正实现AI创业梦想！
大型语言模型的深层秘密揭晓