在一项进展中,谷歌DeepMind的研究人员推出了FunSearch,这是一种人工智能(AI)模型,能够解决以前被认为无法解决的复杂数学问题。根据发表在《自然》杂志上的一篇论文,这一突破标志着大型语言模型(LLM)首次被用于揭示一个长期存在的科学难题的解决方案,提供了以前未知的可验证且有价值的新信息。
与法学硕士产生投机内容的传统观念相反,FunSearch挑战了这种观念。这一创新工具表明,在适当的指导和选择性的方法下,法学硕士确实可以有所发现。继alphatensensor加速计算和AlphaDev优化关键算法之后,FunSearch延续了DeepMind在基础数学和计算机科学领域利用人工智能取得的一系列成就。
与它的前辈不同,FunSearch采用了一种独特的方法,将一个名为cody的大型语言模型与其他系统结合起来,这些系统可以拒绝错误的答案,并将有效的答案整合回过程中。由谷歌DeepMind研究副总裁Pushmeet Kohli领导的研究团队采用了一种试错法,允许FunSearch为最初用Python概述的问题提供代码解决方案。
FunSearch过程包括cody提出代码来完成程序,第二个算法检查和评分建议。最好的想法,即使最初不是正确的,也会反馈给cody,创造一个持续的改进循环。在无数的建议和多次重复之后,FunSearch成功地生成了代码,为帽集问题(一个纯数学中的复杂问题)提供了一个正确的、以前未知的解决方案。
帽集问题涉及到图论中确定一个特定集合的最大大小,它的解决方案多年来一直困扰着数学家。FunSearch生成可理解和人类可解释代码的能力使其与众不同,为在各种问题解决领域利用大型语言模型的力量提供了一个有前途的范例。
FunSearch的多功能性通过将其应用于垃圾箱打包问题进一步得到了证明,这是一个具有挑战性的数学任务,在计算机科学中也有应用。FunSearch不仅找到了解决方案,而且超越了人类设计的方法,展示了它在各种问题解决方案中的潜力。
虽然数学家们承认需要谨慎地将大型语言模型整合到研究工作流程中,但FunSearch的成功代表了利用人工智能有效解决复杂问题的重要一步。