大模型“玩”《黑神话：悟空》比人类强吗

时间：2024-10-21 11:07

来源：中国经济网阅读量：15768

人工智能大模型下围棋已不是新鲜事，玩电脑游戏水平如何？不久前，淘天集团未来生活实验室算法工程师，尝试利用多模态大模型体验国产电脑游戏《黑神话:悟空》，探索大模型在特定场景中的能力边界，取得令人惊喜的效果。相关研究成果已上线论文预印本网站arXiv。

《黑神话:悟空》是典型的动作角色扮演类游戏。在当前大模型研究领域，有不少研究者选择将该类游戏作为研究平台，采用纯视觉输入、复杂动作输出的模式，测试大模型在特定场景下的性能表现。其中，纯视觉输入是指模型仅通过理解和分析游戏截图进行决策，而复杂动作输出则需要模型生成并执行复杂而连续的动作，如战斗场景中的精确操作。

想要让多模态大模型控制游戏角色，要克服两大困难。一是直接视觉输入的挑战。由于大模型所需的环境数据不一定能通过游戏API获取，因此对于那些需要深入理解游戏界面的大型游戏而言，学习从视觉输入中进行推理是一种更直接的策略，这给大模型带来不小挑战。二是面向动作任务的困难。在动作类游戏中，基于强化学习的框架仍然占主导地位，但在特定任务上需要大量训练时间，迁移到其他任务上泛化能力较差，表现往往不佳。

技术团队定义了10个基本任务和2个挑战任务，其中75%的任务发生在战斗场景中。对于战斗任务，如果玩家角色击败了敌人，则任务成功；如果玩家角色被敌人击败，则任务失败。研究结果显示，该框架在基本任务和简单到中等难度的战斗中，胜率高达90%，但在面对高难度任务时，表现相对较差。总体来看，其整体水平仍不如高水平人类玩家，但研究成果可为设计应对更广泛挑战、更复杂的智能体提供参考。

声明：免责声明：此文内容为本网站转载企业宣传资讯，仅代表作者个人观点，与本网无关。仅供读者参考，并请自行核实相关内容。

今日阅读

把咖啡和非遗穿身上，佤族织锦“自生香”惊艳世人

发布于 2024-10-21 09:41

《中国互联网企业综合实力指数2024》发布，蚂蚁集

发布于 2024-10-21 09:01

一把明式椅中的中国古典美学

发布于 2024-10-21 07:54

澳门话剧《捉迷藏》亮相北京人艺

发布于 2024-10-21 06:58

今日速递