腾讯网易游戏市场份额_腾讯网易强势加入,桌面游戏用户留存超越休闲游戏,新世代游戏由AI助手引领,速看
文 | 娱乐资本论 林书2024年,AI正在游戏行业中逐步深入,触及游戏机制的核心大家熟悉的《沙威玛传奇》,更多的是通过AI提升制作效率,降低成本而在后来的《1001夜》、《换你来当爹》等游戏中,AI成为了游戏的核心玩法。
最近,依托大型企业的《永劫无间》《暗区突围》等游戏中的AI技术又向前迈进了一步,试图成为玩家在游戏中的“助手”、“队友”与腾讯、网易制作的游戏内AI队友不同,上个月,一款名为“桌崽AI”的桌面陪伴宠物风靡一时,在传统桌宠的外表下,它真正做到了理解玩家、理解游戏,并在游戏中提供了实际的帮助(如查找攻略、实时聊天)。
从功能性角度来看,这与当年游戏语音助手YY有些相似在内测一个月的时间里,桌崽AI的总注册用户超过了1万,日活跃用户超过3000,付费率超出了预期。

留存率也很高,次日留存率为63%,7日留存率为29%,30日留存率为22%,平均每日使用时间为237分钟这个数据甚至超过了许多国内大厂的大模型产品要知道,根据之前流传的一张统计数据图表,国产AI大模型用户的30日后使用率通常很低,从字节跳动的豆包到百度的文心一言(现更名为文小言),30日后使用率都低于1%。

问题来了,为何AI布局了众多赛道,唯独在游戏赛道取得了显著的成功?原因在于,游戏从业者对科技感兴趣,同时对AI助手的需求强烈,而这种盲点和痛点,正是目前AI在其他领域较少触及,且具有一定门槛的部分AI助手,或许将成为AI领域竞争的新关键点。
01 跨次元的碰撞桌崽AI的研发团队是来自国内的公司脸谱心智,该公司成立于去年6月创始人Adam是一位95后的游戏玩家,本科和研究生均毕业于帝国理工学院在创业前,他曾在亚马逊和微软工作过,对聊天机器人颇有研究。
由于创始人及其团队都热衷于游戏,因此桌崽AI在推出时,就具备了其他同类产品较少见的优势——对当前主流游戏的高度兼容目前,桌崽AI已适配了《黑神话·悟空》、《原神》、《绝区零》、《鸣潮》等20多款游戏

只要开启游戏,桌崽AI就会出现在屏幕上陪伴玩家玩家可以通过文字或语音与桌崽进行实时互动然而,仅仅做到“陪伴”,还不足以让它脱颖而出正如前所述,其核心亮点在于“理解游戏”、“理解玩家”,这主要体现在两个方面:其一,桌崽AI不仅能够读懂游戏的画面和内容,还能根据玩家的行为做出针对性的反馈。
例如,如果玩家表现优异,它会夸赞玩家;如果玩家失误,它也会用幽默的语言调侃。

第二个方面是,它在理解游戏的基础上,还能实时提供游戏攻略,帮助玩家解决卡关的问题这样一来,玩家就不用再在游戏时切换回桌面,打开浏览器去各类网站、论坛搜攻略,桌崽就能站在旁边告诉玩家怎么通关除了这些核心功能外,桌崽还能通过生成式AI,根据玩家的喜好,定制出各种不同的外形和声音,这种个性化的特性,进一步增强了玩家的黏性。
然而,这样的功能看似简单,但实现起来其实有一定的技术门槛。

具体而言,这些门槛包括:多模态游戏陪玩大模型——让AI“理解游戏”;二次元视频生成大模型——自定义外观;语音声线定制大模型——自定义声音(语音克隆等);其中,多模态游戏陪玩大模型是其与游戏结合的关键所在。
按脸谱心智的介绍,该模型的工作机制是,经过用户授权后,模型将游戏画面、音效以及带有各种情绪的声音作为输入,从而提供与游戏进度同步的个性化反馈

从技术角度来看,关于游戏知识性方面的信息,模型可以通过吸收各种来源的资料(如游戏介绍、攻略)来让自己“精通”不同的游戏但最大的难点在于,如何在理解各种不同模态的输入(画面、声音)的同时,还能做到实时反馈?。
这就涉及到了一个非常重要的技术——多模态融合从某种程度上说,这是决定未来大模型在游戏领域广度和深度的重要技术02 会看、会听的AI队友多模态技术之所以在游戏AI的下一阶段如此重要,主要是因为,在之前的结合了LLM的游戏,如《1001夜》等作品中,AI的作用始终局限于“对话”这一单一框架。
这种限制使得AI在游戏中只能提供对话选项和简单的互动,而无法深入到其他方面而通过对不同模态的数据进行特征提取,游戏中的AI助手可以将原始数据转化为模型可以处理的数值表示,同时将异构特征投影到公共子空间,使得具有相似语义的多模态数据通过相似向量表示,从而使AI理解不同模态的信息。

实际上,这种多模态的思路,已经成为AI+游戏的一个潜在发展方向今年英伟达展示的名为G-Assist的游戏助手项目中,这个由RTX驱动的AI助手,通过分析玩家的语音或文本指令以及游戏界面截图,提供实时攻略等相关帮助。
这与桌崽AI的一些思路颇为相似。

G-Assist的核心技术在于其AI视觉模型,通过集成先进的AI视觉模型,G-Assist能够实时分析游戏窗口中的视觉信息,例如识别屏幕上出现的敌对NPC,或推荐优选武器和材料收集方法除了“会看”之外,这类多模态融合技术的另一个挑战是如何实现实时游戏中的低延迟语音互动。
最理想的状态是,玩家能像平时说话那样,与AI助手进行即时交流,这考验的是AI“会听”的能力今年5月的开发者大会上,微软推出了Copilot+ PC,一款为AI时代而生的全新PC,其同样具备在游戏中充当AI助手的能力。
例如,在《我的世界》的视频演示中,通过集合Open AI的GPT-4模型,Copilot能够实时分析游戏画面内容,并根据不同情境、场景,以各种语调、语气与玩家交流当玩家成功躲避敌人的追击后,Copilot会发出喘息声并祝贺玩家成功找到庇护所。

这种实时的、低延迟的语音交互,背后依托的技术大致可以分为两种:一种是传统的,以神经网络为基础的文本转语音(Text-to-Speech)技术,也称为TTS;另一种是端到端的,GPT-4所展现的那种实时语音技术。
从技术能力上看,后者的要求更高,但效果也远优于前者这是因为,传统的TTS合成通常需要先将文本转换为语音,其输出往往存在一定的延迟,这种差距,在某些竞技类、动作类等需要快速反应的游戏里会显得尤为突出

更重要的是,由于整合了意图理解、自然语言处理等环节,端到端的语音大模型不仅能做到“如真人般丝滑”,还能根据不同情境实时调整语气、语调而传统TTS要达到这点,只能预先进行人为设置在具备了“会看”、“会听”的能力后,LLM在游戏中的定位不再仅限于单纯的对话NPC,甚至不再局限于能实时交互的AI助手,对于一些更有野心的游戏大厂来说,这种多模态技术的成熟,成为在AI时代重构自身护城河的新手段。
03 Agent技术,让AI胜似真人在打破“对话”这一框架的局限后,AI助手在游戏中能做什么?网易在《永劫无间》中给出的答案是:一个能听懂语音指令,实现自动跑图、搜集物资,配合战斗的智能化AI队友。

【星界云手机】,给你不一样的游戏体验!云端托管手游,挂机脚本助力,让你无需手动操作,轻松完成日常任务,同时享受游戏的乐趣。释放双手,让你更专注于游戏策略,成为游戏中的高手!
6月19日,《永劫无间》手游在“定胜终测”中引入了全新的“游戏Copilot”功能依托先进的LLM技术,为玩家提供了一个胜似真人的AI队友这个AI队友有多智能?举例来说,在战斗中,玩家若说“给我来点药”,AI队友立即跑到玩家身边提供相应的道具。

同样地,在战斗中,AI队友不仅能指哪儿打哪儿,也会通过自主判断战场局势优化决策,打造出与真人队友组队开黑一致的默契体验。

有时候,对于一些具体的道具搜寻,AI队友也能有求必应。

除了基本的战斗、搜寻指令外,AI队友还会主动搭话,聊天,在战斗之余缓解氛围,为玩家提供情感陪伴的价值。

总的来说,这个AI队友能跑图、搜物资、战斗、辅助救援,与玩家实时语音聊天,真人队友能做到的一切,它几乎全做到了而要实现这一切,网易靠的正是前面提到的多模态识别、实时语音交互等技术具体来说,这个AI队友不仅能听懂玩家的话(语音识别)、观察战场局势(视觉信息输入)、了解地图和英雄技能(游戏机制学习),甚至借助诸多高手的大数据学会了如何打好永劫手游。

但除了多模态之外,要打造这样的智能化AI队友,还有一块最重要的拼图:AI Agent技术这是因为,多模态+LLM的组合虽然解决了AI队友看、听、理解和交流的问题,但要真正让其成为游戏中的得力助手,它必须会亲自操作游戏。
这背后靠的正是AI Agent技术与传统依靠预设程序执行固定操作的NPC不同,Agent技术赋予了AI队友更高的灵活性和自主性,这是因为Agent技术让AI队友具备了“自主规划”与“自我操作”的能力

在AI领域,Agent指的是能够感知环境、做出决策并执行行动的系统,能够在复杂多变的环境中独立完成任务实际上,早在《永劫无间》的AI队友出现前,业内就已经对Agent+游戏的方向进行了一些探索例如,网易自身有一个叫网易数智的AI平台,提供MMO、SLG等游戏类型的AI对手。
还有今年3月,Google的DeepMind公布了一项关于新型AI智能体SIMA的开创性研究,旨在让智能体能够理解并执行多种游戏环境中的自然语言指令。

让SIMA在游戏中执行操作,只需要两个输入:屏幕上的图像和用户提供的自然语言指令在测试中,SIMA在九种不同的游戏上进行了训练和测试,包括《无人深空》和《拆解》,并在其中进行了驾驶飞船、挖矿、砍树等一系列操作。
通过从不同的游戏世界中学习,SIMA捕捉了图像、语言与游戏玩法行为之间的联系这样的联系来自游戏过程中收集的大量数据,例如屏幕上的画面、音效、文字说明,甚至鼠标和键盘的操作记录之后,收集的数据集被用于训练预先设定的模型,以适应不同的游戏场景和任务。

从玩法机制上来说,AI Agent技术在游戏领域的介入几乎是必然的,因为有许多游戏都存在需要复杂规划和多个子任务才能完成的目标,例如“寻找资源并建立营地”等而这类融合了多模态、Agent等技术的游戏尝试,在发展到一定阶段后,必定会出现某个成熟的“集大成者”。
例如,《暗区突围》中的AI队友就是一个例子04 更高的壁垒,更高的体验今年8月的科隆游戏展上,腾讯魔方工作室分享了自主研发的最新AI技术——F.A.C.U.L.这是由魔方工作室联合暗区突围项目团队,推出的全球首个语音指挥FPS AI,应用了最先进的生成式AI技术,包括语音输入、大语言模型、实时语音合成和环境识别等。

所谓的F.A.C.U.L.,实际上是一系列核心功能的集合,目的是使AI表现得更像人类队友具体来说,它包括了:Complex Command Recognition(复杂指令识别):这个功能意味着AI可以理解玩家下达的复杂命令,使其能够识别和执行多步指令,适应不同的战术需求。
Tactic Execution(战术执行):指AI具备执行战术操作的能力,比如掩护、包抄、进攻等AI不再是简单地跟随玩家或进行基础攻击,而是能够参与到更复杂的战术中Object Identification(物体识别):这意味着AI可以识别场景中的特定物体,比如敌人、掩体、道具等。
这种识别能力是执行任务和战术的基础,帮助AI在复杂环境中做出合适的决策Human-Like Interaction(类人交互):旨在让AI在行为上更加接近人类,AI会表现出类似人类的反应,增强游戏的沉浸感。

虽然与《永劫无间》中的AI队友一样,《暗区突围》的F.A.C.U.L.也结合了多模态、Agent等技术,但从复杂度和要求上来说,其比前者更上了一个台阶这主要是因为,《暗区突围》中的道具、武器、场景更多、更复杂,战斗中需要执行的战术也更多样化、更充满变数。
例如,“F.A.C.U.L.”将允许AI角色识别多达1.7万个游戏物品,包括建筑物、武器、地表。魔方工作室称它们甚至能识别“一根草”。
在具体战斗中,玩家还可以对AI队友下达一系列连续的、复杂的指令,而AI队友在执行这些指令时,不仅能准确理解其含义,还能知道指令中提到的“沙袋”、“汽车”究竟在哪在执行指令时,F.A.C.U.L.首先会对环境进行多模态输入,建立一个包含敌我位置、障碍物、目标物体等要素的“局势地图”。
之后,当玩家发布“清理房间并守住出口”这样的复合命令时,AI队友就会通过Agent的任务分解与多步骤执行能力,将其分解为多个步骤:首先清理敌人,然后搜索物资,最后在出口守卫。
这种多阶段任务分解与执行能力是Agent技术中“自主规划”的重要环节,也是F.A.C.U.L.这类AI高效、灵活地完成任务的关键05 结语可以说,《永劫无间》、《暗区突围》这样的例子,揭示了随着多模态、Agent等技术的进一步发展,AI在游戏中的介入程度正不断加深,带来的游戏体验上的提升也越来越明显。
但与此同时,AI+游戏的另一大趋势是:随着技术复杂度不断提升,“AI游戏”的门槛和壁垒也在逐步提高,有实力留在牌桌上的选手,也成了资源和资金更加充足的大型企业。
然而,从行业的角度来看,这种不断提升的门槛,也未必是一件坏事因为随着大型企业逐渐主导AI+游戏领域,AI游戏的制作将进入一个更稳健、更有标准和规范可循的“工业化时代”,其品质的提升会更扎实、更可控而非像AI游戏的初期阶段那样,游戏的爆火与走红大多只能靠团队的“灵感”、天赋或运气。
海量资讯、精准解读,尽在新浪财经APP
【星界云手机】,让你游戏无极限!云端托管手游,配合挂机脚本,让你无需担心游戏中的种种繁杂操作,享受畅快游戏体验。解放你的双手,成为游戏的主宰!
本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。
如果侵犯了你的权益请来信告知我们删除。邮箱:631580315@qq.com