2023年12月8日,由陀螺科技主办的 FBEC2023 未来商业生态链接大会暨第八届金陀螺奖颁奖典礼在深圳盛大召开。本届大会以「合力共生·韧者行远」为主题,全面关注游戏、元宇宙、空间计算、XR、3D技术等科技与互联网前沿领域及热点议题。
本次大会盛况空前,共举办三场主会场论坛、三场分会场论坛以及多个主题展项,邀请到政府领导、专家学者、产业精英等各界人士,汇聚近50位行业顶尖大咖进行主题分享。在下午举办的主会场论坛「元生未来,共链价值——2023全球元宇宙产业核心技术论坛」上,诺亦腾联合创始人/CTO戴若犁博士受邀发表主题演讲《AI & AVP 会成为Metaverse的「救世主」吗?》
在演讲中,戴博士分享了他在动作捕捉技术与XR领域的经验与洞察见解。他强调,AI虽然在一定程度上分散了公众与投资界对于XR项目的关注,但是技术本身的发展在长期来看将会对XR产生积极的推动作用。
他以自己在算法开发与创新前沿探索上的丰富经验为基础,论述了有关AI对AR和VR这两项技术的不同影响,并结合 Apple Vision Pro (AVP)公布带来的影响以及他自身实际体验这款设备后的认识,给出了关于VR行业趋势的个人预测。他呼吁XR行业依然要稳住阵脚,保持充分的耐心与好奇心,相信行业将迎来更大的发展。
以下为此次演讲的全文整理。有关于本次 FBEC 大会的整体资讯,请访问VR陀螺微信公众号查阅。
感谢各位。上台前发现许多嘉宾提到了 Apple Vision Pro,它与人工智能的兴起一样,对XR行业如同打了一针强心针,有着积极的影响。在过去一段时间里,Apple Vision Pro 和人工智能的出现无疑是科技领域和XR领域最引人注目的两个事件。这两个标志性的事件到底能不能给我们带来一些变化?带来的是好的变化,还是一些负面的影响?今天和大家相对轻松地聊一聊。
我来自诺亦腾,专注于动作捕捉技术,包括手部追踪、身体追踪和面部追踪等。我们采用可穿戴传感器、光学追踪技术以及计算机视觉等各种技术将人类动作、表情等信息数字化,并应用于不同行业。目前,诺亦腾的产品与技术在全球50多个国家拥有广泛的用户群,市场占有率相当可观,所以在这样一个小的行业里,我们还是可以拿出相对不错的成绩的。
诺亦腾部分XR项目案例
我在国内是最早从事XR技术积累与应用开发的一批人之一。在上一轮XR热潮中,公司获得了可观的投资,实现了商业上的成功,积累了大量的经验,在过去一段时间里做了大量的XR项目,很多都来自于如车企的研究项目、商业广告项目、科研领域的一些项目等。诺亦腾是第一批和各种大厂、各种技术方进行产品设备级别、项目级别合作的厂商。这么多年过来,我们也见证了行业的起伏。
从我个人角度,也帮助某些创业AR公司提供一些顾问指导。我和AR行业内最顶尖的一批人严肃地讨论过AI和AR相结合的各种实践的可能性。这也就是为什么我有资格站在这里来聊这个话题。
AI 会是
Metaverse 的「救世主」吗?
现在,大家都看到了AI所带来的变化。许多人认为,人工智能对于XR领域,在商业层面,其实是有负面影响的——短期内,它的出现分散了投资人对于XR项目的关注。但长期来看,它可能会对XR领域产生积极影响。下面我们来讨论第一个话题,AI是不是 Metaverse 的「救世主」?
人工智能技术的巨大发展给这个行业带来了「心理」与「生理」层面的双重冲击。我们看到很多以前认为解决不了、复杂度甚高的事情,居然「完美」地解决了。可以说 Large Language Model 和 Diffusion Model,在过去的一年中,打破了天花板。一些以前觉得不能做的事情,立项讨论阶段被 Pass 的项目,都可以重新回到思考流程,拿回来讨论一下——是不是利用新工具,可以在我们的领域中解决一些以前解决不了的问题?
回到XR的具体领域中,应该将VR和AR分开来讨论,AI对于这两个子领域的影响是截然不同的。先说AR,AI对于AR的影响将会是巨大的,且非常正面的。我们认为AI能力的提升将极大加速AR设备的普及,尤其是轻量化消费级设备。
传统的人机交互平台,它的核心交互逻辑都是基于图形界面的,无论是PC还是移动设备。我们假设用户看着一个屏幕去点击屏幕,通过鼠标键盘、触控去操作数字内容。但是随着大语言模型革命的发展,一个基础的判断是基于图形界面的人机交互占比会极大降低,基于自然语言交互的占比会极大提升。
通过这件事情,降低了对于显示组件的依赖。而显示组件是AR设备路径上单一最大的「路障」,各类光学器件的小型化、低成本、低功耗、高分辨率、显示质量等提升是业界将轻量化消费级别AR眼镜交付到市场路径上最大的阻碍。而如果AI能够帮助我们降低对于屏幕的依赖,事实上就会加速消费级别AR设备的到来。
而另一方面,当轻量化的AR设备可以全日佩戴的时候,它也将成为多模态AI的模型的最佳载体之一。这个设备能够陪伴我们的时间比手机更长,如果用户有需求的话,可以 always on,实时同步看到用户视野中的世界,听到周遭的对白与声音,是一个非常好的多模态大模型的数据信息输入源。
从这两个方面来说,AI对于AR这个赛道的帮助是显而易见的,它会让AR设备本身的能力得到提升,加速落地,同时反过来AR也是多模态大模型的良好载体。但在达到这一步之前,最大的障碍卡点依然是重量、舒适度、设计的合理性、造型的合理性以及能否全日工作与全功能工作的问题。如果这些都能解决,它将会是一个完美组合。
那么VR又如何呢?我的观点是,对于VR来说,或许并不会带来特别显著的变化。AI能够帮助VR解决降低部分内容制作的难度,用到AIGC的能力,产生一些内容、声音甚至动作,可以提升一些人机交互方面的体验。
但它不能从根上解决的,是VR设备长期高频使用、应用场景、使用复杂度的问题,是如何提升用户使用频度以及延长使用时长的问题。即便在游戏这个相对硬核的领域中,也没有形成一个真正有盈利能力的商业模型。所以来说并不能期待AI来完全解决VR的大问题。
Quest 3 和 Vision Pro
会是XR的「白衣骑士」吗?
作为曾被邀请独立体验了4个小时 Vision Pro,而且重度使用Quest3等VR设备的用户,虽然我不会讲任何违反NDA的内容,但我的个人判断是有一定事实基础的,我的观点是,即便是像 Vision Pro 这样惊艳的设备,像是Quest 3这么成熟的设备,这些有非常好VST(Video See-through)的设备,它们也不会是XR的白衣骑士,它们也许不会带来2C VR的春天。
原因有很多,包括价格因素,体验提升因素、存量市场因素、佩戴舒适性因素以及视觉体验能否与现实中屏幕相提并论的因素。如果出现了一些真正的Killer App——能够解决传统的iPad、Mac、手机上解决不了的事情的App,让用户愿意高频使用甚至愿意耗光电量的App,或许还有一线希望。但否则,二者都不可能带来2C VR真正的春天。
最后给大家讲一个好消息。在我看来,Quest 3和Vision Pro大概率能够带来 B2B VR的第二春。2C会面临很多问题——内容的问题,交互的问题,舒适度的问题,分辨率的问题,价格的问题,用户学习的问题。但是B2B VR通过定制化的内容,定制化的场景,帮助它的终端用户解决了这些问题,更重要的是通过这一代设备提供的VST技术,解决了用户戴上头显的心理障碍以及眼手协同的问题,让用户几乎免学习上手就会。这是一个非常利好的特性。
在我看来,基于Quest 3和Vision Pro,可以让广告、销售、工业虚拟仿真、协同远程设计等这些各式各样的B2B VR应用在探索了七八年后真正做起来,而且不仅仅是创新性项目,而是真正可以长期使用的场景。
最后这张PPT上,左边是我的女儿,今年九岁,她带着的这个像VR头显一样的东西,是我美国同事送给我的40岁生日礼物,一个1901年的古董。虽然不是VR,但是它能够提供简单的立体视野。中间的这个是我的背影,是在这个世界上还没有现成的6DOF头显,现成的6DOF的手部追踪,以及道具追踪的时候,我用我们的技术结合Oculus DK2实现的前沿探索。而最右边的就是 Vision Pro。
从左边抵达右边,所花费的时间超过了100年。我相信这个领域的未来一定会有更大的发展,希望大家能够多一些耐心,希望我们一起坚持走下去。谢谢大家。
人工服务热线
工作日 9:00 - 18:00
售前咨询:+86 400-107-8298 转1
售后服务:+86 400-107-8298 转2
诺亦腾微信服务号