随着网络与科技的迅猛发展,人人都能轻松开启自媒体事业,甚至成为网红主播。然而,在这个领域中,有一种独特的主播形式受到越来越多观众的青睐——虚拟主播,或称为「Vtuber」。这些主播区别于传统的真人直播,他们并不以真实外貌出镜,而是通过虚拟角色外观(通常称为「V皮」)与动作捕捉技术,将表演者的动作和情绪转移到虚拟形象中,形成一种新颖的直播方式。一些Vtuber还会利用变声技术,随意切换音调,使观众分不清性别,充满神秘感。表演虚拟角色的主播则被称为「中之人」。
虚拟主播的出现为那些热爱表演但不想公开真实形象的创作者提供了表达自我的途径。同时,虚拟角色灵活多样的外观也能吸引更多的观众。虚拟主播的内容以电玩直播和互动聊天为主,但近年也有不少国外的Vtuber尝试综艺节目和户外直播。根据2023年全球YouTube Super Chat的收入统计,前十名的主播中有四位是Vtuber,在日本更是达到了八位,显示出该类型主播在动画文化基础深厚的日本市场尤为受欢迎。这种成功的背后离不开企业化的运营体系,使Vtuber成为一种具有高度商业价值的网络文化现象。

虚拟主播的技术实现主要依赖于动作捕捉技术。Vtuber首先需要设计和建模虚拟角色,这些模型可以是2D或3D形式。接下来,动作捕捉技术将角色和表演者的动作实时绑定,常见的技术包括:
1. 光学动作捕捉:通过摄像头和标记点来捕捉演员的动作,适合大范围的动作和精细表情捕捉,精度非常高,效果逼真。然而,其设备成本高且安装复杂,适合专业应用场景。
2. 惯性动作捕捉:通过佩戴传感器捕捉运动,无需摄像头,灵活性高且易于在普通环境下使用,尤其适合移动自由度较大的场景。但此技术可能受到磁场干扰,影响精度。
3. 光学惯性混合捕捉:结合光学与惯性捕捉技术,既保证精度,又兼具灵活性,适合要求高的虚拟直播。其缺点在于成本高昂且需要专业支持。
4. 基于AI的图像识别技术:只需摄像头即可实现动作捕捉,适合快速部署,但对细节捕捉能力有限,容易受到光线和遮挡影响。
不同的动作捕捉技术适用于不同的需求:高精度的直播场景适合光学或混合捕捉,而灵活性要求更高、预算有限的场景则可以选择惯性或AI图像识别技术。
诺亦腾作为全球领先的全谱系动作捕捉技术开发者,拥有丰富的产品线,包括惯性动作捕捉套装与混合捕捉系统。诺亦腾的技术不仅在虚拟主播领域得到广泛应用,还广泛用于教育、工业仿真、展览展示、影视游戏、运动训练等多个行业。其一揽子解决方案推动了动作捕捉技术在各专业应用领域的普及和创新,赋能多元场景,满足不同场景的精准捕捉需求。