元宇宙论文 | 元宇宙驱动的新技术及应用

首页    元宇宙专栏    元宇宙 | 论文报告    元宇宙论文 | 元宇宙驱动的新技术及应用

 

来源:重庆邮电大学学报(自然科学版)
 

文字:14221 ||  阅读时长:9分钟

 

元宇宙驱动的新技术及应用

李荣洋 1,万月亮 2,3,宁焕生 1,4

(1. 北京科技大学 计算机与通信工程学院,北京 100083;2. 北京锐安科技有限公司,北京 100192;3.北京市网络空间数据分析与应用工程技术研究中心,北京 100192;4.晋中学院,山西 晋中 030606)

摘要:元宇宙是互联网应用更新迭代的高级形态,其愿景是为人们提供一个平行于现实世界的数字化生活空间。元宇宙的出现催生了众多新鲜事物,如新技术、新应用与新政策等。本文以元宇宙驱动的“三新”为主题,展开具体阐述。首先,将元宇宙与传统互联网进行对比,归纳得出元宇宙的突出特点,包括低延迟、强沉浸感、高度自治与深度智能化,并详细介绍了各特点所驱动的新技术的内涵、现状及未来趋势;其次,深入剖析了元宇宙驱动下新应用的落地现状与发展态势;然后,整理总结了当前我国各级政府机构所采取的与元宇宙相关的各项举措以及其他国家对于元宇宙的不同态度;最后,分析了元宇宙所面临的问题与挑战。

关键词:元宇宙;新技术;新应用;新政策

中图分类号:TP391 文献标志码:A

 
0
引 言
 

最早的元宇宙概念以文学作品为主要载体而逐步具像化。1992年,美国作家斯蒂芬森在科幻小说《雪崩》中,将元宇宙描述为一个庞大的虚拟世界,人们以“Avatar(化身)”的形态在这个虚拟世界中进行各种活动。随后,一系列科幻电影接踵而至,如《黑客帝国》《头号玩家》等,它们所呈现的元宇宙是一个平行于现实世界的虚拟三维数字世界,在这里,人们的五官感受通过脑机接口等先进技术得以高度仿真,为人类提供一种身临其境、以假乱真的沉浸式交互体验。随着科学技术的不断进步,人们对于元宇宙的认知已不再止步于文学作

品当中,业界、学术界拉开了元宇宙研究的帷幕,他们对于元宇宙的概念众说纷纭。阿里巴巴达摩院XR实验室谭平认为元宇宙的本质就是基于VR与AR的新一代互联网[1];腾讯公司马化腾认为元宇宙是下一代互联网——全真互联网,可帮助用户实现更为真实的体验[1];在英伟达公司提出的Omniverse概念中,元宇宙被定义为基于数字孪生技术与广泛连接的高保真、可扩展、实时的数字模拟世界[2];元宇宙第一股 Roblox 公司,提出了元宇宙八大组成要素,包括身份、社交、沉浸感、低延迟、多元化、随时随地、经济系统和文明[3]。清华大学沈阳教授将元宇宙定义为整合多种新技术而产生的新型虚实相融的互联网应用和社会形态[4];北京科技大学宁焕生教授认为元宇宙即为广义网络空间,是网络(赛博)空间与网络(赛博)使能空间的统一描述,形成于物联网泛在连接与各空间深度融合的基础之上[5,6]。虽然关于元宇宙的定义尚待统一,但其基本含义渐为明朗,可大致概括为:元宇宙以物联网、虚拟现实等技术为底层支撑,为用户提供高仿真、强沉浸感的应用体验,从而实现一个更为自由开放的虚拟世界。

2021年,元宇宙迎来了发展元年,获得了众多关注。同时,元宇宙的基本含义也决定了元宇宙的出现必将促进技术迭代与应用创新。在元宇宙的驱动下,各种新兴产物开始崭露头角,比如新技术、新应用等。但目前相关综述研究大多集中于互联网驱动下的元宇宙基础支撑技术,缺乏对于元宇宙驱动下新事物的系统性梳理与分析。针对上述问题,本文以元宇宙驱动的“三新”为主题,详细介绍了元宇宙驱动的新技术、新应用以及新政策。第一章具体阐述了元宇宙驱动的新技术,包括支撑元宇宙开发的工具引擎以及元宇宙各特点所驱动的新技术;第二章梳理了元宇宙驱动下的新应用及其对应的应用实例;第三章整理总结了我国各地政府颁布的元宇宙相关政策以及各个国家对于元宇宙的不同态度。第四章对元宇宙的未来发展进行了展望,并进行了总结。

 

 
1
元宇宙驱动的新技术
 

传统互联网虽然奠定了元宇宙发展的坚实基础,但其在用户自由度以及体验感等方面还是存在一定局限性。元宇宙作为由传统网络衍生而来的更高级的互联网形态,很好地弥补了传统互联网的局限性,具备了低延迟、强沉浸感、高度自治以及深度智能化等特点。这些特点驱动着技术的发展,催生了新技术的产生,如图 1 所示。本章节首先介绍了支撑元宇宙开发的工具引擎,然后从元宇宙的特点出发,探究了各特点与各技术间的相关关系,并对各技术进行了详细介绍。

图 1 元宇宙新特点驱动的新技术

1.1
元宇宙相关工具引擎

工具引擎是支撑元宇宙应用开发、发布与使用的核心组件。开发者(B 端)可以基于工具引擎建立部署程序模块,实现元宇宙的应用开发或发布。相应地,工具引擎也可以将开发好的程序模块进行封装,以友好型方式把各个功能模块展现给用户,为元宇宙用户(C 端)提供高效便捷的服务。当前,典型的元宇宙工具引擎有 Unity 3D、Unreal Engine、Roblox Studio、Omniverse、VS·work 等。

表 1 详细介绍了元宇宙相关的部分工具引擎。当前,大部分工具引擎的面向对象为 B 端,面向 C 端用户的友好型应用引擎较为稀缺;而且面向 B 端的工具引擎开发门槛较高,对开发者的专业性要求较高,也从一定程度上限制了元宇宙工具引擎的推广。此外,大部分工具引擎所属公司以海外企业为主,虽然我国部分企业研发了一些元宇宙工具引擎(如 VS·work 引擎、Angelica 引擎等),但总体仍处于初步发展阶段,所以我国在元宇宙工具引擎层面的相关工作仍然需要进一步发展。

1.2
低延迟特点驱动的新技术

传统互联网中的数据大多是二维的,如文字、图片、音频、视频等,其数据量级别为 PB 级。然而,随着传统互联网逐渐向元宇宙进化,三维数据开始出现,如空间位置数据、人体动作数据等,其数据量也越来越大,升级为 EB 级别指日可待。面对日益丰富的数据种类以及不断增长的数据量,低延迟特点对数据采集、数据计算处理以及数据通信等方面都提出了更高的技术要求,驱动了实时数据采集技术、高性能/量子计算技术、云/边缘计算技术以及 5G/6G 通信技术的发展与产生。

(1)实时数据采集技术

数据采集技术是元宇宙与物理世界之间进行交互的桥梁,保证所采集数据的实时性是元宇宙为用户提供极致体验的基石。数据采集的主要目的是基于各类传感器或摄像头等设备从物理世界中采集数据并输送到元宇宙当中进行数据的分析与处理。物理世界由人和物理环境共同组成,对应地,数据采集分为两种情况,分别为采集以人为主体产生的数据,以及采集物理环境中的数据。

人本身产生的数据包括生命特征数据(如人脸、虹膜等)、语音数据、动作姿态数据等。诸如人脸、语音等数据可以通过传统设备进行采集,如普通摄像头、相机、录音设备等。但是,对于动作姿态数据如果只使用普通摄像头或相机来进行采集,无法全面且精准地记录动作姿态完整的动态过程,这就促使了动作姿态捕捉设备的出现。例如,NOKOV动作捕捉设备基于光学原理采用高性能红外镜头,高精度实时获取目标对象的动作姿态数据,可支持实现人体动作姿态与动画角色动作姿态间的无缝同步[12]。

物理环境中的数据包括环境自身属性的相关数据(如温度、湿度、气压等),以及环境所包含物体(如汽车、工业设备)的相关数据。以上数据都可以通过传感器技术进行采集。但随着人们对数据采集的便捷度、精度以及时效性等要求都越来越高,传统传感器技术已无法满足人们的需求,这就促进了新型传感器技术的发展。在传感器形态大小方面,随着技术集成度的提升,其体积变得越来越小,目前最小的传感器体积可达立方毫米级别,这提高了数据采集的便捷性[13]。在传感器采集精度与时效性方面,起初的传感器因其精度与时效性的限制只能应用在数码相机、硬盘保护等方面,但随着传感器技术的不断进步,传感器精度与时效性稳步提升,现今可以应用到自动驾驶、GPS 导航、遥感定位、航天航空、远程医疗手术以及飞机姿态监控等具备高精度、高时效性要求的应用领域[14]。

(2) 高性能/量子计算技术

元宇宙中的数据量大、种类多样,低延迟特点的实现需要强大的算力来支撑。传统的计算方式已无法满足元宇宙中的算力需求,有限的算力成为制约元宇宙发展的瓶颈问题。高性能计算和量子计算是解决算力有限问题的有效技术路径[15]。

高性能计算(HPC, High Performance Computing)是指集成多终端或多集群的计算资源的计算系统或环境,适用于处理数据密集型计算任务。高性能计算主要是通过并行计算方式来提高计算效率。并行计算方式分为同构并行计算与异构并行计算。同构并行计算指的是将计算任务分配给各结构相同的计算单元进行计算;异构并行计算指的是将计算任务分配给不同功能、不同架构的计算单元进行计算[16]。目前,高性能计算已成为全球研究的热点,并取得了相应的研究成果[17,18]。美国能源部投入 18 亿美元用于研制 E 级高性能计算机,预计 2024 年达到 8-12EF 性能;日本基于 ARM 架构研发了富岳超级计算机,其理论峰值服点性能可达到 537PFLOPS;欧盟在现有的高性能计算基础设施基础上,预计于 2023 年左右完成 3 台百亿亿次高性能超级计算机的研制;我国也在持续提高在高性能计算应用领域上的投入,超级计算机的性能水平处在世界领先水平,我国主要的 E 级超级计算机系统包括神威 E 级原型机、“天河三号”E 级原型机、曙光系列 E 级原型机。其中,神威·太湖之光超级计算机的峰值计算速度可达每秒 12.54 亿亿次,是全球首台计算速度超过十亿亿次的超级计算机。

量子计算(Quantum computation)的概念于由阿贡国家实验室 P.Benioff 提出的,是一种基于量子效应的新型计算模式,它将量子位作为信息编码和存储基本单元,以量子位演化的方式来完成计算任务[19]。与高性能计算不同的是,高性能计算是通过管理计算资源来提高效率,而量子计算则是通过改变优化底层计算逻辑来提高计算效率[16]。量子计算凭借其独特的计算模式成为最具潜力攻克 NP 问题的解决方案,“量子霸权” “量子优越性”等话题成为商业界、学术界热议的焦点。各大公司、科研机构、高校等纷纷展开了量子计算的相关研究工作[20]。如美国 IBM 公司推出的 Q Exoperience 量子计算平台、Microsoft 公司研发的 Azure Quantum 量子计算平台;我国中国科学技术大学量子信息重点实验室首次研制出非局域量子模拟器,并基于该模拟器成功模拟了超光速现象;此外,我国互联网企业在量子计算方面也取得了相应的研究进展,如华为量子计算模拟器 HiQ 云服务平台、百度量子平台等。

元宇宙的出现使得经典计算方式受到了强烈的冲击,驱动了新型计算方式的产生。高性能计算与量子计算分别通过合理分配计算资源与优化计算逻辑大大地提高了计算效率从而解决算力瓶颈问题,成为计算方式发展的必然趋势。

(3) 云/边缘计算技术

高性能计算与量子计算如果无法彻底地解决元宇宙中算力有限的问题,那么通过云计算与边缘计算的部署可以进一步提升算力[16]。

云计算是集中式数据处理模型的代表,云端集成了大量的运算与存储资源,当本地无法满足用户的需求时,可以按照用户需求从云端调用相应的资源[21]。云计算可以集中管理并合理分配处于空闲状态的各种资源,并将具备处理性能的软硬件服务按需分配给不同的用户,为元宇宙提供了强大的算力与存储支撑。但是,本地与云端之间大量的数据交换非常依赖可靠的网络连接,而且还会产生时延,严重影响实时性。为了应对云计算的不足,边缘计算由此诞生,相对于云计算将运算与存储资源集中到云端,边缘计算将资源下沉到边缘(即靠近物或数据源的一侧),利用本地具备计算能力的设备(如传感器、手机、电脑等)提供最近端的服务[22,23],从而避免了大量数据交换造成的时延问题。

在元宇宙中,云计算与边缘计算相辅相成,互为补充。云计算可以负责运算量大的计算任务或者长期存储任务,从而弥补分布式节点在资源方面的短板;而边缘计算负责本地计算,可以减少数据交换传输,从而减少传输成本,降低延迟。云计算与边缘计算共同形成一个更加高效的计算模式,为元宇宙提供更高效的计算服务。

(4)5G/B5G/6G 通信技术

20 世纪八九十年代,1G/2G 通信技术集成模拟蜂窝网络、频分多址、时分多址等技术,满足了人们对远程语音通话的需求。但 1G/2G 通信技术带宽有限,无法满足图片、视频等多媒体业务场景下的通信需求。3G 通信技术由此诞生,为人们提供了基本的移动多媒体业务服务。为进一步优化服务质量,以正交频复用多收发天线技术与空分多址技术为核心的 4G 通信网络应运而生,能够实现高清视频、图片等更高质量的多媒体业务服务[24]。

然而,元宇宙运行过程中必将会涉及到更加频繁的数据交互与巨大的数据吞吐量,而且人们更期望在元宇宙中得到更加极致的用户体验,这激发了诸如低延迟、高可靠、大连接、低能耗等一系列新需求。经典的通信技术已无法完全满足元宇宙中新的通信需求,这就驱动着新一代通信技术的产生,5G/B5G/6G通信技术的研究就此拉开帷幕。

相比4G,5G通信技术在各方面性能上都有了显著的提升[25]。在用户体验速率方面,4G最大可达12.5Mbps,5G 通信技术将其提升至1Gbps;在传输时延上,5G技术较4G技术的时延降低了10倍,低至 1ms;在用户连接能力方面,连接密度由10万连接/平方公里提升至100万连接/平方公里。由通信性能的显著提升可以看出,高速率、低时延、大连接是5G通信技术最为突出的特征,这也让 5G成为更适用于元宇宙场景的通信方案。

B5G与6G是5G技术迭代发展的前进方向[26]。B5G是相对5G更为智能化的通信方式,它相较于前几代通信技术除了具备在移动带宽性能上的优势,将会更加注重信息融合传输与智能处理,并进一步完善垂直领域(远程医疗、智慧交通、工业4.0等)的技术细节[27]。6G技术将在B5G的基础上继续深化通信过程中的泛在互联与智能协同,构建一个空天地海一体化的数据通信网络,保证各种数据形式的智能生成与传输处理,全面实现全息通信[28]。虽然 B5G/6G技术还处在研究阶段,但在未来,B5G与6G通信技术必将打破物理世界中的时空限制,为元宇宙实现虚实共生提供通信基础。

1.3
强沉浸感特点驱动的新技术

互联网实现了人类视觉与听觉的数字化,呈现方式以二维平面为主。而元宇宙的核心逻辑则是多维度感官的数字化模拟,包括视觉、听觉、触觉、味觉与嗅觉等,并且,互联网中的平面呈现方式在元宇宙中被三维立体化。综上,元宇宙与互联网相比可以为人们提供一种沉浸感更为强烈的交互体验,这驱动了 XR 技术、3D 建模技术与脑机接口技术的产生与发展。

(1)XR 技术

XR 技术是虚拟现实(Virtual Reality, VR)技术、增强现实(Augmented Reality, AR)技术与混 合现实(Mixed Reality, MR)技术以及拟真现实(Emulated Reality, ER)技术的统称,是实现元宇宙多感官体验模拟仿真的重要技术方案,也是进入元宇宙的主要方式。

VR技术是基于计算机技术创建一个虚拟环境,通过各种硬件设备(头戴显示器、体感设备等)建立用户与元宇宙之间的互动连接,模拟用户在虚拟环境中的存在,从而给人以环境沉浸感[29]。目前,VR设备作为发展最久的元宇宙入口硬件设备,已有多家公司发布了相关产品,如三星 MR+设备、Facebook 的第 二 代 独立 虚 拟 现实 头 盔 Oculus Quest2、HTC发布的VIVE系列VR眼镜以及Steam母公司V社研发的valve index设备等[30]。

与VR技术不同,AR 技术并不是创造出一个虚拟世界,而是基于真实的物理世界将原本的现实空间的内容范围使用虚拟信息进行扩充,将虚拟物体与真实环境融合在一起,用于实现物理空间中虚拟对象的叠加,为元宇宙虚实共生提供基础[31]。Google公司是AR界的领军企业,它率先发布了Google glass系列AR眼镜设备,Google glass 在开发过程中主要是用了Mirror API方法,内容包含Timeline、Menu、Subscription、Location 等多个组件,实现了“面对面式”视频聊天、远程医疗手术教学等多种功能[32]。除此之外,还有其他企业也发布了一系列的AR设备,例如,Dream world公司推出的Dream Glass 4K AR眼镜、Rokid Jungle 公司研发的Rokid Glass AR眼镜等[33]。

MR 技术相当于是 VR 与 AR 的结合版,是VR与AR技术的进一步发展。该技术可以在现实空间中呈现虚拟场景,在元宇宙体系中搭建起现实世界、虚拟世界以及用户之间交互反馈的信息回路[34]。与VR、AR相比,MR技术最显著的特点就是可以实现虚拟对象与现实世界的实时交互,成为用户与元宇宙进行交互的重要桥梁。为满足用户与元宇宙进行实时交互的需求,Microsoft 公司推出了以良好的交互体验为产品定位的 Hololens 高端 MR 设备,实现了沉浸式模拟游戏、火星登陆场景模拟等功能;Magic Leap 公司也推出了 MagicLeap One MR 设备,该设备包含了 13 款应用 app,UI 界面也以无背景框文字为核心,大大提升了其科技感[33,35]。

ER 技术是 VR、AR、MR 技术迭代进化的发展方向,它将三者与人工智能、物联网等技术进行深度融合,旨在实现虚拟空间与现实空间的全方位信息交互,打破元宇宙中真实与虚拟之间的边界[36]。ER 技术将会创造一个数字原生的数字化空间,人们可以通过各类终端随时随地完全融入其中,并在其中实现与现实世界、虚拟世界的同时交互。ER技术将有望成为元宇宙中交互方式的终极形态,并将会对各行业格局产生一定的冲击,重构人们现有的生产生活方式。

(2)3D 建模技术

3D 建模技术是指通过计算机技术在元宇宙中构建出具有三维数据的模型[37],包括元宇宙中的虚拟人物形象建模、真实的人或物的形象建模等,相关技术包括计算机动画技术(Computer Graphics, CG)、全息影像技术、渲染技术等。

20 世纪六七十年代,互联网背景下的CG技术以二维动画制作为主,包括动画人物形象设计、场景设计与制作、动画脚本编写等[38]。常用的制作软件有 windows 系统下的 Animator Studio、交互动画制作工具 Flash、日本的二维动画软件 Retas 以及法国生产的 Pegs 软件等。但是,随着科学技术的不断进步,CG 技术在元宇宙强沉浸感特点的驱动下,已完成从二维建模到三维建模的过渡,并被广泛地应用到越来越多的领域,包括影视、游戏、工程、工业制造等行业[39]。例如,3D 电影《阿凡达》《玩具总动员》,3D 游戏《魔兽世界》等以其高度仿真的环境、美轮美奂的背景为我们呈现了一场场强沉浸感的视觉盛宴。

全息影像技术是基于光的干涉和衍射原理并结合计算机技术记录与再现物体真实的三维图像信息的技术,用于实现元宇宙中高仿真度的虚拟成像[40]。20 世纪 40 年代,全息摄影术的成像理念由匈牙利物理学家提出,并构建出了世界第一张全息影像。后来,美国学者提出了离轴全息技术,极大地提升了全息影像的清晰度。直到 20 世纪 70 年代,数字全息技术诞生了,全息影像的记录与再现真正实现了数字化,其成像效果愈发逼真与清晰[41]。元宇宙的出现更是极大提升了全息影像技术的成像效果,增强了全息图的立体感与真实感,甚至达到了以假乱真的效果。目前,全息影像技术应用广泛,为元宇宙中的虚拟形象舞台效果、文化遗物数字化修复等提供了有力的技术支撑。

渲染技术是元宇宙场景建模的重要支撑技术,它是实现渲染对象从模型到生成图像的技术,包括对对象几何、材质、纹理以及周围环境的光照等信息进行渲染的过程[42]。渲染过程一般通过渲染器进行实现,目前主流的渲染器包括chaosgroup公司和asgvis公司联合出品的 V-Ray、Chaos Software 公司研发的 For 3Dsmax 等[43]。

(3)脑机接口技术

XR 技术与 3D 建模技术是增强元宇宙中视觉沉浸感的主要技术手段,而大脑是控制人体各项感官感受的重要枢纽。那么,如果可以实现计算机与大脑之间的信息交互与反馈,则能够实现视觉、听觉、触觉、味觉等多维度感官体验的高度仿真,从而更大限度地提升元宇宙中的沉浸式体验感,这驱动了脑机接口技术(Brain Computer Interface, BCI)的产生与发展。

脑机接口技术指的是在人或动物的大脑与计算机设备之间建立连接,通过实时获取分析大脑的不同反应感测人或动物的不同思维状态,从而实现大脑与计算机之间的信息交互与反馈[44]。常用的方法分为入侵式、半入侵式与非入侵式,入侵式方法主要分析处理皮质内脑电,半入侵式方法以皮质内脑点描记术为主要方法对大脑思维状态进行判断,非入侵式的主要分析对象为脑电波(EEG)、脑磁图(EMG)、功能性近红外光谱(fNIRS)等[45]。然而,入侵式与半入侵式方法对生命体会产生一定的生理性伤害,所以,非入侵方式是目前使用相对较多的脑机接口方法。

EmotivEpoc意念控制器是脑机接口设备的典型代表,该设备通过非植入性电极获取人体脑电波信号,并将 EEG 转化为计算机可理解的数据信息,从而实现计算机对大脑思维的解读,最终用户可以通过自身的大脑意志与情绪来控制计算机进行一系列操作[46]。此外,清华大学张文昌等人将机器人技术与脑机接口技术进行结合,实现了通过人脑意识操控机器人躲避障碍物与抓取指定物体的实验,其准确率高达 80%[47]。

1.4
高度自治特点驱动的新技术

传统互联网以网络创建者为核心,互联网相关的内容资源本质上来讲都从属于网络创建者,未能实现真正的去中心化。而元宇宙将核心从网络创建者转移到用户身上,为用户提供了更高自由度的创作空间,用户在元宇宙中可以成为资源或内容的真正拥有者。所以说,相较传统互联网,元宇宙具备了高度自治的特点。然而如果要想实现高度自治,其背后必然需要相应的技术支撑,这驱动了区块链技术、NFT 技术、DeFi 技术、GameFi 技术等去中心化技术的产生和进一步发展。

(1) 区块链技术

区块链技术是分布式账本、比特币、非对称加密、共识机制以及智能合约等技术的集合,具有去中心化、开放性、独立性、安全性、匿名性等特点,确保了区块链信息的真实可靠,解决了节点间的信任危机问题[48],为元宇宙中的用户信息安全与去中心化自治等方面提供了技术支撑。

如今,区块链技术已被广泛应用到金融领域、智能物流、数字版权、公共服务等领域。Sholeh 等人针对交易过程中数据泄露问题,利用区块链技术的去中心化与分布式特点,基于智能合约等区块链核心技术研发了去中心化应用程序 DApps,并将其成功应用到了学费支付过程中,保证了用户交易信息的安全[49]。例如,Liu 等人针对传统物流业中存在的信息不对称、业务流程透明度低、个人信息存储安全性低等问题,结合区块链技术,提出了智能物流存次管理框架,优化了物流网络拓扑结构,提高了物流业务效率,提升了物流系统的安全性能 [50-52]。

(2) NFT技术

与区块链背景下的同质化代币比特币不同,NFT(Non-Fungible Token)是指一种非同质化代币,每个NFT无法分割、不可替代并且独一无二,为自由交易与发布奠定了基础,可用于元宇宙中的支付交易与人或物的唯一身份标识。

目前,NFT被应用于元宇宙中的市场交易与文化艺术当中。2021年3月,NFT艺术藏品《每一天:最初的5000天》在佳得士拍卖行成交。同年7月,我国北京国声京剧团在NFT网站上正式出品了自己的京剧作品周边产品,首个京剧NFT由此出现。此外,许多互联网公司也纷纷进军NFT,腾讯公司、字节跳动、百度等都相继开启了NFT相关项目。

(3) DeFi技术

DeFi(Decentralized Finance)指的是去中心化金融,它旨在创造一个平等、开放自由、去中心化的金融系统,任何人可以基于 DeFi 进行并对其搭建、改动与组合,形成个性化的金融产品或服务,为元宇宙背景下的自由金融交易市场奠定了技术基础[53]。

目前,DeFi技术已经探索出较为基础的运营模式,比如去中心化银行 MakerDAO、去中心化平台Compound、去中心化交易所 Uniswap 等。然而,就以上现有的运营模式而言,虽然 DeFi 技术为元宇宙中自由的金融交易奠定了一定的基础,其还是存在一定安全风险的。例如,金融业务的自由度高为系统设计增加了负担,潜在的安全漏洞可能会引发网络攻击与非法侵入等活动;基于 DeFi 技术的金融系统的强流动性可能会导致市场陷入抵押资产减值和流动性枯竭等问题[54]。

(4) GameFi技术

GameFi 是 Game 与 Finance 的缩写组合而成。顾名思义,GameFi 就是以游戏为主要载体的金融服务技术,它是加密货币、NFT 技术与区块链技术的集合[55]。

基于 GameFi 的游戏与传统游戏有着很大的不同。传统游戏以娱乐作为主要目的,玩家无法真正拥有在游戏中的资产(如房屋、武器、宠物等),这些资产的真正拥有者仍然为游戏厂商。而基于GameFi 技术的游戏的核心为边玩边赚(Play to Earn, P2E),玩家可以在游戏中自由地进行创作,并成为游戏资产的真正拥有者,从而实现自我收益[56]。目前,GameFi 官方网站已发布了多款以 P2E 为核心的相关游戏,如 BIT HOTEL, EVER MOON,EPIC WAR,LEAGUE OF KINGDOMS 等[57]。可以看出,GameFi 技术为元宇宙中的创作收益提供了高度自治环境。

自治是元宇宙追求的目标之一,除了技术上限制之外,根本的限制还是来自现实世界,如主权、政策等。

1.5
深度智能化特点驱动的新技术

所谓智能化,就是指事物在各种计算机技术的作用下,具备满足用户各种需求的能力。传统的互联网因科学技术的限制,其智能化程度有限,而元宇宙旨在提供极致的用户体验,所以提升智能化程度势在必行。如果在元宇宙中想要实现深度智能化,首先要将元宇宙中的各事物与计算机之间建立联接,并基于这种联接进行信息的交换与通信,以实现对连接对象的智能化识别、定位、跟踪与监管等功能,这就需要物联网做为技术支撑。虽然物联网技术实现了对连接对象的实时反馈与控制,但还缺少元宇宙各事物间的关系建模以及对各事物完整生命周期的全面监控,数字孪生技术在物联网技术的基础之上又增加了对于物理资产、动态过程等的高仿真建模,进一步促进了元宇宙中物理空间向赛博空间数字化模型的全面信息反馈。物联网与数字孪生技术虽然实现了元宇宙中物理空间与赛博空间之间的全面联接与信息反馈,但在信息内在知识规律的挖掘与利用上还尚待加强。人工智能技术则在此基础之上,实现了以人的意识、思维对由连接反馈而获得的数据信息进行学习、思考从而获得知识的过程。

综上,元宇宙深度智能化的实现需要物联网、数字孪生以及人工智能三大技术作为底层支撑,本小节将进一步具体阐述这三种技术。

(1) 物联网技术

物联网技术是元宇宙中连接虚拟空间(赛博空间)与真实空间(物理空间)的重要技术方案,其关键技术包含感知与识别技术、嵌入式系统技术、智能技术等[58,59]。举一例,射频识别技术是一类典型的识别技术,其通过射频信号来实现物体的无接触识别与信息采集,在自动识别、物流管理等方面有着广泛的应用前景;嵌入式系统技术是指综合运用传感器、计算机软硬件、集成电路等技术模块实现对接受到的信息进行分类与处理的技术;智能技术是指利用计算机技术手段,在物体中植入智能系统,从而使物体能够主动或被动地与用户进行沟通。

为了给物联网技术发展提供理论基础,人们将物联网技术体系架构分为三层或四层模型[60]。三层模型由感知层、网络层与应用层组成。感知层包含传感器网络、摄像头、RFID 标签等各种传感器,是实现物联网全面感知的核心支撑,主要功能为信息采集与传输。网络层由通信网络、管理中心等部分组成,可以实现数据编码、身份认证、数据传输等功能。应用层可以为各行各业提供各种基于物联网的应用服务,是物联网发展的根本目的,旨在实现广泛的智能化应用,如智能家居、远程医疗、智能交通等。四层模型相对三层模型最大的区别就是在网络层与应用层之间多了一个支撑层,该层由分布式计算、分布式存储与 web 服务等共性应用技术组成,进一步丰富了物联网关键技术的内容,细化了物联网技术体系架构的分层范围。

(2)数字孪生技术

数字孪生技术用于创建元宇宙中平行于现实空间的数字化镜像虚拟空间。数字孪生技术的实现包括仿真建模、数据清洗整合、系统服务实现等步骤。具体地,首先对物理对象进行多维度的全面数据采集,获取符合仿真建模要求的数据;之后,对数据进行预处理,并将处理后的数据输入到仿真模型中进行计算仿真,构建与物理对象相对应的虚拟实体;最后,构建系统服务平台与虚拟实体的交互式体验方案,实现对于虚拟实体的实时监测、预测与数据更行,从而实现元宇宙中虚拟实体与物理对象间的精准映射与实时数据反馈[61]。

此外,数据孪生的关键技术包含建模仿真技术、可视化技术等[62]。建模仿真技术是基于本体模型实现大规模多源异构数据的一致性表述的重要方法,为统一数据表征、克服数据孤岛问题等奠定了技术基础。可视化技术是提高数字孪生模型用户友好度的关键解决方案,它可以将网络拓扑结构以图形的方式进行直观的展现,从而清晰地呈现出网络的运行状态;而且还可以实现数字孪生模型的流量建模、故障诊断等功能的可视化,极大地提高了数字孪生模型的可用性。

如今,数字孪生技术已被应用到各类场景中,如智能电网、智能制造、智能交通、智慧城市等[63],形成了元宇宙应用的雏形,意味着元宇宙或将颠覆人类生产生活方式。

(3)人工智能技术

人工智能技术可以看作是元宇宙的“大脑”,是元宇宙的核心生产要素,它基于各种算法模拟人的思维方式对元宇宙中的数据信息进行分析处理,学习掌握数据内在知识与规律,从而实现元宇宙的智能反馈、预测等功能。

人工智能技术是一种综合多门学科(如语言学、心理学、生理学与计算机学等)的技术[64],包含自然语言处理、语音处理、机器学习算法、深度学习算法等。自然语言处理技术是指对人类自然语言 (如中文、英文等)进行处理,实现基于人类自然语言的人机交互方式,常用的算法模型有基于注意力机制的 Transformer 模型、GPT 模型、BERT 模型、XTNET 模型等,具体应用任务包括情感分析、机器翻译、意图识别等[65]。语音处理主要用于基于语音的用户-系统间的信息交互与反馈,包括噪音抑制、语音活动检测、关声源定位、关键词识别等功能,集成了麦克风阵列处理、DSP 或专用芯片等模块完成语音处理,如科大讯飞、云知声、百度等公司都出品了相关的语音处理产品[66]。机器学习与深度学习算法的目的都是让机器具备学习能力,学习数据内在知识规律,并应用到数据智能分类与预测等任务中。目前,常用的机器学习算法包括 K 近邻、支持向量机、随机森林等,常用的深度学习算法包括卷积神经网络模型、深度信任网络模型、堆栈自编码网络模型等[67]。

元宇宙的出现驱动着人工智能技术的不断进阶,人工智能将快速实现从“感知智能”向“认知智能”的阶段性跨越[68]。相应地,人工智能也贯穿着元宇宙架构的全场景应用,为元宇宙实现深度智能化奠定了基础。

综上所述,虽然已有技术为元宇宙奠定了技术基础,但相关技术并无法完全实现元宇宙中虚实空间的无缝对接,亟待进一步的更新迭代。首先,元宇宙相关技术方案的底层支撑引擎具备巨大发展潜力,可以在兼容性、功能性等方面继续提升;此外,元宇宙的出现随之而来的是庞大的数据量以及丰富的数据种类,可以在数据处理速度、数据传输速率等方面加以技术支持,如大力发展 6G 通信技术、高性能/量子计算技术与云/边缘计算技术等。其次,目前的元宇宙还无法达到以假乱真、虚实空间无缝互融的状态,因此元宇宙用户的沉浸感体验有待加强,那么进一步发展虚拟现实技术则是实现元宇宙用户强沉浸感体验的重要技术路径之一;最后,自治化与智能化也是元宇宙的鲜明特点,但由于技术限制等原因,元宇宙并未真正实现高度自治化与深度智能化,因此去中心化技术与人工智能等技术亟待更加深入的研究与发展。 

 

 
2
元宇宙驱动的新应用
 

任何新概念产生的最终目标都是实现对应的落地应用,为人类提供更高效的生产方式与更便捷的生活服务。元宇宙亦是如此,在它的驱动下,不仅带动了技术的更新迭代,而且激发了新型应用的出现,或将大幅更新人类的生产生活方式。

当前,元宇宙开始逐渐渗入部分应用领域,已形成一些基本雏形。例如,中国传媒大学打造的国内首个“元宇宙大学”,国内首个元宇宙沉浸式虚拟社交软件“希壤”,全球首届元宇宙时装周 Metaverse Fashion Week,日本全日空航空公司推出的全球首个元宇宙机场购物中心 SKY WHALE,首个登台表演脱口秀的元宇宙虚拟人“梅涩甜”,全球第一个元宇宙虚拟办公空间 Horizon Workrooms 等等。作为补充,图 2 更为系统地列举了元宇宙目前应用场景及对应的应用实例[69-71]。

 

 

图 2 元宇宙驱动的新应用

 

从现存的应用场景及各应用实例可分析得到:在产业分布方面,国内外企业都在积极研发和争相布局,如微软公司开发的混合现实协作办公应用Mesh for Teams、Facebook 公司推出的多人虚拟社交应用 Horizon Worlds、阿里的淘宝 Buy+计划、腾讯的元宇宙游戏融合社交应用超级 QQ 秀等。在应用场景方面,元宇宙因其在实时性、精准度等性能方面的限制,其发展水平目前还处于泛娱乐化阶段,较少应用到一些对实时性、精确度要求高的场景当中,而是在沉浸式游戏、在线社交/购物、艺术藏品、云旅游等生活化娱乐化场景中相对较为成熟。除此之外,在新冠疫情的影响下,元宇宙应用也开始在虚拟办公空间、在线教育等学习工作场景中初展头角。

在一些重要领域,元宇宙的实时性、精准度等性能还需要极大地提升,例如远程手术、精密加工等。此外,如果将元宇宙应用到医疗场景,通过VR实景对医务人员进行培训,不仅可以提高学习者的沉浸感,还可以降低培训风险;如果将其应用到农业场景,基于模拟仿真实验进行行动决策,可以节省大量的人力物力并能够进一步保证农业产值利益的最大化等。

 

 
3
元宇宙驱动的新政策
 

为了使元宇宙的发展更加规范、高效,我国已有相关部门和地方政府颁布了一系列的与元宇宙相关政策,部分汇集如表 2 所示[72]。

 

 

元宇宙的发展是全球性的,不仅我国的一些机构颁布了相关的政策,其他国家也开始争相布局,表 3 列举了日本、韩国、美国政府部门出台的部分元宇宙相关政策。日本政府的经济产业主管部门发布了《关于虚拟空间行业未来可能性与课题的调查报告》,该报告对虚拟空间产业进行了深入地分析,并将元宇宙作为一种确定的商业形式,力争在全球元宇宙行业中掌握主动权[73]。韩国政府也发布了元宇宙相关政策规划,包括韩国科学技术信息通信部颁布的《沉浸式经济发展策略》、首尔市政府颁布的《元宇宙首尔五年计划》等。这些政策规划表明了韩国政府对于元宇宙发展的大力支持积极态度,预计将培育 220 家公司和 4 万名专门从事元宇宙技术的专业人士,并基于此创造 50 亿韩元的实际收入[74]。对比中、日、韩政府,美国政府对于元宇宙发展没有出台特别的官方文件,倒是 IT 巨头们相当积极,这和当年的发展物联网的官方态度相似,以市场为主导[75]。

 

 

 
4
总结与展望
 

元宇宙的发展虽然为科技发展提供了新的动力,带动了技术与应用的更新换代,但也同样面临着一些挑战,下面从个人、社会、国家层面对元宇宙挑战进行了分析。

在个人层面上,元宇宙将成为人们生产生活的新的方式,就好比当年的微信等,如果使用不当可能会造成个人隐私泄露问题、身心健康问题等。面对以上问题,个人需要提高个人隐私保护意识,合理使用元宇宙,避免过度沉迷于虚拟空间。此外,还需要从技术方面对数据安全问题加以管制,加强对隐私保护技术的研究。

在社会层面上,元宇宙中的伦理道德规范、法律建设还不完善,个体行为约束和身份管理尚待加强,存在着虚拟财产划分问题、虚拟交易合法性问题以及真实身份与虚拟身份间边界关系等法律与伦理道德问题。在未来,需要制定更加完备的伦理道德体系与法律法规,合法约束元宇宙中的个体行为与身份,进一步明确虚拟财产归属问题、虚拟交易安全保护问题以及真实身份与虚拟身份间的边界关系等问题。

在国家层面上,元宇宙去中心化特点鲜明,这对国家主权理念产生了一定的冲击,如何在虚拟空间中维护和尊重各国国家主权、促进和平友好相处,是需要深入探讨的问题。针对元宇宙中国家主权等问题,将来需要各国共同努力,共同协调冲突问题。

元宇宙是互联网不断进化的高级形态,或将颠覆性地改变人们的生产生活方式。在这一过程中,技术创新是必不可少的基础性建设,元宇宙的出现驱动了新技术的产生与发展,包括新一代通信技术、去中心化技术、人工智能技术等。此外,新技术的诞生必然会为应用服务提供新的技术方案,这也催生了一大批新型应用服务,如沉浸式课堂、虚拟办公空间等。在元宇宙技术与应用百花齐放的背景下,各国政府和企业也想把握元宇宙发展契机,积极布局元宇宙产业。虽然元宇宙的发展是大势所趋,但我们也需要保持清醒、理智对待,在积极探索发展元宇宙技术与应用的同时,及时发现并解决元宇宙所带来的问题与挑战。

 

 

 

 

2023年1月15日 15:05
浏览量:0
收藏