“我们现在要做的就是将框架里的内容填充进去就行了,对于空间计算这个东西我也是十分迷茫,如果没有韩总设计的框架我都不知道该如何开发得好。”严辉武补充道。
实际上空间计算并不是什么新鲜的东西,在场的一些人也听说过空间计算这个概念。
早在2003年麻省理工学院Simon Greenwold就在论文中引入这一术语。
只是那个时候的硬件水平十分落后,即使有人研究也没办法把它做出来,因此只有极少数人知道这个东西,也只有极少数人在研究这个项目。
“空间计算是一种整合虚拟现实(VR)、增强现实(AR)、混合现实(MR)等技术的计算模式,旨在将数字信息与真实世界融合在一起。
这种融合创造了一个全新的计算环境,能够感知和理解我们周围的空间,并将数字内容与现实场景相互交织。空间计算的应用范围非常广泛,例如地理信息系统(GIS)、智能交通系统、城市规划等领域均可应用空间计算技术。
空间计算最初指对地图及其他地理位置数据进行计算和分析以实现定位与测量的技术,随着XR、虚拟人、数字孪生等技术领域的发展,微观空间的计算需求也在逐渐增加。
语音、视觉、手势等其他更为自然的输入方式将进一步丰富鼠标、键盘、触摸屏等传统交互模式,使人们能够以最适合自己当前场景与业务流程的方式进行接入和交互。
从核心技术维度考量,空间计算是由AI技术、三维重建、空间感知、用户感知、空间数据管理等一系列技术支撑实现的。它是构建元宇宙空间并实现与现实世界自由切换、相互融合的关键技术。
从计算载体维度考量,空间计算可以分为端计算、云计算以及由5G作为重要媒介的云、边、端协同计算。通过空间计算可以实现人、物、机器和虚拟空间的无缝衔接,构建数字孪生体,创造虚实融合的新经济形态,最终驱动新一轮的产业变革。
空间计算反映了我们如何与现实世界中的物体、人、动物和目标进行交互,人类将眼睛中的 2D图像转换为世界的 3D模型,理解世界中的物体,然后指挥我们的手去行动。
例如,当我们倒一杯茶时,我们一边倒,一边看着杯子,确定杯子什么时候满了,然后当杯子满了就停下来,空间计算也是如此,但使用传感器、计算机和执行器。
空间计算涉及多个步骤。
首先,摄影测量、激光雷达和雷达等技术可以捕捉世界的 3D模型,激光雷达或雷达通过测量扫描仪周围物体的激光或无线电信号反射来捕获 3D模型,以自动捕获表示到每个点的距离的点云。
摄影测量学被描述为从照片创建 3D模型的艺术和科学,它结合了来自多个图像或相机的图像,神经辐射场(NeRF)等较新的 AI技术可以使用少量图像捕获更丰富的表示。
小主,
其次,机器视觉等技术分析这些数据以理解图像,人工智能技术有助于识别场景中的单个对象、查找缺陷、了解步态模式或分析不同工人如何执行流程。
例如,在建筑中,这些技术可以帮助监控工作进度,查明门未正确关闭等问题,并识别承包商忘记安装电源插座等问题。
空间计算的第三个方面涉及采取行动。例如:自动驾驶汽车检测到前方有行人,并决定实时停车,当有人走进房间时,建筑控制系统会根据他们存储在数据库中的偏好来决定调整热量或光线,施工管理系统安排一个团队安装缺失的插头。
由于从物理过程中捕获的数字 3D图像进行了分析,因此这些示例中的操作是可能的...”严辉武照着PPT上的内容向在场众人讲解起来。
此刻在场众人也是听得津津有味疯狂摄取这里面的知识。
实际上AI部门正在研发的sora也涉及到空间计算,很多人都以为Sora只是一个视频生成AI,Sora是一个继承了文本理解能力的扩散模型,所谓的扩散模型,走的是一个逆向还原噪点图片到原目标图片的逻辑。
Open AI充分的发挥了它本身的大语言模型优势,让视频数据可以直接用来训练模型。
正是在这样的基础之上,Sora得以理解现实世界的各种物理规律,再根据提示词语转换成视频作品,做出足以以假乱真的效果。这种理解世界的能力是其他AI视频生成模型所不具备的,也是他们视频质感差距的重要原因。
Sora就是通过理解现实世界的各种物理规律来实现空间计算的。
之前就说过Sora还能够应用到自动驾驶上面,一个能够理解现实世界的各种物理规律的AI,让它来解读无人驾驶还不是十分简单的事情。
只是sora和xr眼镜的用途并不在一个领域上,不过两者之间是可以是进行互惠互助的。