语境决定一切:用于增强现实的跨域数据映射

眼下,AI是热门中的热门,尽管它在沉浸式体验里的应用方式还有待开拓。AI并不能解决所有问题,但它为创造下一代增强现实体验开辟了一条前所未有的捷径。
看到AI如此繁荣,我也想来聊聊一个增强现实(AR)避不开的概念,“上下文”(context)。上下文是描述某个领域的参数集合,可以编码成机器可处理的数据。“领域”可以指代任何东西,但在AR里,有三个领域最为重要:现实领域、虚拟领域和人类领域。
物理领域是我们生活的世界。某个地点的上下文可以包括世界坐标(即地理位置)、环境扫描数据、物体位置、天气或周围的照片——任何支持某个方案解决某个问题的现实参数。
虚拟域包含任何与现实世界中的位置有关联的数据。这个定义很宽泛,但就是这个意思:AR 体验并不需要复杂的 3D 资产或模型来提供价值。任何地点的元数据(描述数据的数据)都能成为一段体验的基础,比如降雨信息或某件商品在店里的位置。
最后,人类领域是以机器能够理解的语言表达的人类需求。AI正是在这里大显身手,自然语言处理(NLP)和生成式预训练转换器(GPT)模型在将人类表达转换为机器语言方面扮演着关键角色。人类领域也包括着机器生成内容与人的沟通方式。
生成单个领域的上下文还算比较简单。困难的地方在于不同领域间的关系:现实和虚拟坐标系统必须对齐、数字孪生必须同步现实世界的最新状态、人类描述必须能被描绘成可训练的行为等等。
新兴技术的软硬件,包括AI、机器人、物联网(Internet of Things),都在快速进化。在实施标准(比如互用性标准)和最佳做法出现前,有效的应用和兼容依赖于各组成部分的巧妙设计。设计出这种系统后,你就有一个通用基础来制作任何增强现实体验,应用在工业、零售或生产力上。
我们能用一个例子来说明AI在跨领域映射上的能力:某个人指着远处的某个物体。很多技术都能捕捉这个现实领域的上下文,但“指”这个姿势本身并不蕴含明显的含义,不足以描述出有待解决的问题。它可以代表一个前进的方向,或询问某个物体。这个上下文如果配上语言,如“我怎么去那边?”才组成一次完整的发问。这时,AI可以根据人类主导的上下文来处理现实数据,不消思考就能“理解”人类的日常互动,生成恰当的回应。这种“请求/回应”的透明过程可以改善所有形式的AR体验,最终让我们的生活更轻松。
我们再来探索下几种不同应用里的上下文例子。AI主要会在人类领域起作用,负责处理用户请求、预测用户需要、总结相关数据,并辅助人与设备间的交流。
房间粉刷用户想粉刷一个空间,希望知道所需材料的数量。具体情况:他们有一个设备,可以测量空间并发出语音指令,询问需要多少油漆。
- 物理物理空间激光雷达扫描
- 虚拟根据包括门窗和墙壁在内的实物扫描,即时创建空间数字 Twins,以准确确定墙面面积
- 人类平方英尺与一罐油漆能覆盖多少面积之间的关系
健身路线:用户要求改变通常的运行路线。具体情况:用户有一个耳机,它能确定用户的位置,有以前的路线记录,还能投射视觉信息。
- 物理用户位置和以前的运行 Recorder
- 虚拟提供小径和人行道信息的地区地图
- 人类了解什么是路线,以便计算新路线
机场优化:提高态势感知和自动化水平,改善运营管理。用户需要“及时”(just-in-time)的弹出信息来安全地执行机场职责。具体情况:用户手腕上的可穿戴设备可以确定用户的位置,并与中央操作数字 Twins 有数据连接。
- 物理用户、飞机、资产和物理世界对象的位置
- 虚拟可进行模拟预测、导航、兴趣点定位和地理空间处理的机场数字 Twins
- 人类了解任务、挑战和主要安全目标
在上方例子中可以看到,实时3D的价值已远不止于生成吸引人的画面。它成为了处理跨领域上下文、生成空间解决方案的引擎。鉴于我们生活在一个三维世界里,实时3D会担任这个重要角色也就不让人意外了。
Unity作为一个核心数据引擎在游戏市场有庞大的牵引力,所以它在非游戏领域的应用经常会被忽视。随着可穿戴设备、其他设备和AI模型的技术不断进步,更多更棒的数据也能被捕捉,上下文的含义会前所未有的丰富,催生出更为精准的解决方案。Unity将成为搜集这些数据的主要工具,用各色体验改善我们的工作和娱乐生活。
我们对开发者们的创作抱有很高的期待,也希望本文为你带来了一些构建次世代体验的思路。
有关人工智能如何推动沉浸式体验的更多灵感,请查看Digital Twins 的潜力。别忘了注册 UnityAI Beta 计划。
