《Gear.Club Unlimited 3》中以500公里/小时的速度进行渲染

Eden Games 致力于构建赛车游戏已有25年,在该领域,性能表现与视觉保真度同样至关重要。他们的最新作品《Gear.Club Unlimited 3》(GCU 3)进一步深化了这种平衡:这是一款60 FPS 的街机风格竞速游戏,能够以接近 500 km/h 的速度串流广阔的游戏场景,同时支持从主机到配备光线追踪功能的高端 PC 等多种硬件平台。
《GCU 3》将于2026年2月19日发售,这也是首款搭载Eden Games完全成熟的自定义渲染管道的作品/游戏,将率先登陆Nintendo Switchᵀᴹ 2平台,并于今年晚些时候扩展至其他平台。
我们采访了首席图形程序员纳西姆·布格拉(Nasim Bouguerra)和高级渲染程序员弗洛里安·法拉维尔(Florian Falavel),探讨了构建基于GPU的架构、在不同平台上扩展光线追踪技术,以及在极端的串流限制条件下保持稳定性能等话题。
在构建《GCU 3》的过程中,团队面临的最大渲染挑战是什么?
纳西姆·布格拉(NB):我们面临的主要挑战之一,是在以高达500公里/小时的速度进行串流传输,同时保持稳定的60 FPS。在这种速度下,即使是轻微的卡顿——例如素材资源加载、同步点和垃圾回收——也会立即破坏游戏玩法的沉浸感。消除这些尖峰成为首要的工程目标。
《GCU 3》也是我们在Nintendo Switch 2平台上的首款游戏,因此我们在紧迫的截止日期内针对新硬件进行了优化。与此同时,这也是我们完整的内部渲染管道首次投入正式生产使用。这意味着需要同时稳定架构、验证跨平台的可扩展性,并优化各平台的指定的路径。

你为什么决定构建一个自定义的可编程渲染管线?
注:早在2019年,我们就构建了自己的可编程渲染管线,以适应各种截然不同的硬件环境。这启用了对性能和功能的全面掌控,构建了一个完全由 GPU 驱动的系统,并支持 DLSS 4.5、FSR 4、XeSS 2 和光线追踪等现代技术。自那时起,我们已通过这条制作流程推出了四款游戏,而《GCU 3》则是迄今为止该流程最重大的进化。
Unity 6 对您的渲染管线和底层图形堆栈产生了怎样的影响?
弗洛里安·法拉维尔(FF):Unity 6 为渲染后端提供了更广泛的访问权限和更大的灵活性,让我们能够利用底层图形功能,构建经过优化的定制化解决方案。我们还依赖原生渲染插件来集成 Unity 尚未暴露的功能,例如 PC 和 Nintendo Switch 2 上的 NVIDIA DLSS、用于光线追踪的 NRD 降噪器,以及其他高级工具。这种控制水平对于实现高性能串流传输至关重要,同时还能在所有目标平台上保持稳定的品质。

GPU驱动的渲染技术如何改变了您构建环境和赛道的方式?
FF:基于GPU的渲染消除了CPU提交的瓶颈,从而能够呈现更加密集的环境和更复杂的赛道。我们将其与专为地形和道具设计的定制虚拟纹理系统相结合,这样美术师既能使用高分辨率素材资源,又能确保内存占用和性能表现可控。其结果是,在不影响60 FPS帧率的情况下,场景复杂度得到了提升。
当速度接近500公里/小时时,串流问题变得至关重要。您是如何处理渲染、资产串流和内存管理的,以避免画面卡顿?
注:串流是我们面临的最大挑战之一。我们构建了一个完全多线程的串流系统,能够流畅地将Nintendo Switch的两个I/O端口利用率推至饱和。我们还花时间尽可能减少游戏玩法过程中的GC分配,并启用了增量垃圾回收,以确保在比赛过程中极少出现因垃圾回收导致的帧率下降。
我们的地形和虚拟纹理系统同样采用反馈循环机制,仅在需要时加载所需的数据。这种方法即使在极高的速度下也能保持串流的平滑度。

在Nintendo Switch 2上实现60 FPS的关键渲染技术和GPU优化有哪些?
FF:在Nintendo Switch 2上,开发流程的每个环节都必须证明其成本的合理性。我们将 DLSS 与动态分辨率系统紧密集成,以确保在 GPU 资源限制内运行,并大量采用异步计算技术来实现工作负载的重叠,从而最大限度地提高利用率。
我们的基于 GPU 的架构还降低了 CPU 开销,这有助于在高负载的游戏玩法场景中保持性能的一致性。通过全面的平台分析,我们针对每个处理阶段制定了优化决策,具体措施包括:修剪带宽消耗大的处理阶段、重新组织资源过渡流程,以及消除同步卡顿。
可变刷新率提供了额外的安全余量,既能平滑极少数的边缘情况,又不遮罩系统性问题。

除了Nintendo Switch 2之外,您在不同平台上的渲染方案有何不同?
注:我们首先采用功能完整的配置,然后在真实的游戏玩法环境中对每个系统进行性能分析。在此基础上,我们会针对不同平台有选择地缩放或优化功能,而非维护完全独立的渲染路径,并通过迭代测试来发掘各平台所能提供的最佳应用方案。
在 PC 平台上,我们为玩家提供了我们所支持的全部渲染功能,包括 HDR、超宽屏支持、DLSS 以及实时光线追踪。我们还提供了画质适配选项,因此即使在Steam Deck这类低功耗设备上,玩家也能以相同的核心画质体验游戏。
目标并不是建立不同的管道。这是一种在单一、可扩展的框架内进行的受控降解。
是什么促使你们的团队如此大力投入光线追踪技术?这一决策在开发过程中是如何影响你们的视觉目标和技术限制的?
注:光线追踪对于实现物理上准确的视觉效果以及加快光照师的迭代速度都至关重要。我们将其整合到了从初期开发到关卡制作及Runtime阶段的各个环节,并确保从地形、道具到光照和材质的所有系统均能按预期运行。此外,在制作过程中,艺术家还需要配备高内存的GPU,因为光线追踪加速结构(RTAS)内存是光线追踪技术中的关键瓶颈。

能否详细介绍一下,您是如何利用参考路径追踪器实现全局光照(GI)的,以及这种方法与PC版中采用的实时路径追踪方案相比,既有何借鉴之处,又有何不同?
FF:光线追踪是我们全局光照工作流程的核心。我们构建了一个用于确保精度的参考光线追踪器,它能验证我们的烘焙GI系统,并为美术师提供可预测的渲染结果。这加快了迭代速度,使他们能够在触发完整烘焙之前预览接近最终效果的光照效果。
在 PC 端,我们为高端硬件添加了一个基于 ReSTIR 的实时光线追踪器,其结果与真实情况非常接近。光线追踪是一项长期投资,为此我们与 Unity 紧密合作,对渲染 API 进行了优化和稳定化处理。

与 Unity 光线追踪团队的合作对最终的渲染管线产生了怎样的影响?
FF:我们的基于 GPU 的管道需要光线追踪功能,而早期版本的 Unity 并未提供该功能。我们新增了将 GPU 生成的数据注入加速结构的功能,引入了诸如 RayTracingAccelerationStructure.AddInstancesIndirect 之类的 API,并通过原生渲染插件集成了 NVIDIA 着色器执行重排序技术,以提升路径追踪性能。这种合作塑造了我们的最终架构,使我们能够在坚持GPU驱动方法的同时,进一步扩展光线追踪技术。
现代图像增强功能在您的整体渲染策略中扮演什么角色?
注:现代的图像增强功能对于平衡视觉清晰度与性能至关重要。基于机器学习的解决方案甚至能提供比Temporal Anti-aliasing (TAA)等传统方法更出色的抗锯齿效果。在 PC 端,我们支持自研的时域上采样技术、NVIDIA DLSS 4.5、AMD FSR 4 以及 Intel XeSS 2,为您提供最大的灵活性。
话虽如此,图像增强功能并不是万能的解决方案。当底层管道本身已经足够高效时,该方案的效果最佳,这使我们能够在锐度、性能和图像品质之间取得平衡,尤其是在限制更严格的主机平台上。

对于构建渲染策略,你会给开发者什么建议?
注:首先要了解艺术家和玩家的实际需求,并据此设计渲染系统,以高效满足这些需求。避免不必要的复杂性,专注于充分利用现有系统,并确保解决方案简单且具有可扩展性。请务必在目标硬件上使用性能分析器进行性能分析。如果优化措施未在关键环节进行测试,反而会降低性能。
FF:我完全赞同。找出真正重要的视觉特征,并以此为基础构建策略。不必感到有压力,非要实现每一个功能不可。优先处理重要事项,以兼顾性能和品质。
如需进一步了解 Made with Unity 制作的项目,请访问“资源”页面。
*Nintendo Switch 是任天堂的注册商标。
