0
2022年底,联发科和高通发布的最新旗舰手机SoC都有一个重要的特性——支持硬件级光线追踪技术。
2023年刚开年,全球第四大硅IP提供商Imagination Technology,也是硬件级移动光线追踪技术的领导者,发布了其第二代硬件级光线追踪IP IMG DXT,凭借可扩展的特性,智能手机从主流到旗舰级都能用上硬件级光线追踪,推动移动光线追踪技术的普及。
雷峰网(公众号:雷峰网)了解到,IMG DXT预计会在18-24个月内商用。
这意味着,2023年将是手机支持光线追踪的关键一年,26亿手机游戏玩家离在手机上体验到光线追踪的游戏又更近了一步。
过去几年,移动端光线追踪技术不断有消息放出,但迟迟没有看到其在智能手机上大规模应用,原因是什么?
Imagination公司首席营销官David Harold认为,“主要原因是他们虽然技术成功了,但能耗过大,难以在手机上得到实际应用。这也恰恰体现出我们L4级别光线追踪对性能和能耗优化的重要性。”
技术之外,生态更是影响移动端光线追踪的长期且重要的因素。Imagination这一次给出了什么样的解决方案?
移动端光线追踪普及的两大难题
光线追踪技术是通过模拟真实世界中光线的表现,创造出与现实生活几乎无异的三维(3D)场景,可以让3D游戏场景中的光照更加贴近真实生活中的折射和反射。
借助开启光线追踪技术和没有光线追踪技术的相同场景的对比,比如阳光下墙壁上的阴影,以及任何鲨鱼在水中的细节呈现,就可以轻松发现光线追踪技术对于追求更加沉浸和真实体验的游戏玩家,是一个极具诱惑力的技术升级,但这非常耗费计算资源。
“现在市面上能够看到的任何宣称有光线追踪技术的手机,其实用的都还是第一级别的软件解决方案,真正使用起来能耗会非常吓人。”David Harold直言。
功耗也是移动端光线追踪普及的第一大技术难题。引发这个问题的关键在于光线追踪实现的方式,借助Imagination提出的光线追踪GPU的分级可以更好理解这一点。
2021年底Imagination发布首款硬件级光线追踪GPU IP 时,就提出了光线追踪等级系统(RTLS):
1级为现有硬件上的软件解决方案。性能低,效率低。
2级增加了用于光线追踪的第一部分硬件。与1级相比,可以将基本光线追踪效果的效率提高。
3级增加了用以处理发射光线的硬件,与2级解决方案相比,可大大降低功耗。
4级增加了相干性聚集功能,针对复杂的桌面级效果大大提升了性能,让其可以在移动端功耗预算下应用。
5级是一项未来等级,可在场景中实现更大数目的动态目标,并带有额外的硬件加速。
“一家公司想要骄傲地宣称有光线追踪技术,第一步要做的是从软件级别开始。”Imagination 公司技术产品管理高级总监Stephen Barton表示“用软件的方式实现光线追踪的问题也显而易见,计算开销和功耗非常大。”
显然,第2、3、4级的硬件级光线追踪解决方案,才是光线追踪在移动端普及的基础。根据Imagination的分类,目前主流的GPU提供商都在第2-第3.5级之间,只有Imagination此前发布的IMG CXT和最新发布的IMG DXT光线追踪GPU处于第四级。
但仅有硬件还远远不够,开发者、应用和软件生态是阻碍光线追踪的另一大难题。
Stephen Barton说,“移动端推广光线追踪确实是需要一个生态系统。硬件级光线追踪只有触及大部分终端市场,游戏开发者才会愿意开发带有光线追踪功能的游戏,否则他们会缺乏动力。”
那如何才能破解这两大挑战?
让主流和高端手机,都能用上硬件级光线追踪
移动端光线追踪的普及,硬件和生态实际上也是相辅相成。
“我们上一代IMG CXT GPU已经是4级的光线追踪,但比较多的是针对高端的设备,没有办法达到让主流机型都具有这个能力。这可能让开发者觉得没有那么大的必要去开发大量的光线追踪的内容。” David Harold认为,“只有让移动端光线追踪的功耗开销处于可接受范围,尽快铺开到更多移动设备,光线追踪的内容开开发者才会更愿意开发更多内容。”
这也正是最新发布的IMG DXT的一个重要特性,可以覆盖主流到高端的手机,支持从混合实现方案中的简单阴影到3A大作中的高级光追画面等各类应用。
实际上,这得益于IMG DXT系列可扩展光线追踪RAC(光线加速集群)。从低配的0.5 RAC 提供216MB/秒的光数运算能力,8GB的光和检测运算能力,到高配的4 RAC,提供1.5GB的光线追踪算力,64GB的光合检测能力。
Imagination中国区技术总监艾克指出,“有了DXT系列可扩展的0.5 RAC到4 RAC,我们可扩展的光线追踪技术可以运用到各个手机领域的层次。追求产品差异化的主流设备制造商可以选择节省面积的半尺寸光线加速集群(RAC)配置,而追求高端性能的OEM可以选择单、双或四RAC配置打造终极移动视觉体验。”
据雷峰网了解,DXT采用Photon架构,是目前唯一达到光追系统(RTLS)4级的光追设计,有DXT-8-256、DXT-48-1536、DXT-72-2304三种配置,分别面向主流、高端、旗舰智能手机市场。
“无论RAC如何配置,与相同移动配置下的CXT相比,DXT能够将提供可用光追的面积成本降低40%。“艾克表示。
DXT系列的性能标杆的旗舰产品DXT-72-2304,具有72 GTexels/s和2.5 TFLOP FP32算力。与上一代产品相比,最大单核性能提升了50%。并且,DXT核的单位面积性能密度比IMG CXT GPU高出20%,还大幅降低了功耗。
光线追踪技术与片段着色率(FSR)技术结合,能够用更小的功耗实现更真实的画面,这两个技术的结合被艾克称为“黄金搭档”。
FSR是一种可以在几乎不降低图像质量的前提下减少片段着色器运行次数的技术,能够降低占用的带宽与功耗。
以具体的场景看,是否使用FSR技术对于画质肉眼几乎看不出差别,但从热力图可以发现,使用了FSR技术之后,可以节省大量的运算资源。在最极端的情况下,可以对一个4x4的片段区域只执行一次着色器代码,从而使工作负载减少近94%。
除了光线追踪和FSR的黄金搭档之外,DXT还有诸多使其能够兼顾性能和能效的特性。比如2D双速率纹理处理,许多先进的游戏依靠大量纹理取样实现高级过滤效果。IMG DXT GPU的纹理处理单元(TPU)内置一个已获得专利的创新特殊模式,能够为这些后处理效果创建一条“快速通道”,在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。
还使用RISC-V固件处理器,带来调度40%的性能提升。
这些特性能够支撑手机游戏更沉浸体验、更高游戏性能、更高能效的需求。
背后最核心的,正是IMG DXT Photon架构中的光线加速集群(RAC)。BTU、DTTU、PTU单元实现的是第二级的光线追踪,有了PCG相关的分析、分类、聚集和回溯能力以后,就实现了第三级光线追踪,加上光线存储以及光线任务的调度器等,综合在一起达到RTLS级别中的第四级。
灵活可扩展的架构为移动端光线追踪的大规模应用奠定了基础,但要普及和有优秀的应用体验,生态是一个影响更加深远的因素。
只能一点点普及光线追踪
让硬件级的光线追踪覆盖各个层级的手机终端会让开发者更有动力开发光追游戏,想要更进一步推动移动光线追踪的生态,就需要让开发者能够轻松上手。
“我们将开发者分为两类,一类是专门做3A大作,愿意自己制作引擎的专家,他们主要采用的方式是在Valkan扩展,通过API接口连接使用光线追踪技术开发,对他们而言适应光线追踪相关的游戏开发并不是什么问题。”Stephen Barton表示,“另一类是会采用Unity、Unreal或者O3DE引擎的开发者。面对这类开发者,我们跟O3DE展开合作,开发者只要跟着引导一步一步就可以完成对场景光线打光的相关设置。”
无论是采用Valkan扩展还是使用主流的引擎,都必须进行大量优化,才能满足移动端功耗和性能的需求,并且要保证符合游戏开发者原有的开发流程。
Stephen Barton介绍,“几年前很多游戏厂商开始往移动端移植3A大作都避不开优化的过程,正是因为这一点,我们提供相应的工具,比如PVR2能让很多开发者轻松接受我们工具的引导,完成对光线追踪技术的部署”
Imagination在光线追踪方面已经有生态的建设和储备,包括与O3DE开源引擎合作,参加GDC游戏开发者大会,和亚马逊一起展现光线追踪在游戏引擎中可以起到的作用和能力,与完美世界、网易、腾讯、Unity ,OPPO,VIVO等游戏开发商合作。
但即便如此,光线追踪的应用和普及依旧会是一个循序渐进的过程。
Stephen Barton强调,“光线加速集群作为一个独立IP,可以不影响GPU本身的性能独立运行,这对移动端的应用非常重要。”
“不是从今天开始就要把所有内容往都用光追技术打造,我们推荐大家在现有的游戏内容中一点一点加入光追的元素,从用光线追踪打造光影效果,随着市场上移动设备越来越多地使用硬件级光线追踪技术,再进一步增加光线追踪的内容。” Stephen Barton进一步表示。
David Harold也指出,“从内容的角度,我们离光线追踪应用彻底铺开还差得很远。”
也就是说,虽然移动端光线追踪无论从技术还是生态的角度来说还有很长的路要走,但这是一个明确的未来趋势,也是备受期待的技术。
ABI 2022年的调查显示,手机游戏用户会从2022年的26亿增长到2030年的39亿,到2026年,85%的游戏玩家首选在手机上玩游戏。
26亿的手机游戏用户离光线追踪更近一步,吸引未来近40亿手机游戏玩家的因素,光线追踪是一个关键,而Imagination正是这一技术的领导者。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。