놀라운 시각적 효과와 성장 고통 언리얼 엔진 5의 첫 번째 세대 게임 검토

유레얼 엔진 5의 황홀한 시각 효과와 성장의 괴로움 첫 번째 세대 게임 리뷰

언리얼 엔진 5는 3년 전에 발표되었고, 이제서야 PC와 콘솔에서 세 번째 파티 UE5 게임의 첫 번째 웨이브를 보고 있다. PC에서 이러한 출시는 흥미롭기도 하지만 두려움을 갖게 합니다 – 에픽이 약속한 루멘, 네이나이트, 가상 그림자 지도와 함께 약속한 아이 캔디를 드디어 보고 있지만, 우리는 UE4 타이틀들 중에서도 CPU 활용도가 낮거나 사용성에 지장을 초래한 게임들을 경험해 왔기 때문입니다.

이러한 갈등하는 감정을 가지고, 나는 UE5의 첫 번째 세대 게임들을 모아서 이러한 타이틀의 좋은, 훌륭한, 그리고 그렇게 좋지 않은 측면을 파악해 보는 것이 흥미로울 것으로 생각했습니다 – PC에서 엔진에 대한 개발자들의 이해도와 UE5의 향후 플랫폼 동향을 짐작하는 일종의 조기 지표입니다.

여기서의 목표는 상세한 게임 하나를 다루는 것이 아니라, Jusant, Robocop: Rogue City, The Talos Principle 2의 데모 및 Remnant 2, Immortals of Aveum, Lords of the Fallen, Desordre, Fort Solis, 그리고 Layers of Fear 등의 전체 게임을 테스트한 후에 얻게 된 여러 가지 인상들을 제공하는 것입니다.

지금까지 PC에서 UE5 게임들이 옳게 하는 것과 틀리게 하는 것에 대한 전체적인 설명입니다.

가장 먼저 언리얼에서 발표한 것은 유명한 언리얼 엔진 5의 그래픽 기능입니다. PC에서 Lumen, Nanite, 그리고 Virtual Shadow Maps은 어떻게 작동하나요?

솔직히 말해서, 첫 번째로 본 타이틀들에서 이러한 기능들이 기대에 부응한 것 같습니다. 예를 들어 The Talos Principle 2에서는 Croteam이 이 세 가지 기술을 적극적으로 활용해서 훌륭한 효과를 만들어 냅니다.

먼저 Lumen부터 시작해보면, 한 가지 눈에 띄는 점은 이 기능을 옵션 메뉴의 전역 조명(GI) 설정과 직접 조절할 수 있다는 것입니다. 이는 UE5에서 전체적인 품질 매개변수이기 때문에 많은 게임 출시에서 이를 볼 수 있을 것으로 기대합니다. The Talos Principle 2에서는 중간 GI 설정으로 내려가면 Lumen 없이 세상이 어떻게 보이는지 확인할 수 있습니다 – 그리고 조명 품질에는 많은 차이가 있으며, Lumen의 로컬 바운스 조명과 하늘 조명에서의 그림자가 고전적인 SDFAO 등의 래스터 기법과 대조를 이루어 선명한 대비를 제공합니다. Lumen은 여기서 멋지게 작동합니다.

UE5에서 중간과 초고 global illumination의 비교
Lumen은 훌륭한 품질로 제작된 게임에 혁신적인 영향을 줄 수 있습니다. | 이미지 제공: Digital Foundry

Jusant에서도 마찬가지입니다 – 이 데모는 아마도 지금까지 Lumen을 가장 잘 보여주는 쇼케이스일 것입니다. 게임에서는 거의 텍스처 세부 사항이 없기 때문에 표면 조명의 영향이 두드러지게 나타나며, 예술가들은 기술을 활용해서 데모의 각 부분에서 시각적인 대비를 향상시켰습니다. 이는 Lumen의 한계를 우회하는 예술가 중심의 GI 사용 방식으로, 설득력 있는 최종 결과물을 만들기 위해 동기 없는 조명이나 방해물들이 배치되었습니다.

시각적인 측면에서 Lumen에 대한 내 첫 인상은 훌륭하지만, 항상 내가 선호하는 방식대로 배포된 것은 아닙니다. 거의 모든 UE5 타이틀들은 최신 GPU의 하드웨어를 활용하여 레이 트레이싱 계산 속도를 가속화하지 않는 소프트웨어 반복만을 사용합니다 – 그 결과로 반사 품질과 같은 것들에 대한 성능 최적화에 문제가 생깁니다. 예를 들어 Lords of the Fallen에서는 화면 공간 아티펙트와 물 표면의 부피감이 있는 외모가 문제가 되고 있습니다. 이 게임은 어두운 동굴에 강력한 햇빛이 비추어지는 등 일부 지역에서 빛이 샌 곳에서 문제가 발생합니다; The Talos Principle 2에서도 발광하는 전원 케이블과 같은 빛을 내는 표면이 확연한 화면 공간 제약으로 인해 사라지는 현상이 발생합니다.

소프트웨어 Lumen의 성능/품질 트레이드오프는 특히 반사 표면이 많은 게임에서 자주 볼 수 있으므로, Fortnite와 Desordre와 같은 더 많은 타이틀들이 대부분의 GPU에서 소량의 성능 페널티만으로 더 정확한 조명과 객체 세부 정보를 반영하고 반사 및 바운스 조명을 얻을 수 있도록 하드웨어 Lumen 옵션을 메뉴에 제공해야 한다고 생각합니다.

Fort Solis는 하드웨어 루멘이 만들어내는 차이의 좋은 예입니다. 이 게임은 소프트웨어 루멘만 함께 제공되지만 게임을 모드로 변경함으로써 하드웨어 루멘을 활성화할 수 있습니다. 이것은 게임이 발광 표면에 의존하고 있어 많은 장면에서 문제가 되는 샘플링 부족 현상을 개선해줌으로써 불안정성과 발광 표면에서 빛의 “끓기” 효과를 해결해 주는 큰 업그레이드입니다.

하드웨어 루멘을 옵션으로 제공하는 것 외에도, 나는 더 많은 UE5 게임 개발자가 Desordre에서 발견할 수 있는 시각적 옵션을 제공하는 것을 원합니다. 하드웨어 트레이싱 히트 라이팅에 대한 설정도 포함된 이 게임은 낮은 품질의 UE5 표면 캐시 대신 반사에서 객체를 그림자로 채우기 위해 RT를 사용하는 하드웨어 레이 트레이싱 히트 라이팅을 제공하여 반사에서 볼 수 있는 계단현상과 저해상도 텍스처를 없애 줍니다. Desordre은 또한 정확한 레이 트레이싱을 사용한 발광 조명 및 직접 조명을위한 RTXDI 설정도 가지고 있어 세계에 더 많은 현실감을 더해줍니다. 게다가 반사에서 물체가 반영되고 정확한 바운스 조명이 표시되는 경로 추적 조명 옵션도 있습니다.

Desordre은 그래서 컨솔 수준의 소프트웨어 RT에서 초고급 경로 추적까지 모든 범위를 제공합니다. 모든 개발자가 RTXDI 또는 경로 추적과 같은 무겁거나 Nvidia에 특화된 기능을 추가하기를 기대하지는 않지만, 하드웨어 루멘과 하드웨어 RT 히트 라이팅을 켤 수 있도록 하는 것은 PC 버전이 콘솔보다 더 높은 수준으로 확장될 수 있도록 하는 데 필수적입니다. 이러한 기능은 엔진에 기본적으로 포함되어 있으며 단지 변수에 불과합니다. 지금 여기에서 더 나은 충실도를 제공하는데 더불어 이러한 기능은 현대 게임이 미래의 그래픽 하드웨어에서도 더욱 멋지게 보이도록 해줍니다. (그러나 지금 더 나은 성능을 위해 GI 및 반사 설정을 두 번째로 높은 값으로 낮추는 것은 콘솔 UE5 게임에서 자주 사용되는 큰 성능 장점을 제공합니다.)

다양한 RT 품질 레벨을 노출시킴으로써 게임이 현재 하드웨어의 성능을 뛰어넘을 수 있게 해줍니다. 이 비교에서는 소프트웨어 루멘 (108fps), 하드웨어 루멘 (100fps), 하드웨어 루멘 플러스 RT 히트 라이팅 (93fps), 하드웨어 루멘 플러스 RT 히트 라이팅 및 RTXDI (51fps) 그리고 경로 추적 (41fps)을 보여줍니다.
다양한 RT 품질 레벨을 노출시킴으로써 게임이 현재 하드웨어의 성능을 뛰어넘을 수 있게 해줍니다. | 이미지 제공: Digital Foundry

Lumen, Nanite 및 Virtual Shadow Maps (VSM)는 UE5의 핵심 기능이지만, 대부분의 UE5 게임은 세 가지 모두를 사용하지 않았습니다. Remnant 2는 Lumen을 사용하지 않고 있습니다 (Lumen의 동적 조명과 임의로 생성된 레이아웃은 논리적으로 잘 어울리는 요소이기는 하지만), Lords of the Fallen 2는 VSM을 건너뛰고, Layers of Fear는 Nanite 및 VSM을 포기했습니다. 이러한 생략의 일부는 QA 시간 및 콘솔 성능 문제 때문일 것으로 생각되지만, Lumen의 GI 메뉴 매개 변수를 사용하여 Lumen의 경우처럼 핵심 VSM 및 Nanite를 메뉴에서 켜고 끌 수 있는 기능을 보고 싶습니다.

예를 들어, Virtual Shadow Maps는 Lords of the Fallen의 시각적인 면에서 많은 기여를 합니다. Frans Bouma의 Unreal Engine Unlocker를 사용하여 확인해볼 수 있습니다. 그래서 왜 이것을 사용자 모드 대신 메뉴 옵션으로 제공할 수 없었을까요? Remnant 2의 개발자들은 실제로 이렇게 했는데, VSM을 켜고 끌 수 있는 자세한 그림자 설정을 제공하므로 성능과 충실도 사이에서 선택할 수 있습니다. 사용자에게 더 많은 옵션을 제공하는 것은 항상 좋습니다. 특히 게임이 미래로 더 잘 확장될 수 있는 옵션입니다.

재미있게도, Remnant 2는 자세한 기하학을 켜고 끌 수도 있습니다. 이는 콘솔 변수의 조사를 통해 Nanite을 꺼내고 보여주는 낮은 품질의 정적 기하학을 보여줍니다. 이것은 Nanite의 대체 메쉬 기능으로 생각되며 지원하지 않는 플랫폼을 위해 고안된 것입니다. 더 높은 성능을 원하는 사용자를 위해 명시적으로 옵션으로 제공하는 것이 매우 훌륭하며, UE5 타이틀이 지금 잘 작동하고 미래에 더 높은 수준으로 확장되도록 Virtual Shadow Maps 또는 Nanite을 켜고 끌 수 있는 옵션을 만드는 아이디어가 정말 마음에 듭니다.

Lords of the Fallen에서 Nanite이 활성화된 경우와 그렇지 않은 경우의 비교입니다.
Remnant 2에서 Nanite이 활성화된 경우와 그렇지 않은 경우의 비교입니다.
Nanite을 비활성화하는 것은 별로 의미가 없습니다. 자산은 보통 Nanite을 기준으로 작성되는 것이 더 일반적이기 때문입니다. 하지만 일부 성능을 되찾을 수 있으며 사용자에게 옵션으로 노출시킬 가치가 있습니다. | 이미지 제공: Digital Foundry

Lumen으로 돌아가서, 나를 놀라게 한 것 중 하나는 일부 타이틀에서 기술의 첫번째 데모에서 보여준 것만큼은 명백하지 않다는 것이었습니다. 예를 들어, Lords of the Fallen 2의 전체 소개는 실제로 Lumen이 제대로 작동하지 않는 것처럼 보였으며 거의 간접 조명이 없었습니다 – 하지만 게임의 후반부에서는 픽셀 단위의 RTGI를 더 확실히 보여줍니다. 저는 게임 개발자들이 게임 환경에 ‘가짜’ 조명을 주입하여 게임 플레이를 밝게 하려고 한다고 믿습니다만, 이는 또한 Lumen의 품질을 완전히 망가뜨립니다 – 아마도 Lumen을 고려하지 않고 게임 환경을 구성한 결과일지도 모르겠습니다.

따라서, 게임이 Lumen을 사용한다고 해서 모든 장면이 초기 공개 때 우리가 보았던 수준의 조명 섬세함을 가지고 있다는 것은 아닙니다 – 실제로 개발자가 기술을 최고의 고도로 사용하고 게임 플레이에도 도움이 되도록 사용하는 것에 달려있는 것입니다.

성능 및 사용자 경험에 대해 이야기하면, 나는 UE4의 이전 버전보다 훨씬 더 좋은 이미지 품질 옵션을 제공하는 이번 UE5 타이틀들을 칭찬하고 싶습니다. 내가 테스트한 거의 모든 UE5 타이틀이 DLSS, FSR2, XeSS 및 언리얼 엔진 TSR을 제공했습니다. 모든 벤더 재구성 옵션이 사용 가능한 단계에 도달한 것을 사랑하며, 이 모든 것들이 설치하기 쉬운 플러그인으로 이루어져 있어서 이는 주로 UI 문제이며 심층적인 기술적 구현 문제는 아닌 것 같습니다.

Remnant 2에서 보여지는 셰이더 컴파일 중단
The Talos Principle 2에서 보여지는 셰이더 컴파일 중단
UE5.1+의 자동 셰이더 컴파일 기능을 사용하더라도 일부 게임은 여전히 셰이더 컴파일 중단이 발생하지만, 이러한 중단은 UE4 타이틀보다는 훨씬 드물다. | 이미지 제공: Digital Foundry

그러나, 여기에 몇 가지 검증된 방법이 있다고 생각합니다 – Lords of the Fallen과 Jusant가 이러한 옵션을 제공한 점을 강조하고 싶습니다. Lords of the Fallen에서는 다른 벤더 Upscaler 간에 전환할 수 있지만, 해상도 백분률 슬라이더를 사용하면 게임은 TSR을 사용합니다. 이런 식으로, Jusant는 여러 재구성 기술 중에서 선택할 수 있도록 허용하며 해상도 백분률 슬라이더는 모든 재구성 기술의 입력 해상도를 제어합니다 (하지만 명시된 백분률은 없습니다). 어쨌든, 이렇게 모든 재구성 프로세서를 쉽게 접근 가능하게하고 더 정교한 해상도 제어를 하는 것은 바람직한 실천 방법입니다.

언리얼 엔진의 고질적인 버그인 셰이더 컴파일 중단은 어떠한가요? 여기서 나는 좋은 소식과 그렇지 않은 소식을 전해드릴 수 있습니다. 하나는, 이 글에서 테스트한 모든 9개의 UE5 타이틀은 거의 모든 Digital Foundry에서 테스트한 UE4 타이틀보다 셰이더 컴파일을 더 잘 처리하였습니다. 왜냐하면 모두 UE5.1+와 함께 제공되는 자동으로 실행되는 셰이더 사전 컴파일 기능을 사용하는 것처럼 보입니다. 이 시스템은 셰이더 변형을 분류하고 화면에 필요할 때 바로 준비하여 필요한 경우에 따라 개발자가 지연시키는 능력이 있습니다.

이 방법은 잘 작동하지만 완벽하지는 않습니다 – 내가 테스트한 거의 모든 타이틀은 일부 셰이더 컴파일 중단을 가지고 있었습니다. 로보캅, Lords of the Fallen 및 Desordre 세 개만이 셰이더 컴파일 중단이 없었는데, 이들은 새로운 JIT 시스템을 사용하고 게임 시작 전에 전용 사전 컴파일 단계를 가지고 있기 때문입니다. 나는 모든 개발자가 이런 방식을 모방해야 할 것이라고 생각하는데, 이는 이러한 게임이 게임 플레이와 그래픽에서 간섭을 덜 받으면서 흥미롭게 보여줄 수 있는 기회를 제공합니다.

DF 도구에서 Jusant의 frame-time 스파이크가 보이는 스크린샷
텍스처가 거의 없고 4GB의 설치 크기를 가진 Jusant 데모는 여전히 이동 중 단절에 시달립니다. | 이미지 제공: Digital Foundry

아쉽게도 UE5도 거의 모든 UE4 게임에서 경험하는 이동 중 발생하는 트래버스 스터터를 보여줍니다. 게임 세계를 이동할 때 자산을 로드하거나 언로드하는 것에 의해 유발되는 프레임 시간의 상승은 내가 테스트한 게임 중 거의 모든 타이틀에서 발생했습니다. 심지어 텍스처가 거의 없고 4GB인 Jusant 데모도 강력한 12900K에서 가끔 발생했습니다. 이는 셰이더 컴파일 스터터와는 별개의 문제이며, 개발자들이 이 문제를 얼마나 제어할 수 있는지 확실하지 않습니다. 실제로 이는 언리얼 엔진의 내재적인 특성일 수도 있습니다.

이러한 트래버스 스터터는 게임 플레이 경험에 부정적인 영향을 미치며 반복적으로 발생하며, 셰이더 컴파일 스터터와는 다릅니다. 이들의 영향을 최소화하는 유일한 방법은 빠른 CPU와 빠른 RAM을 사용하는 것입니다. Lords of the Fallen과 Fort Solis는 모두 아름다운 게임이지만, 전자의 트래버스 스터터와 후자의 트래버스 및 셰이더 컴파일 스터터로 인해 그들의 분위기와 순조성이 저하됩니다.

트래버스 스터터를 복잡하게 만드는 한 가지 요소는 이 첫 번째 일괄의 UE5 게임들이 단일 실행 스레드에 의존하고 현대적인 멀티 스레드 프로세서를 제대로 활용하지 못한다는 것입니다. 우리는 추가적인 스레드를 사용할 때 더 많은 성능이 발휘되는 것을 기대할 수 있지만, 때로는 스레드 개수가 늘어남에 따라 성능이 감소하기도 합니다. 예를 들어 Lords of the Fallen의 경우 12900K를 모든 E-코어와 8개의 P-코어 중 6개만 활성화하고 하이퍼스레딩을 비활성화한 경우가 가장 높은 프레임률을 제공합니다. 모든 코어와 스레드를 사용하는 경우 프레임률이 최대 10%까지 감소합니다. 여기서 CPU 코어 2개만 완전히 로드되고 나머지는 사용되지 않습니다. Cyberpunk 2077은 스레드 스케일링이 어떻게 작동해야 하는지의 예시로, 6개 이상의 코어에 액세스 할 때 상당한 성능 향상을 보입니다.

12900K (활성 코어) 6개의 P-코어 8개의 P-코어 8개의 P-코어 + 8개의 E-코어
UE 5.2 Electric Dreams 100% 106% 111%
Cyberpunk 2077 100% 116% 131%
Lords of the Fallen 100% 93% 91%

2023년 Unreal Fest의 Mihnea Balta에 의한 Rendering Roadmap 프레젠테이션을 기반으로 한 증거 몇 가지는 Epic이 UE5.4에서 엔진의 멀티 스레딩을 개선하려고 하는 것처럼 보입니다. 5.3에서는 여전히 UE4의 잔존물인 멀티 스레딩을 큰 부분으로 사용하고 있습니다. RHI와 렌더 스레드를 더 병렬화하고 불필요한 작업을 줄이면 UE5에서 CPU 성능이 크게 향상될 수 있으며, 이는 스터터 상황을 개선할 수 있습니다.

마지막으로 간단히 언급하고 싶은 것은 텍스처 품질입니다. 이는 Nanite 가상 텍스처를 사용하여 출시된 UE5 게임의 특징이었습니다. GPU에 매우 부담이 없는 텍스처 품질이라 불평하기가 어렵습니다. 4K에서 최대 설정에서 8GB 이상의 VRAM이 필요할 때도 드물지 않게 사용되었습니다. 그러나 이 시스템은 때로는 GPU에 로컬로 저장된 텍스처 정보가 매우 적은 경우가 있습니다.

제가 이 비디오를 위해 테스트한 일부 타이틀에서는 가끔 RTX 4090에서도 카메라에 가까운 곳에서 명백한 텍스처 팝인이 발생했습니다. 예를 들어 Fort Solis에서는 많은 텍스처가 종종 카메라 컷 중에 페이즈인되었습니다. 따라서 VRAM 캐싱이 얼마나 많이 발생하는지 더 많은 사용자 제어를 허용하거나, 사용되지 않는 VRAM의 양을 감지하면 스트리머가 더욱 탐욕스러워지도록 허용하는 것이 더 합리적일 수 있습니다.

Immortals of Aveum은 Fortnite 이후 처음으로 Unreal Engine 5의 혁신적인 기능을 사용한 타이틀 중 하나였습니다.

요약하면, 이 글을 위해 플레이한 모든 UE5 타이틀은 각각 그들만의 아름다움을 가지고 있었습니다. 올바른 예술 작품과 방향으로 이들 게임은 절대적으로 놀라울 수 있습니다. 또한 내가 테스트한 많은 타이틀에서 여러 가지 다른 이미지 재구성 기술을 선택할 수 있는 능력을 보는 것을 좋아했습니다.

그럼에도 불구하고, 가끔씩 그 엔진의 오래된 문제가 나타나는 것을 볼 수 있습니다. 거의 모든 제목들을 테스트한 결과, 셰이더 컴파일 스털과 탐색 스털이 가장 흔히 제기되는 불만사항이었습니다. 셰이더 컴파일 스털은 UE4 제목에서 거의 지속적으로 나타났던 모습으로부터 개선되었으나, 새로운 UE5 자동 셰이더 캐시 시스템 위에 전용 사전 컴파일 단계를 갖춘 게임들만이 이 귀찮음으로부터 자유로웠으며, 이 접근 방식은 더 많은 개발자들이 본뜬 다음에 따라야 할 것입니다.

일반적으로 다른 문제 중에 가장 많이 본 것은 대부분의 게임들이 그래픽 옵션 메뉴에서 제한된 컨트롤만 노출시켜 출시된 것입니다. 성능과 품질 사이에서 더 나은 균형을 위해 하드웨어 루멘과 가상 그림자 맵과 같은 기능을 사용자가 선택적으로 켜고 끌 수 있도록 하는 것이 좋을 것입니다. 현재 많은 게임들은 소프트웨어 루멘만 사용하고 그 이상의 메뉴 옵션은 매우 기본적입니다.

그럼에도 불구하고, 확실히 Unreal Engine 5는 적어도 올바른 방향으로 추세를 이루고 있다는 것은 분명합니다. Unreal과 게임 개발자 양측에 충분한 압력이 가해진다면 현재의 일부 작품들을 늪에 빠뜨리는 성능 문제와 옵션의 혼동없이 진정한 그래픽 향상을 즐길 수 있는 꿈에 더 가까워질 수 있을 것입니다.