Nvidia의 Blackwell 플랫폼은 당연히 흥미로운 새로운 기술과 작업 방식으로 가득 차 있습니다. 이번에는 Nvidia RTX 5090 그래픽 카드를 보고 있는데, 그 뒤에 있는 칩은 GB202라는 매우 눈에 띄는 이름을 가지고 있습니다.
우리는 모든 것을 세밀한 빗으로 살펴보지 않을 것인데, 그렇게 하면 이 리뷰가 10페이지가 될 것이기 때문입니다. Nvidia는 하드웨어와 관련하여 이미 너무 작은 크기로 줄어들어 더 이상 밀어붙이는 데 문제가 있기 때문에 AI에 더 집중하기로 결정했습니다. 이러한 수준에서 Diminishing Return 는 심각한 문제입니다. 이상적으로, 나는 기술적으로 매우 인상적이기 때문에 실제로 모든 것을 살펴보고 싶지만, 울트라 하드코어 기술 괴짜가 아닌 다른 사람에게는 말도 안 되는 이야기일 뿐이지만 그럼에도 불구하고 인상적입니다.
디자인부터 시작하겠습니다. Nvidia는 제가 좋아하는 중공업 및 기능 기반 디자인을 유지했으며 이제 이중 블로우 스루 디자인으로 이동했습니다. 즉, 중앙에 칩이 있고 양쪽에 대칭으로 배열된 냉각 파이프가 있는 PCB이며, 각 파이프에는 카드를 통해 공기를 끌어들이는 자체 팬이 있습니다. 더 논리적인 방법처럼 보이며이 솔루션과 이전 디자인 사이의 많은 중간 단계를 이해하는 것은 약간 어렵습니다.
이는 또한 카드가 이제 전통적인 2슬롯 디자인으로 크기가 크게 향상되었음을 의미합니다. 불행히도 여전히 길이가 30cm가 넘는데, 제 생각에는 여전히 너무 많습니다. Nvidia는 이 Founder's Edition 가 일반적으로 33-35cm를 관리하는 작은 SFF 인클로저에 들어갈 수 있다고 주장했지만 직접 시도하지는 않을 것입니다.
또한 전원 커넥터는 카드에서 수직으로 확장되지 않지만 각도가 있어 이전보다 훨씬 덜 돌출되어 있습니다. 새로운 전원 어댑터는 땋아지거나 매우 뻣뻣하지 않은 훨씬 더 유연한 케이블로 설계되었으며 이는 또한 도움이 됩니다. 어댑터에 대해 말하자면, 전용 코드가 있으면 전용 코드를 권장합니다. 주의 깊은 독자는 이제 8핀 전원 케이블에 대한 연결이 3개가 아니라 4개라는 것을 알게 될 것입니다. 좋은 소식은 올바른 커넥터를 사용하면 실제로 3개로 작업을 수행할 수 있지만 일부 성능이 저하되지만 일반적으로 10-15%에 불과하다는 것입니다. 나쁜 소식은 비용 대비 완전한 가치를 얻으려면 4가지가 모두 필요하므로 시스템을 통해 575.8와트가 소비된다는 것입니다. 저런. 최신 CPU가 많은 전력을 소비하기 때문에 에너지 효율이 더 높아진 것은 좋은 일입니다. GPU는 약속된 2407MHz보다 약간 높으며 공식적으로 2209MHz인 RAM 속도도 마찬가지입니다.
그러나 내부로 돌아갑니다. 이제 최대 32GB의 GDDR7 VRAM이 있습니다. 말도 안 돼요. 4nm TSMC 생산 플랫폼, 920억 개 이상의 트랜지스터 및 PCIe 5.0 연결이 실제로 작용합니다. 우리는 1.79TB / s의 VRAM 대역폭에 도달했습니다. 그 외에도 21,769 Shading Units (일명 Stream Processors - 대략 말하면 대부분의 작업을 수행하는 사람들입니다)가 이제 Neural Shading 를 지원하므로 이 수준까지 생성 AI를 지원합니다. 이론적으로 이를 통해 무엇보다도 이전보다 훨씬 더 높은 수준의 빛, 그림자 및 반사를 가진 얼굴을 실시간으로 그래픽할 수 있으며, 게임 개발자가 이를 활용하기 위해 리소스를 할당할 수 있다면 그래픽의 현실감이 크게 향상될 것입니다. 다른 많은 내부가 있지만 대부분의 사람들에게 가장 관련성이 높은 것은 최신 세대의 170 Ray-Tracing 코어와 680 Tensor 코어가 있으며 이들은 업 스케일링 및 Deep Learning 와 관련된 모든 것을 담당합니다.
출력에는 HDMI 2.1b 1개와 DisplayPort 2.1b 3개가 포함됩니다. 표준이 아직 기술적으로 완성되지 않았기 때문에 너무 새로운 DisplayPort 표준으로 무언가를 시작할 때 HDMI 포트가 2.2가 아니라는 것이 약간 이상합니다. 약간의 압축으로 4K/480Hz 또는 8K/165Hz도 지원됩니다. 아마 나를 물어뜯을 것이지만 240Hz에서 4K는 가장 까다로운 게이머에게도 충분해야 하지만 모든 것을 더 원하는 e스포츠 플레이어가 있을 것입니다.
전문가용으로 GeForce 그래픽 카드를 사용하는 사람들이 처리 능력뿐만 아니라 인코딩 및 디코딩도 크게 업그레이드했기 때문에 구입하고 싶어할 것이라는 사실을 제외하고 특히 한 가지를 강조해야 한다면 DLSS 4가 될 것입니다. 그들은 완전히 새로운 업스케일링 방식으로 전환하고 소위 Transformer 모델로 전환했는데, 이는 실제로 훨씬 적은 고스팅과 훨씬 적은 인공물을 의미합니다. 사실, DLSS 4는 큰 진전이라고 말할 수 있습니다. 그런 다음 더 논란의 여지가 있는 부분, 즉 Multi Frame Generation 가 있습니다. 예전에는 두 개의 "진짜" 이미지 사이에 하나의 인공 이미지를 얻었지만 이제는 최대 세 개까지 얻을 수 있습니다. 이로 인해 많은 사람들이 "가짜" 이미지를 비판하게 되었지만, 아마도 잊혀진 것은 최신 세대의 그래픽 카드가 컴퓨터의 프로세서 자체가 아닌 그래픽 카드에서 훨씬 더 많은 작업을 수행할 수 있다는 것입니다.
최신 게임의 더 많은 그래픽은 계산할 기존 데이터 세트가 아닌 게임에서 직접 생성됩니다. 이를 위해서는 많은 컴퓨팅 성능이 필요하지만 Reflex 2 시스템을 사용하면 지연을 최소화할 수 있습니다. 그러나 우리는 특히 많은 빛과 그림자 요구 사항과 그래픽 카드가 자체적으로 더 많이 생각한다는 사실로 인해 그래픽 생성에 대한 완전히 다른 사고 방식에 익숙해져야 합니다. 우리는 부두교를 켜지 않고 기본 결과가 있는 벤치마크를 계속 표시할 것입니다.
그 전에 한 가지를 바로 잡아야 합니다: 가격. 우리가 여기에서 빌린 것과 같은 최고급 모델은 저렴하지 않습니다. £1,939/$1,999이며 Nvidia에서 만들지 않은 상점에서 구입할 수 있는 카드는 아마도 더 비쌀 것입니다. 이 카드가 주류 소비자를 대상으로 하지 않는다는 것을 분명히 나타내는 무섭고 미친 가격이며, 이는 200+ Hz 주사율의 빠른 모니터에서 4K로 게임을 하는 사람들을 대상으로 하기 때문에 아이러니합니다. "단지" £979/$999인 RTX 5080 카드와 더 저렴한 두 개의 RTX 5070 카드(약 £539/$549)로 상황이 조금 더 재미있어집니다. 그들은 완전히 동일한 4K 기능을 가지고 있지 않을 수 있지만 상대적으로 더 많은 사람들이 갑자기 참여할 수 있는 가격으로 RTX 50 Series 의 모든 장점을 얻을 수 있습니다. 그러나 1년 반도 안 되는 기간 동안 RTX 4090에서 수백 파운드의 가격 인상은 인플레이션이나 다른 어떤 것으로도 변명할 수 없으며 순수한 광기일 뿐입니다. 그러나 Nvidia의 XX90 카드 구매자는 우리처럼 결코 같지 않았습니다.
이제 재미있는 부분인 벤치마크를 살펴보겠습니다. 우리는 X870E 플랫폼에서 사용할 수 있는 드라이버와 드라이버와 그래픽 카드 모두에 대해 PCIe 5.0 플랫폼에서 실행되는 모든 것을 사용하여 가능한 한 올바르게 만들려고 노력했습니다.
열 출력은 매우 놀라웠습니다: 섭씨 48도에서 유휴 상태, 최대 섭씨 72도, 대부분의 시간 동안 섭씨 63도를 유지했습니다. 또한 테스트 벤치는 최대 공기 흐름을 위해 설계되었지만 그럼에도 불구하고 인상적입니다. 소음은 41.5dB에 달했지만 매우 낮은 주파수입니다. 코일 윙윙 거리는 소리, 팬 블레이드 소음 또는 최악의 경우 난기류가 없습니다. 그래서 잘 한 일입니다.
DLSS 4의 두 배인 성능은 RTX 4090의 두 배이며 원시 처리 능력에서 여전히 인상적입니다. RTX 4080 Super 의 성능의 두 배이며 일부 테스트에서는 더 많습니다. 또한 여러 게임에 대한 새롭고 더 거친 Ray-Tracing 모드가 있지만 이전 카드로는 이에 대한 데이터를 수집할 수 없었기 때문에 포함되지 않았습니다.
여기에서 Port Royal 는 RTX 4090보다 50% 개선된 대부분의 영역에서 엄청난 개선을 볼 수 있습니다.
V-Ray 6 는 견고한 벤치마크 도구와 CPU와 GPU 모두에 대한 여러 유형의 렌더링을 위한 전용 모드가 있는 렌더링 프로그램입니다. 점수는 RTX 4080 Super 가 할 수 있는 것의 3배이지만 15x RTX 4090이 세운 세계 기록과는 거리가 멉니다. 예, 전문가용입니다. Black Myth: Wukong 에는 실제로 그 가치를 보여주는 멋진 벤치 마크 도구가 있습니다: 4K, 최대 모든 것, 32 FPS를 제공합니다. 56을 Frame Generation 로 바꿉니다. 우리는 이 벤치마크를 오랫동안 사용할 것입니다. 그리고 게임용으로!
Total War 는 여전히 보조 기술을 사용하지 않으며 CPU와 GPU에 강하지만 여전히 RTX 4090에 비해 60% 개선된 기능을 제공합니다.
Assassin's Creed 와 Far Cry 6 는 불행히도 나이를 보여주고 있으며 4K에서 해내는 데 여전히 많은 시간이 걸리지만 나머지는 그다지 중요하지 않습니다.
DLSS 3가 여기서 상당한 차이를 만들지만 주목해야 할 것은 거의 100FPS로 실행될 수 있다는 사실입니다. 이것은 불행히도 많은 그래픽 카드가 자주 충돌하는 테스트이며 값비싼 모델조차도 50FPS 이상을 가져오는 경우가 거의 없습니다.
DLSS 4를 정말 성공적으로 구현했습니다. 인공물, 이상한 결함, 고스팅 또는 다른 어떤 것도 없었기 때문에 네이티브와 Frame Generation 의 차이를 구별하는 것이 사실상 불가능했습니다.
그동안 다음과 같은 이점을 얻을 수 있습니다.
여기에는 네이티브와 Multi Frame Generation 의 차이를 구분하는 것이 사실상 불가능한 매우 성공적인 통합도 있었습니다.
자, 여기에 큰 질문이 있습니다: 하나를 사야합니까? 조금 복잡합니다. DLSS 4는 게임 체인저라고 할 수 있습니다. 품질 설정을 가지고 놀고 있다면 Ray Reconstruction 및 DLAA에 이미 익숙할 수 있지만 업스케일링, 즉 DLSS 사용 시 Transformer 모델로의 전환이 매우 눈에 띕니다. RTX 40 Series 카드에 상당히 만족한다면, 특히 RTX 40 Series 카드로 전환하는 것만으로도 최대 10%의 성능 향상이 있을 것이라는 소문이 있기 때문에 전환하는 것이 그다지 의미가 없을 수 있습니다.
반대로 Multi Frame Generation 은 RTX 50 Series 에서만 사용할 수 있으며, 특히 4K 네이티브로 모든 것을 끌어올 수 있을 만큼 강력한 카드와 결합할 때 가격 대비 인상적으로 잘 작동하는 것 같습니다. 불행히도, 가격은 아마도 나의 가장 큰 문제 일 것입니다. 가격을 조금 올리거나 같은 수준으로 유지했다면 기뻤을 텐데 20% 가까이 인상하는 것은 너무하다. 전작보다 훨씬 강력하더라도 절대 플래그십 모델로 기대하기 때문입니다.
반면에 RTX 3090과 같은 구형 카드가 있는 경우 4K로 플레이하려면 업그레이드해야 할 것입니다. Gamereactor에서 살펴보는 점점 더 많은 게임이 최적화되지 않고 PC에 매우 잘 적용되지 않기 때문에 항상 많은 마력을 사용할 수 있어야 합니다. 그러나 Nvidia는 비판에 귀를 기울이고 더 나은 전원 연결과 더 작은 카드를 만든 것에 대해 칭찬해야 합니다. 하지만 4개의 8핀 연결? 보기에는 여전히 완전히 비현실적입니다.