기다리던 녀석이 왔다, AMD Radeon HD 7970 올 해의 큰 빅 매치는 아무래도 인텔과 AMD 프로세서의 격돌이었다. 이에 대한 결과는 아쉽게도 AMD의 큰 패배로 돌아갔지만 그래픽코어와 프로세서코어를 하나로 만든 APU 라는 개념의 프로세서를 출시 했다는 정도로 AMD의 올 해 성적표는 정말 초라했다. 그러나 내년 그래픽 카드 시장의 향배를 알 수 있는 라데온 VS 지포스 의 대결 구도는 내년에 출시될 몇 가지 대작 게임들과 맞물리면서 많은 사용자들이 관심을 갖고 있는 부분이다. 차세대 그래픽 카드의 포문을 먼저 연 진영이 바로 AMD의 라데온 HD 이다. 오늘 브레인박스에서는 이 새로운 그래픽 카드가 기존의 AMD 하이엔드 그래픽 카드와 어떤 차별점을 갖고 출시가 되었으면 지포스 GTX 580 과는 또 어떤 성능 차이를 보일 것인지 살펴보는 좋은 자리를 갖도록 하겠다. |
VLIW ? 이전 세대의 AMD GPU 세대는 한정적인 GPU의 성능과 메모리의 효율을 위해 많은 GPU 데이터와 명령어를 타이트하게 팩킹하여 계산하는 VLIW (Very Long Instruction Words) 라고 불리우는 기술을 이용해 처리했다. 이와 같은 형태는 특정 게임 등에서 탁월한 성능을 보여주었지만 현재에서는 그렇게 효율성 있는 기술로 보기 힘들었다. 즉 현재 VLIW 를 통한 GPU의 설계는 성능상에 한계를 찍었다는 의미이기도 하다. AMD에서는 기존에 사용되고 있는 VLIW와 병렬처리에 최적화된 GPU를 장점을 살려 새로운 기술을 만들어내게 되었다. 그것이 바로 "GCN" 이다. GCN은 SIMD 라고 불리우는 (한개의 명령어, 여러개의 데이터) 기술을 대신하는 기술로 한 개의 VLIW 명령어를 통해 1개의 ALU 명령어로 4개의 SIMDs 를 처리하는 기존의 SIMD 명령어 처리 방법을 한단계 묶어주는 방법을 취했다. GCN이 적용된 타히트 GPU는 기존의 그래픽카드가 순순한 그래픽 엔진이라는 범주 보다 독립적인 하나의 벡터 프로세서처럼 작동을 한다. 각 GCN는 독립된 하나의 빌딩 처럼 자체 적용 L1 캐쉬를 갖고 있는데 4개의 코어가 각각 16kb의 명령어 캐쉬와 32km 의 데이터 캐쉬를 갖고 있으며 각 캐쉬들은 L2 캐쉬를 공유하여 각 GCN 사이에 데이터를 이동시킬 수 있다. AMD에서는 GCN기술을 바탕으로 하위 모델을 내년 1분기 중에 현재 HD 6800 시리즈를 대체할 코드명 "Pitcairn" 과 HD 6700 시리즈를 대체할 "Cape Verde" 로 출시할 예정이다. 코드명 Tahitl (타히티) AMD HD 7970의 GPU는 대만의 TSMC를 통해 28nm 공정으로 만들어지고 있다. 라데온 HD 7970에 사용되는 GPU는 4십억개 이상의 트랜지스터가 집적이 되었으며 365mm² 다이 사이즈를 갖는다. AMD의 마케팅 메이저는 AMD의 28nm 공정의 GPU는 좋은 수율로 생산이 되고 있으며 이로 인해 양산품 상태의 GPU의 생산 숫자를 예측 가능하기 때문에 예전에 발생했던 수급문제는 없을 것이라고 단언했다. 타이티 아키텍쳐의 근간은 앞서 설명했던 32개의 GCN 연산 속도이다. 32개의 GCN는 총 2,048의 스트림 프로세서를 갖고 있으며 AMD의 새로운 SIMD 명령어가 적용되어 있다. 현재 판매가 되고 있는 라데온 HD 6970의 경우는 1,536개의 스트림 프로세서를 갖고 있지만 효율성에서 타히티 GPU가 현저히 앞서고 있기 때문에 스트림 프로세서 갯수의 차이 보다 더 많은 성능 향상이 있다는 점을 주목할 필요가 있다. 라데온 HD 7970 은 768KB의 L2 캐쉬를 갖고 있으며 클럭당 32 컬러 ROPS와 128 Z/스텐실 ROPS를 처리가 가능한 8개의 렌더링 백엔드를 갖고 있어 기존의 HD 6970 보다 높은 효율성을 자랑하며 이와 더불어 384 bit, 3GB GDDR5 메모리와 PCI-E 3.0 버스를 통해 GPU는 최대 264GB/s의 대역폭을 갖게 된다. 또한 타히티 GPU는 텍스처 처리를 향상시켰는데, 기존의 그래픽 카드에 장착된 메모리는 대부분이 여러가지 종류의 서로 연관성이 있는 커다란 크기의 텍스처 데이터로 채워져 있었다. 게임 엔진의 성능을 향상 시키기 위해서 버추얼 텍스처 혹은 메가 텍스처를 처리하기 위해 가상적으로 약 32TB 까지 텍스처 크기를 늘렸다. 기존의 라데온 HD 6970의 경우는 텍셀레이션 성능이 엔비디아의 GTX 580 보다 현저히 떨어졌다. 이를 해결하기 위해 AMD에서는 GCN에 들어가는 캐쉬와 사용되고 있는 버텍스를 다시 한번 사용함으로써 이를 해결했다. AMD에서는 게임들 마다 차이가 있지만 HD 6970 보다 최대 약 4배 정도 빠른 텍셀레이션 성능을 갖고 있다고 주장했다. 그리고 쿠다 혹은 스트리밍 프로세서에 관련 부분 역시 강화가 되었다. 타히트는 2개의 비동기화된 엔진을 갖고 있는데 비동회기가 되었다는 것은 2개의 엔진시 서로 독립적인 부분에서 영향을 미치지 않기 때문에 완전히 병렬적으로 처리가 가능하다는 것을 의미한다. 이는 스케쥴링과 명령어의 디스패치 그리고 분기등을 포함하는 컨텐츠 스위칭이 기존 세대 보다 현격히 빨라졌기 때문이며 엔진 당 독립적인 DMA (Direct Memory Access)를 갖고 있어 16배속의 PCI-E 3.0 를 사용한다면 보다 빠른 성능을 기대할 수 있다. 이로 인해 비디오 트랜스 코딩의 성능이 무척 향상 되었다고 한다. |
라데온 HD 7970에 포함된 GPU는 코드명 "타히티" 라고 불리우며 64개의 ALU를 갖고 있는 32개의 CU가 협쳐진 형태로 타히티가 갖고 있는 ALU의 갯수는 64 X 32 = 2048개의 ALU를 하나의 GPU에 갖고 있는 셈이다. 이 GPU들은 925MHz 로 동작을 하는데 유기적으로 ALU의 작동으로 최대 3.8 TFLPS의 처리 속도를 갖는다. 보다 작아진 소비전력, 제로 파워, 파워튠 우선 타이티 GPU가 28nm 공정으로 작아지면서 기존 HD6970의 대기 모드 상태의 소비전력이 20와트 였던 것에 비해 HD 7970은 15와트 밖에 되지 않는다. 또한 "Zeropower" 라고 불리우는 소비전력량을 더 줄이는 기술이 포함이 되었는데 제로 파워 모드에 들어가면 그래픽카드의 쿨링팬 조차도 돌리지 않는다. 이 상태로 들어갔을 때 그래픽 카드는 고작 3와트 밖에 전력을 소비하지 않는다. 제로파어는 AMD 그래픽 카드를 2개 이상 사용하여 크로스파이어-X를 구성했을 때 주력으로 사용하는 그래픽 카드외에 카드들을 3와트의 소비전력만 사용하도록 하게 만드는 멀티 그래픽 환경 기반의 소비 전력 기술이다. 여기에서 3와트 소비전력은 컴퓨터 시스템을 껐을 때 그래픽 카드가 소비하는 유휴 전력량이다. 여기에 추가적으로 그래픽 카드가 작동하는 상태에 따라 코어 클럭 및 메모리 클럭을 유기적으로 조절하는 "PowerTune" 기술을 탑재했다. 이 기술은 한 개의 마이크로 모니터 칩셋을 장착하여 그래픽 카드에 발생하는 열과 전력 소모량을 측정하여 코어의 전압과 속도를 실시간으로 조절하는 기술로 타이티의 최대 동작 속도인 925MHz 에서 최대 250 와트의 TDP가 발생한다고 한다. PCI Express 3.0를 지원하는 첫번째 그래픽카드 라데온 HD 7970은 첫번째로 PCI-E 3.0 를 지원하는 공식 그래픽 카드가 되었다. 현재 통상적으로 사용하고 있는 PCI-E 2.0 16 배속은 프로세서의 발전과 더불어 게임의 성능을 병목 현상을 일으키는 주범으로 생각되어 왔다. 또한 멀티 그래픽 카드 기술을 사용할 때는 16배속와 8배속이 혼용이 되거나 8배속이 2개로 동작하는 형태를 띄기도 했다. 인텔의 2세대 코어 i7 프로세서가 출시 되면서 PCI-E 3.0를 공식적으로 지원하는 첫번째 프로세서가 되었는데 PCI-E 3.0 의 이론적인 데역폭은 초당 16GB 나 된다. 하지만 이 대역폭을 완벽하게 소화할 만한 어플리케이션 혹은 게임이 없기 때문에 정확한 성능 측정을 위해서는 보다 많은 테스트가 이루어져야할 것으로 보인다. 아이피니티 2.0 멀티 모니터 기술인 아이피니티 역시 이번 타히티를 통해 향상되었다. 하나의 그래픽 카드로 5 X 1 모드로 모니터를 총 6개 사용할 수 있으며 다중 디스플레이를 통해 얻을 수 있는 최대 해상도는 16K X 16K 로 올라갔다. 또한 서드 파티 제조사가 만드는 3D 안경와 모니터를 지원하여 향상된 스테레오스코픽 3D를 지원한다. 라데온 HD 7970은 디스플레이 포트를 통해 3D 모니터와 연결이 될 때 3D를 즐길 수 있으며 현재 라데온 HD 7970은 하나의 듀얼 링크 DVI와 2개의 미니 디스플레이포트 그리고 HDMI 1.4a 포트를 갖고 있다. 아이피니티 2.0 의 큰 변화는 DDMA(Discrete Digital Multi Point Audio) 라는 흥미로운 기술이 포함되었다는 사실이다. 이 기술은 각 모니터에 뿌려지는 화면에 맞추어 소리를 보여준다는 의미로 예를 들어 3개의 모니터로 각기 다른 게임을 한다고 가정할 때 각 모니터에 진행되는 게임의 배경음 혹은 효과음이 해당 모니터로 나온다는 의미이다. 즉 3개의 오디오 트랙을 독립적으로 재생한다는 것이다. 앞서 든 예와 같이 3개의 모니터와 |
이번에 새롭게 출시된 라데온 HD 7970의 가장 큰 특징은 기존의 라데온 HD 6XXX 시리즈의 마이너 업그레이드 버전이 아닌 Fully 버전 업된 완전히 다른 구조의 GPU 기술을 탑재한 첫번째 그래픽 카드라는 사실이다. 그 외에도 이 그래픽 카드는 몇가지 기념비적인 부분이 있는데 첫번째로 마이크로소프트의 다이렉트X 11.1 를 공식 지원하며 28nm 공정으로 만들어진 40억개 이상의 트랜지스터가 집적이 되었는데 이는 수치는 라데온 HD 6870 보다 약 160% 많은 트랜지스터가 들어갔음을 의미 하지만 이는 기존 카이맨 코어의 365mm² 다이 크기에서 타히티 코어는 389mm² 정도로 그다지 큰 폭으로 다이크기가 늘어나지 않았다. 타이티 코어라고 불리는 차세대 GPU 기술은 가장 큰 장점은 바로 작아진 공정에서 오는 효율성이다. 이 효율성은 2가지 측면으로 해석이 가능한데, 첫째는 동일한 실리콘 다이에서 28nm 공정으로 보다 많은 GPU가 나오게 되므로 높은 부가가치가 생긴다는 것이며, 두번째는 기존 카이맨 코어와 동일한 TDP를 갖기 때문에 발열적인 부분에서도 늘어난 성능에 비해 상대적으로 줄어든 소비전력량을 갖는다는 사실이다. 이는 GTX 580의 페르미 기반의 코어 보다도 훨씬 작기도 하다.
|
라데온 HD 7970의 기판을 살펴보기 위해서는 약 20 개 정도의 나사를 풀러줘야 가능했다. 이 처럼 많은 나사를 사용하는 건 장착되어 있는 쿨러 자체의 무게가 무겁기 때문으로 보여진다.
|
그리고 이 프로세서를 안정적으로 사용하기 위해 역시 아수스 메인보드 중에서 최고가 제품인 ROG 램페이지3 포뮬라가 사용되었다.
|
테스트 세팅
|
테스트 세팅
|
테스트 세팅
|
Metro2033 세팅
|
테스트 세팅
|
HAWX2 테스트 세팅
|
Lost Planet2 테스트 세팅
|
에이리언&프레데터, 테스트 세팅
|
Dirt2, 테스트 세팅
|
HAWX, 테스트 세팅
|
Just Cause2 , 테스트 세팅
|
바이오헤자드5, 테스트 세팅
|
테스트 세팅
|
스트리트파이터4 테스트 세팅
|
라스트 램넌트 테스트 세팅
|
소비전력 테스트 세팅
상대적으로 늘어난 트랜지스터양으로 큰 폭의 전력 소비량 상승으로 이어질 것으로 보였으나, 실상 결과는 완전히 달랐다. 이는 GPU의 공정이 작아진 부분들도 있는 것으로 보이며, 적극적인 전력 관리를 위해 추가적인 칩셋을 장착한 부분도 크게 작용한 것으로 보인다. 결과적으로 전세대의 HD 6970 과 GTX 580 보다는 아이들 상태에서 낮은 전력 소모량을 보였으며 풀로드에서는 GTX580 보다 상대적으로 낮은 전력 소비량을 보였다. |
라데온 HD 7970, 다이렉트X 11과 다이렉트X 9 기반 게임에서 뛰어난 성능 향상 그래픽 카드 테스트 슈트인 3DMark 계열의 결과는 모든 부분에서 기존 모든 그래픽 카드를 압도하는 성능을 보여주었다. 그리고 재미있는 사실은 다이렉트X 11 기반 테스트인 3DMark11 에서 엔비디아의 GTX580를 가볍게 넘어서는 큰 폭의 성능 향상을 보여주었다는 점이다. 또한 다이렉트X11과 다이렉트X 9 기반의 기반에서 예전 상위 그래픽 카드였던 HD 6970과 큰 폭의 성능 향상을 보여주었다. 단지 아쉬운 것은 엔비디아 그래픽 카드에 최적화가 게임에서는 HD 7970 이 GTX 580 과 비슷하거나 오히려 떨어지는 결과를 보여, 드라이버 혹은 게임 개발 단계에 그래픽 카드 제조사가 얼만큼 투자를 했느냐에 따라 프레임 차이과 직관된다는 것을 몇 가지 게임에서 잘 보여주었다. 하지만 많이 알려진 제작사 혹은 많은 사용자들이 기대하고 있는 대작 게임의 경우는 오히려 중간적인 입장에서 게임을 만들기 때문에 이번 테스트에서 볼 수 있었던 몇 몇 게임들은 우리가 예상했던 순위대로 성능을 보여주었다. 전반적으로 라데온 HD 7970은 새로운 게임에서 많이 사용하는 다이렉트X 11 기반 게임에서는 엔비디아 그래픽 카드들과 큰 폭은 성능 향상 혹은 차이를 있으며 현재 많은 게임들이 사용하고 있는 다이렉트X 9 기반의 게임에서는 기존 세대의 가장 빠른 그래픽 카드인 HD 6970에 비해 큰 폭의 성능 향상을 보여 주었다. 전력 소비량도 하이엔드 그래픽카드답게 비교적 높은 편이었지만 기존 세대의 제품과 비교해서 그리고 경쟁사의 상위 제품과 비교해서 상대적을 낮았다. 이는 AMD가 HD 7970 를 만들면서 상대적으로 전력 소비량 부분에서 많이 신경을 썼으며 28nm로 작아진 GPU 의 공정 역시 장점으로 작용한 듯 하다. 하지만 초기 라데온 HD 7970 제품은 레퍼런스 제품으로 각 제조사마다 동일한 형태를 갖는다. 그렇다 보니 제조사에 대한 로열티로 인해 약간의 가격차이는 발생할 것으로 보인다. 이번 테스트에 사용된 그래픽 카드는 AMD에서 제공된 레퍼런스로 실제 소비자들이 구매하게 될 초기 제품과 동일하다. 하지만 테스트 진행 도중에 풀로드시 발생하는 소음 문제는 레퍼런스 쿨러가 갖고 있는 단점으로 지적이 된다. 이 부분이 해결된 HD 7970를 구입하려면 각 제조사마다 조만간 생산하게 될 비-레퍼런스 규격의 제품을 구매하는 것을 권하고 싶다. 추후에 나올 하위 제품에 대한 더 큰 기대. 내년 1분기에는 대대적으로 타이티 아키텍쳐 기반의 다양한 하위 제품들이 쏟아져 나올 기세이다. 이때에 맞추어서 블리자드의 디아블로3가 나오는 등 몇 가지 킬러 컨텐츠라고 불리는 게임들이 나오게 될 것인데, 현재 스타 크래프트2와 동일한 엔진을 사용하기 때문에 다이렉트X9 에 그리고 프로세서 성능에 보다 의존적으로 것으로 보인다. 우리가 봤던 몇 몇 다이렉트X 9 게임들의 성능이 기존 세대인 카이맨 기반의 HD 6970 보다 많은 부분에서 늘어난 성능을 보였기 때문에 주력 모델인 라데온 HD 78XX과 77XX 대 에서도 좋은 성능 향상을 기대해볼 수 있게 되었다. 이번 리뷰는 단 기간에 밖에 샘플이 주어지지 않아서 리뷰가 미약하게 진행된 점 적지 않음을 사과드린다. 국내에 샘플이 몇 개 없어서 인지 아니면 다른 이유여서 인지 실제 테스트한 기간은 오래 되지 않는다. 사실 완전히 다른 플랫폼에서 여러가지 비교 테스트 그리고 그래픽 카드의 경우 해상도 마다 차이가 있으므로 보이는 결과 보다는 테스트 시에 소요되는 시간이 많이 걸리게 된다. 라데온 HD 7970의 가장 큰 장점 중에 하나는 바로 PCI-E 3.0 버스를 정식 지원한다는 점이다. 이 테스트를 제대로 해보기 위해서는 현재까지는 X79 칩셋 베이스 메인보드의 인텔 2세대 코어 i7 시스템에서 만이 가능하다. 그리고 크로스 파이어등의 멀티 GPU의 테스트도 역시 동일한 플랫폼에서 비교가 되어야 진정한 라데온 HD 7970 의 성능이 발휘가 될 것이다. 이 미진한 부분들은 조만간 다른 벤더들의 제품들이 출시가 될 예정이므로 그때 리뷰를 통해 자세히 다루도록 하겠다. PS. 각 제조사들이 라데온 HD 7970은 레퍼런스 모델로 AMD에서 공급을 해서 제조사의 박싱 형태로 판매가 이루어질 예정이다. 그런데 레퍼런스에 사용된 쿨러에서 문제가 생겨 정식 출시일인 1월 9일에 극히 적은 수량만 판매가 이루어질 듯 하다. 라데온 HD 7970를 구매하실 분들이라면 서둘러야 할 듯 하다. |