하드웨어 > 리뷰

28nm 공정으로 새로워진 "엔비디아 지포스 GTX680"

제목 없음


오랜 시간 기다려온 엔비디아의 지포스 GTX680 (케플러) 그래픽카드가 모습을 드러냈다. 지포스 GTX680은 기존 GTX500 시리즈와 전혀 다른 아키텍처, 새로운 공정으로 만들어진 제품이다. 엔비디아 측은 케플러를 만들기 위해 총 5년의 시간을 투자했다고 설명하고 있다. 그런 만큼 다른 어느 때보다 자신감을 내비치고 있다.

경쟁 제품인 AMD의 라데온 HD7970에 비해 다소 늦게 출시됐지만, 성능과 전력, 기능 등 모든 면에서 앞선 평가를 받고 있는 것도 엔비디아의 이런 노력이 들어갔기 때문일 것이다. 케플러 아키텍처 기반의 지포스 GTX680이 어떤 기술을 품고 있는지 알아봤다. 

 


◆ 3배 늘어난 쿠다 코어와 세계 최초의 6Gbps 메모리 탑재


지포스 GTX680의 코어 클럭은 1006MHz로 기존에 출시됐던 GTX580의 772MHz보다 크게 높다. 여기에 GPU 부스트 기술까지 더해져 부스트 클럭이 1058MHz다. 쿠다 코어의 개수도 GTX580이 512개였다면, GTX680은 1536개로 3배가 늘었다. 그만큼 GPU의 그래픽 연산 능력이 크게 증가한 것이다.

메모리의 제원도 좋아졌다. 기존 GTX580이 GDDR5 1.5GB를 사용했다면 GTX680은 2GB 메모리를 얹었다. 메모리 인터페이스가 384bit에서 256bit로 줄었지만 메모리 클럭은 4008MHz에서 6008MHz로 50% 늘었다.

 


▲ GTX680은 성능은 좋아지고, 전력은 줄었다

 

트랜지스터의 수는 기존의 30억개에서 35억 4000만개로 늘었고, 텍스처 유닛도 64개에서 128개로 2배가 늘었다. 이 같은 스펙의 증대에도 불구하고 소비전력은 오히려 낮아졌다. GTX580의 TDP가 244W라면 GTX680은 195W로 무려 50W 가까이 줄었다. 때문에 더 적은 전력으로 높은 성능을 낼 수 있게 된 것이다. 소위 말하는 '와트당 성능'이 크게 증가한 것이다.

 


▲ 세계 최초로 메모리 속도가 6Gbps를 돌파했다

 

GTX680의 스펙이 이처럼 좋은 이유는 공정의 미세화와 아키텍처의 변화라는 혁신이 있었기 때문이다. 설계 공정이 기존 40nm에서 28nm로 줄어들었고, 이를 통해 캐플러라는 새로운 아키텍처를 만들었기 때문에 성능과 전력의 향상을 유도해낼 수 있었던 것이다.

그래픽카드 인터페이스도 PCI-Express 2.0 에서 PCI-Express 3.0으로 늘어 GTX580의 16GB/s에서 2배 더 많은 32GB/s의 대역폭을 제공해 더 빠른 속도를 보여준다. 그야말로 환골탈태라는 말이 어울릴 정도로 큰 변화를 이룬 셈이다.

◆ 성능과 전력, 두 마리 토끼 잡은 케플러 아키텍처

지포스 GTX680은 기존 지포스 500 시리즈가 사용한 페르미(Fermi)의 성능과 전력 효율을 개선한 케플러(Kepler) 아키텍처로 만들어졌다. 케플러 아키텍처는 28nm 공정으로 빚은 엔비디아의 첫 작품으로 40nm 공정인 페르미를 모든 면에서 뛰어넘는다는 평가를 받고 있다.

 


▲ 케플러 아키텍처를 사용한 지포스 GTX680


케플러 아키텍처가 이렇듯 강력한 성능을 보여주는 이유는 여러 가지가 있지만, 무엇보다 페르미에서 SM(Streaming Multiprocessor)이라 불리던 구조를 개선한 SMX 구조를 도입한 것이 가장 큰 특징이다.

기존 페르미는 16개의 SM이 들어가 있었고, SM 당 32개의 쿠다(CUDA) 코어가 있어 총 512개의 쿠다 코어를 갖고 있었다. 케플러에서 SMX의 수는 16개에서 8개로 줄었지만, 하나의 SMX가 192개의 쿠다 코어를 갖고 있어 총 1536개의 쿠다 코어가 있어 효율적인 연산 처리가 가능해졌다. 여기에 함수연산을 위한 SFU도 4개에서 8배 늘어난 32개가 들어갔다. 

 


▲ 1536개의 쿠다 코어가 들어갔다


지오메트리의 연산 성능 강화를 위해 폴리모프 엔진을 2.0으로 업그레이드 했으며, 텍스처의 성능을 높이기 위해 텍스처 유닛도 기존의 64개에서 128개로 늘렸다.

또한 테셀레이션의 성능이 페르미보다 2배 가량 향상돼 DX11 환경에서 더욱 효율적인 성능을 발휘할 수 있게 했다. Warp Schedulers의 수도 4개로 기존보다 2배 늘리는 등 전체적으로 3D 그래픽에 필요한 유닛의 수가 크게 늘었고, 이를 바탕으로 그래픽 성능도 높아졌다.

 

▲ 폴리모프 엔진을 2.0으로 업그레이드


GTX680의 성능 더 높여주는 GPU 부스트 (GPU Boost) 기술

엔비디아 지포스 GTX680을 돋보이게 하는 기술이 바로 GPU 부스트(GPU Boost)다. 이 기술은 타사에서 선보였던 터보 부스트, 터보 코어 등의 기술과 비슷한 것으로 시스템의 로딩 상황에 따라 그래픽카드의 클럭을 자동으로 높여주는 것이다.

 


▲ GPU의 클럭을 자동으로 높여주는 GPU 부스트 기능

 

예를들어 GPU에 부하가 크지 않고 사용 전력이 낮다면, GPU의 클럭을 사용하지 않는 전력만큼 올리는 것이다. 게다가 오버클럭을 하더라도 GPU 부스트 기술이 적용되기 때문에 더 높은 성능을 기대할 수 있다.

 


▲ 오버클럭시에도 GPU 부스트 기능이 적용

 

그렇다고 GPU에 무리가 갈 정도로 클럭을 올리지는 않는다. 클럭의 상한선은 정해져 있지 않지만, TDP가 225W로 제한돼 있어 크게 무리가 가지 않는 선에서 GPU와 메모리의 클럭을 높여준다. 그래픽 프로그램을 실행시켰을 때 부스트 클럭이 기존 클럭에 비해 크게 올라간다. 엔비디아에서 발표한 부스트 클럭은 1058MHz이지만, 실제 프로그램 로딩 시 이보다 더 높은 클럭으로 작동하는 경우도 있다.


게임 이제는 끊김 없이 할 수 있다. Adaptive VSync 기술

케플러를 이야기하는데 빼놓을 수 없는 중요한 기술 가운데 하나가 바로 Adaptive VSync다. 이는 기존 수직동기화 기술의 단점을 보완해 프레임의 저하와 화면 깨짐 등의 현상을 방지하고자 만들어진 것이다.

기존 수직동기화(VSync) 기술은 모니터의 60Hz 주사율에 맞춰 게임의 초당 프레임을 그려내도록 설정하는 것으로 간혹 프레임이 급격히 떨어진다거나 화면이 깨지는 등의 현상이 발생하기도 한다.

 


▲ 수직동기화의 단점을 보완한 Adaptive VSync 기술

 

Adaptive VSync 기술은 이 같은 수직동기화의 부작용을 막고 원활한 그래픽 실행을 위해 만든 것으로 프레임이 60fps 이하로 떨어질 때는 아예 VSync 기술을 꺼버려 예상 가능한 문제를 최대한 막아준다.

 


Adaptive VSync 기술로 끊김 없는 게임 플레이가 가능

 

이로써 수직동기화로 인한 끊김 현상은 케플러 그래픽카드를 사용함으로 해결할 수 있는 것이다. 실제 같은 게임을 하더라도 Adaptive VSync 기술이 적용돼 있냐, 그렇지 않냐에 따라 평균 프레임의 차이가 나기 마련이다. 


◆ 게임 품질과 속도를 높여주는 FXAA와 TXAA 기술

또 하나 엔비디아가 자랑하는 기술이 바로 FXAA와 TXAA다. 먼저 FXAA는 기존의 안티 앨리어싱 (Anti-Aliasing)을 한 단계 진화시킨 것으로 그래픽 품질을 더욱 향상시켜줄 뿐 아니라 게임에서 더 빠른 속도를 낼 수 있게 해준다.

안티 앨리어싱은 소위 말하는 계단 현상을 줄여주는 것으로 게임마다 2배에서 최고 32배까지 적용할 수 있는 옵션을 마련해 놓고 있다. 이 안티 앨리어싱을 적용할 경우 계단 현상이 줄어 실사와 같은 화면을 감상할 수 있지만, 프레임의 저하가 크기 때문에 어지간한 고사양 PC가 아닌 이상 4~8배를 초과하지는 않는다.

 


▲ FXAA는 4배의 MSAA를 적용한 것보다 빠르다

 

하지만 케플러에 적용된 FXAA는 4배의 MSAA를 적용한 것보다 60%나 속도가 빠르면서 더 매끄러운 화질을 보여준다. 실제로 에픽게임즈의 사마리아인 데모 영상 실행시 4배의 MSAA을 적용한 것보다 화질과 프레임 등에서 앞서는 것을 확인할 수 있었다.

엔비디아는 사마리아인의 데모 영상을 실행하기 위해 GTX580 3개가 필요했다면 GTX680은 1개만 있으면 된다고 밝혔다. 전력과 소음, 발열 부분에서 더 유리한 것이다. FXAA는 에픽게임즈와 크라이텍 등 유명 게임사에서 차기 게임에 적용할 것으로 보인다.

 

 
▲ 사마리아인 데모 실행 위해 GTX580은 3개가 들어가는 반면 GTX680은 1개면 가능

 

TXAA는 하드웨어 멀티 샘플링 기술로 그래픽 보정 능력에 따라 TXAA1과 TXAA2로 나뉜다. 엔비디아에 따르면 엔비디아에 따르면 TXAA1은 2배의 MSAA와 비슷한 성능으로 8배의 MSAA보다 좋은 품질을 보여주며, TXAA2는 4배의 MSAA와 비슷한 성능으로 8배의 MSAA보다 좋은 품질을 보여준다고 한다.

 

 
▲ 하드웨어 멀티 샘플링 기술인 TXAA가 적용됐다

 

미디어잇 홍진욱 기자 honga@it.co.kr
상품지식 전문뉴스 <미디어잇(www.it.co.kr)>



이 기사가 마음에 드셨다면 공유해 주세요
게임잡지
2006년 8월호
2006년 7월호
2005년 8월호
2004년 10월호
2004년 4월호
게임일정
2024
09