하드웨어 > 기획기사

AMD 라이젠, 쓰면 쓸수록 성능이 좋아진다

/ 1

 

AMD가 출시한 라이젠 시리즈로 PC 시장이 연일 떠들썩하다. 혹자는 ‘드디어 경쟁 구도가 돌아오는가’ 되묻기도 하고, 속된 말로 ‘미친 성능’이라고 외치기도 한다. 업체가 발표하는 내용과 실제 성능과의 괴리가 큰 경우에 소비자들의 실망과 분노가 더 큰 법인데, 이번엔 조금 다르다. AMD 측에서 공개했던 벤치마크 테스트 결과가, 실제 테스트 결과와 약간의 차이는 있지만, 비슷한 성능을 내주는 것이 속속 확인되고 있다. ‘일해라 AMD’란 농담을 듣던 AMD가, 드디어 제대로 일했다.

 

▲ AMD의 'SenseMI'

 

그런데, 이번에 나온 라이젠 CPU의 특장점 가운데 유독 우리의 호기심을 불러일으키는 기술이 있었으니, 그것이 바로 AMD가 'SenseMI'라고 명명한 기술이다. 본문 아래에서 조금 더 자세히 다뤄볼 'SenseMI'는 효율적인 전력관리와 성능 극대화를 위한 CPU의 머신러닝 개념을 종합적으로 묶은 것인데, 특히 머신러닝(신경망 분기예측, 스마트 프리패치)이 성능에 어느 정도 영향을 미치는지에 대한 궁금증이 큰 상황이다. 이에 기자는 이번 기회에 라이젠 CPU가 과연 '성장형 CPU'가 맞는지, 쓰면 쓸수록 성능이 향상되는지 간단한 실험을 통한 확인에 도전했다.


오늘 실험에 동원될 CPU는 라이젠 3종 중 막내인 R7 1700, 14nm 공정으로 만들어진 R7 1700은 기본 3.0GHz에 최대 3.7GHz까지 빨라지는 코어가 8개, 논리 프로세서는 16개를 갖추고 있다. L3 캐시 메모리도 16MB를 장착했고, TDP도 65W 정도로 전작에 비해 많이 가벼워졌다. 저전력 고성능 CPU인 셈이다.


▶ AMD R7 1700

 

제조공정

14nm

소켓

AM4 1331

코어

옥타(8)코어 16스레드

속도

기본 3.0GHz, 부스트 3.7GHz

캐시메모리

L2 4MB, L3 16MB

GPU

없음

설계전력

65W

가격

40만 원 전후

 
▶ 테스트 PC  

 

메인보드

바이오스타 B350 Racing GT3

RAM

삼성전자 DDR4 PC4-17000 8GB

그래픽카드

엔비디아 지포스 GTX970

SSD

120GB

파워서플라이

550W

 

  

 

라이젠 R7 1700, 기본기를 보자!

 

▶ 작업 관리자

 

작업 관리자의 성능 탭에서 16개의 스레드가 작동하는 걸 확인했다. 1800X를 테스트했을 때도 그랬지만, 10개가 넘는 논리 프로세서가 작동하는 모습을 보는 게 쉽지 않기에, 볼 때마다 설레는 마음은 어쩔 수 없다. 코어당 속도는 최근 출시되는 CPU 대비 평균적인 수준이다.


▶ CPU-Z

 


프로세서의 각종 정보를 볼 수 있는 ‘CPU-Z’로 R7 1700의 정보를 확인했다. 14nm 공정으로 제작된 1700은 노오버 상태에서 1.078V의 코어 전압을 유지하고 있다. 기본 3.0GHz, 터보 3.7GHz의 성능 변화 폭은 1700X의 3.4GHz/3.8GHz보다 큰 편이다. 자체 벤치마크 테스트는 싱글 스레드 1,980점, 멀티 스레드 16,270점을 기록했다. 맏형 1800X보다는 떨어지지만, 멀티 스레드 점수는 인텔 i7-6900K보다 20%가량 더 높다.

▶ 7-Zip Benchmark


압축 프로그램 ‘7-Zip’에서 자체 제공하는 압축·해제 테스트를 진행했다. 압축 테스트 결과는 25,253MIPS, 해제 테스트 39,063MIPS, 전체 평가 점수는 32,158MIPS로 측정됐다. i7-6900K 대비 압축 테스트 점수는 75% 정도지만, 해제 점수는 4% 정도밖에 차이가 나지 않는다. 테스트 결과를 보면 압축할 때는 라이젠 CPU 사용량이 약간 낮은 상태임을 알 수 있다.


▶ 슈퍼파이


원주율 연산 테스트 프로그램 ‘슈퍼파이’의 1백만 자리 연산은 CPU의 1개 스레드만 사용한다, 기본 동작주파수 3.0GHz의 라이젠 1700의 결과는 11.689초로, 낮은 동작주파수를 생각해보면 상대적으로 1개 스레드(싱글 코어) 성능이 제법 많이 향상된 결과다. 과거 AMD의 최고사양 CPU였던 FX9590이 무려 4.7Ghz~5.0Ghz의 기본 동작주파수를 가지고도 18~20초 수준이었다는 점을 떠올려보면 상대적으로 어마어마한 향상이라고 할 수 있다.


▶ 음악 인코딩


50개의 무손실 FLAC 음원을 320kbps mp3 파일로 변환하는 테스트 결과가 꽤 잘 나왔다. 테스트에 사용한 ‘dbPoweramp’는 인코딩에 최대 16개의 스레드를 사용해 1700과 궁합이 잘 맞는 점도 작용했다. 인코딩에 소요된 시간은 37초로 무척 빨랐다. 개별 인코딩 속도도 425x 정도로 상당히 빠르게 측정됐다. 무손실 음원 1개를 읽고 mp3로 변환하는데 1초도 안 걸린다.


▶ 3DMark 피직스 스코어

 

 

 


대표적인 그래픽 벤치마크 프로그램 ‘3DMark’의 피지컬 스코어를 보면, 클라우드 게이트 11,725점, 스카이 다이버 13,048점을 기록했다. 타임 스파이의 CPU 스코어는 6,087점이었다. 1800X의 점수에 비교해 보니(스카이 다이버 14,084점, 타임 스파이 6,257점), 약 6~7% 정도의 차이를 보였다. 본 테스트만으로 객관적으로 두 제품의 성능 차이를 명확하게 수치화할 순 없지만, 1700과 1800X의 여러 테스트 결과를 놓고 보면 성능 차이를 약 10% 정도로 보는 것이 가장 타당한 것 같다.



'CPU가 스스로 공부한다' 라이젠의 SenseMI


 

이번 라이젠 시리즈에는 재미있는 기능이 있다. ‘SenseMI’로 명명된 이 기술은 사용자가 PC를 이용하는 환경을 감지하고 학습하는 기술로, 효율적인 전력관리를 비롯한 5가지 요소들이 결합해 종합 성능이 향상된다는 것이 AMD의 설명이다. 특히 그중에서도, 신경망 분기 예측(Neural Net Prediction)과 스마트 프리패치(Smart Prefetch)는 짧게 요약하자면 ‘한 번 실행했던 프로그램(작업)을 다시 실행하는 경우, 작업 효율이 향상된다’는 솔깃한 내용을 담고 있다.

 

▲ '신경망 분기예측'은 데이터가 CPU를 통과하는 과정을 줄인다


그래서 실제로 이 기능이 유효한지 확인해보기로 했다. 로딩 시간이 꽤 걸리는 게임이나 프로그램을 여러 번 반복 실행해 보면, 전체적으로 효율이 향상되는 모습을 관찰할 수 있을 것이다. 자주 사용하는 포토샵 프로그램을 비롯해 벤치마크 테스트에 사용하는 유니진 헤븐 벤치마크, 게임은 ‘라이즈 오브 더 툼 레이더’, ‘스나이퍼 엘리트 3’, 그리고 온라인 게임 ‘오버워치’를 테스트해 봤다. 각 테스트는 PC를 부팅한 뒤 곧장 해당 프로그램을 10회(실제로는 30회) 반복 실행해 보는 식으로 진행했다. 시간 측정의 경우 스톱워치를 사용했기 때문에 약 0.1초 정도의 오차를 고려해야 한다.

 

▲ '스마트 프리패치'는 특정 프로그램의 패턴을 학습해 캐시에 등록한다


처음에는 30회 이상 테스트하기로 계획하고 30회씩 진행했으나, 기사에는 10회 정도로 갈무리했다. 대부분의 테스트에서 1~10회까지는 꾸준히 효율이 향상되었으나, 10회~30회는 큰 변화가 없었기 때문. 또한, 작업 관리자의 성능 탭으로 CPU의 점유율도 함께 확인했는데, 프로그램을 여러번 실행했을 경우 첫 실행때에 비해 약 8~10% CPU 점유율이 하락했다. 더 자세한 내용은 아래에서 확인하자.


▶ 어도비 포토샵 실행 


 

 ▲ 테스트를 거듭할 수록 7초에 가까워진다

 

SenseMI의 신경망 분기예측과 스마트 프리패치의 효과를 처음 테스트한 프로그램은 어도비의 포토샵이다. 성능이 안 좋은 PC에서는 실행만 해도 한세월 걸리는 것으로 악명이 높다. 실행 후 편집 화면이 뜰 때까지의 시간을 측정한 결과, 1회째 13.43초였던 시간은 5회째에 6.81초로 가장 빠른 로딩 시간을 기록했고, 이후 비슷한 수준을 유지해서 10회째 7.04초를 기록했다. 2~6회차까지는 들쑥날쑥했으나 7~10회까지는 대략 안정되어 7초 수준에서 로딩이 완료되는 모습이다. 재부팅 이후 진행한 테스트에서도 비슷한 결과를 보였다. 한편, 1회 → 2회의 결과는 시스템 메모리(RAM) 캐싱에 의해 비약적으로 로딩이 향상된 것이므로 논외로 했다. 


▶ 유니진 헤븐 벤치마크 4.0 실행

 

 


로딩 화면에서의 용오름이 멋진 유니진 헤븐 벤치마크의 첫 로딩 시간은 15.21초로 약간 긴 편이었다. 3회째는 14.58초, 5회는 12.59초, 이후 소폭의 변화를 보이다가 10회 전후로 12.70초 수준을 유지했다. 극적인 향상은 없지만, 로딩 속도가 조금씩 빨라지다가 어느 지점에서 유지되는 것을 확인할 수 있다. 2회차 결과를 기준으로 계산하면 1~2% 수준의 효율 향상이 있다.

▶ 라이즈 오브 더 툼 레이더 실행 

 

 


게임은 진작 엔딩을 봤고, 이용 시간의 절반을 벤치마크에 이용하고 있는 ‘라이즈 오브 더 툼 레이더’가 이번 테스트에도 활용됐다. 1회차와 2회차가 거의 차이 없는 것이 특징이다. 첫 로딩 속도는 10.88초, 3회째에 가장 빠른 10.27초를 기록했으며, 10회차를 기준으로 10.5초 전후에서 유지됐다. 1회 → 10회만 단순 계산하면 약 3% 정도의 효율 개선이다.


▶ 스나이퍼 엘리트 3 실행

 

 


벤치마크 툴을 제공하지 않아 잘 사용하지 않는 저격 게임 ‘스나이퍼 엘리트 3’를 오랜만에 활용해 봤다. 2~5회까지는 10초 수준에서 종료, 10회 전후로는 9.7초 수준에서 종료되어 2→10회까지 역시 3% 정도의 효율 향상이 있었다. 이후 30회까지 9.6~9.7초 정도의 시간을 계속 유지했다. 1→2회 결과는 포함하지 않았다.

▶ 오버워치 실행

 

 


블리자드의 ‘오버워치’는 배틀넷에 로그인해 놓고 게임 실행 버튼을 누르며 시작, 캐릭터 화면이 나타났을 때를 종료로 설정해 테스트했다. 2회에 12.04초, 3회째에 11.54초가 소요됐고, 10회째엔 11.48초를 기록했다. 2→10회까지 약 4% 정도의 효율 향상.

 

▶ CPU-Z 벤치마크 진행속도 + 점수 변화

 

▲ CPU-Z 10회차 구동 결과 화면 캡쳐

 

 

 

 

테스트에 사용한 벤치마크 프로그램에서도 이 기능이 효과가 있는지 궁금했다. 결과부터 공개하자면, CPU 성능만을 확인하는 벤치마크 프로그램의 경우에도 작지만, 작업 효율이 향상됨을 관찰했다. CPU-Z의 자체 벤치마크 탭을 수차례 반복하여 테스트한 결과, 테스트에 걸린 시간과 총점(멀티스레드) 모두 10회차 기준 약 1.5% 정도의 효율 향상이 있었다. 싱글스레드 테스트 점수는 1회차 1980 → 10회차 2044로 3%의 효율 향상을 보였다.

 

▲ 7-Zip 10회차 구동 결과 화면 캡쳐

 

 

 

 

7-Zip 자체 벤치마크에서도 효율의 향상이 지속적으로 관찰됐다. 다만 7-Zip 벤치마크 최종 스코어의 경우에는 향상 폭이 다른 테스트에 비해 크지 않다. 1% 미만으로, 일반적인 상황이라면 이 정도의 점수 차이는 오차범위 이내로 집계될 수 있다.

 

 

크진 않지만, 효율 향상은 있다!


 

테스트 결과 라이젠 CPU는 같은 작업, 동일 프로그램을 지속적으로 구동할 경우 효율이 향상되고 있다. 이러한 점은 직접적인 점수의 향상이나, 로딩속도 향상, 그리고 동일 작업 시 CPU 점유율의 감소와 같은 현상으로 확인할 수 있다. 사람이 즉각적으로 체감할 만큼 향상 정도가 크진 않기 때문에 신경망 분기예측과 스마트 프리패치가 라이젠을 구매하는 결정적인 포인트가 되기는 어렵다. 하지만, 무겁고 오래 걸리는 작업의 경우 작은 차이도 결과에 가서는 유의미한 격차를 만들어낼 수 있는 만큼, 라이젠의 이런 특성을 잘 이용한다면 전체적인 작업 효율 향상에 도움이 될 것이다. 게다가, 추가 향상에 기대지 않더라도 기본 성능이 워낙 출중하지 않은가? 대세에는 그만한 이유가 있는 법이다.

 

 

기획, 편집 / 다나와 송기윤 (iamsong@danawa.com)

글, 사진 / 테크니컬라이터 황연종

기사 제보 및 문의 (news@danawa.com)

 (c)가격비교를 넘어 가치쇼핑으로, 다나와 (www.danawa.com)



이 기사가 마음에 드셨다면 공유해 주세요
게임잡지
2000년 12월호
2000년 11월호
2000년 10월호
2000년 9월호 부록
2000년 9월호
게임일정
2024
11