티스토리 뷰

반응형

GPU를 처음 구매했을 때 GPU가 잘 동작하는지 확인해야 한다. GPU는 컴퓨터의 다른 부품에 비해 많은 전력을 소비하기 때문에 컴퓨터나 서버의 GPU가 전력을 최대한 소비하고 있을 때 시스템이 다운되지는 않는지 확인할 필요가 있다. 보통 PC에서는 게임을 위해 GPU를 사용하기 때문에 고사양 게임을 통해 GPU를 테스트 할 수 있지만 서버의 경우 리눅스 환경이고, GUI 환경이 없는 경우가 대다수이다. 따라서 이러한 경우 GPU를 테스트 할 방법이 필요한데, 그 방법중 하나로 본 글에서 소개할 gpu-burn이 있다.

gpu-burn이란?

Ville Timonen이 개발한 multi-GPU 부하 테스트 프로그램으로 한 시스템에 여러 대의 GPU가 있는 경우에도 모두 테스트 할 수 있다.

gpu-burn을 사용해 보자

gpu-burn을 사용하는 방법은 간단하다. gpu-burn git repository를 복제하고 make를 통해 gpu-burn을 컴파일 한 뒤 생성된 프로그램을 실행시키면 된다. 아래의 명령어로 해당 과정을 진행할 수 있다.

$ git clone https://github.com/wilicc/gpu-burn
$ cd gpu-burn
$ make
$ ./gpu-burn

gpu-burn을 실행하려면 nvidia driver 뿐만 아니라 nvcc 또한 필요하기 때문에 패키지 관리자를 통해 nvidia-cuda-toolkit 을 설치해 준다.

gpu-burn은 설정을 하지 않으면 10초동안만 동작하고 중지된다. 더 길게 테스트 하려면 아래와 같이 테스트할 시간을 초단위로 입력해야 한다.

# 1시간 부하 테스트
$ ./gpu-burn 3600

gpu-burn은 부하 테스트를 하면서 지속적으로 gpu 온도 정보를 출력해 주기에 GPU 발열 관리는 잘 되는지 또한 확인할 수 있으며, 동작시키며 시스템이 다운되지는 않는지 확인하면 서버 관리에 무척이나 도움이 될 것으로 생각된다.

반응형
댓글