2023.10.03
참고한 출처 :
https://velog.io/@boom109/nvidia-driver-cuda-toolkit-cudnn-install
https://ingu627.github.io/tips/install_cuda_linux/
설치 환경
Ubuntu 22.04에서 진행하다가 알 수 없는 오류에 막혀서 싹 지우고 이전에 문제 없었더 20.04로 재설치를 진행하였다.
Docker에 GPU가 안실어지는 문제였는데 아직도 뭐가 문제인지 파악을 하지 못했다...
- Ubuntu 20.04
- RTX A5000
Nvidia Driver
lshw -C display
내장 GPU를 인식하고 있는 상태
- 권장 드라이버 확인
sudo apt-cache search NVIDIA driver metapackage
리스트가 쭉 나오는데, 내가 설치한 Cuda version을 지원하는지를 미리 확인해 주어야 한다.
파이토치는 현재 Cuda 11.7 까지만을 공식 지원하고 있어서 (파이토치 공식 홈페이지에서 확인)
Cuda 11.7를 지원하는 nvidia driver 510을 다운 받아야겠습니다.
- apt-get 업데이트 및 개발 필수 라이브러리 설치
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install build-essential
- nvidia driver 510 설치
sudo apt-get install nvidia-driver-510
- 설치 확인 (reboot 후 진행)
nvidia-smi
인식이 잘 된다.
Nvidia kernel module의 load를 도와준다고 하는 nividia-modprobe
정보 출처 : https://ingu627.github.io/tips/install_cuda_linux/
sudo apt-get install dkms nvidia-modprobe
Cuda 설치
최대한 보수적으로, 현재 파이토치에서 Cuda 11.7를 공식 지원하고 있다.
https://developer.nvidia.com/cuda-toolkit-archive
위 사이트 들어가서 설치 코드 실행
11.7.1 > Linux > x86_64 > Ubuntu > 20.04 > runfile(local)
코드를 따라 run 까지 실행시키면 다음과 같이 설치 메뉴얼이 진행된다.
accept 치고 엔터
드라이버는 이미 설치 했으니 체크 해제, 이후 Install 에서 엔터
설치 완료
gcc가 없어서 문제가 된다면
sudo apt update
sudo apt install build-essential
sudo apt-get install manpages-dev
본인의 Cuda에 맞는 경로로 환경 패스 설정
sudo sh -c "echo 'export PATH=$PATH:/usr/local/cuda-11.7/bin'>> /etc/profile"
sudo sh -c "echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.7/lib64'>> /etc/profile"
sudo sh -c "echo 'export CUDARDIR=/usr/local/cuda-11.7'>> /etc/profile"
source /etc/profile
설치 확인
Cudnn 설치
https://developer.nvidia.com/cudnn
로그인 할 때마다 email verification 과정을 진행하는데, 어쩔 때는 3시간 뒤에 메일이 오기도 하고..
Deb 파일을 받았습니다.
https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html
sudo dpkg -i cudnn-local-repo-ubuntu2004-8.8.1.3_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2004-8.8.1.3/cudnn-local-CCF73F15-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get install libcudnn8=8.8.1.3-1+cuda11.8
sudo apt-get install libcudnn8-dev=8.8.1.3-1+cuda11.8
sudo apt-get install libcudnn8-samples=8.8.1.3-1+cuda11.8
설치 확인
- 파이썬 가상 환경에 torch 설치 후 다음의 코드 테스트
'근황 토크 및 자유게시판' 카테고리의 다른 글
개발자 워크플로우 (0) | 2023.03.13 |
---|---|
[Ubuntu 20.04] Setting Korean Words in keyboard (0) | 2023.03.10 |
Ubuntu Booting USB 만들기 (0) | 2023.03.09 |
[Ubuntu 22.04] Nvidia driver 완전 제거 (0) | 2023.03.09 |
ubuntu 22.04 ssh 원격 접속 (0) | 2023.03.07 |