전체 글
-
[K8S] Kubernetes에서 GPU 사용하기 (apt/yum)Kubernetes 2024. 3. 10. 23:06
0. 전제 조건 Docker 설치 완료 Nvidia Driver 설치 완료 CentOS/Rocky : https://yrotsti.tistory.com/149 Ubuntu : https://yrotsti.tistory.com/150 GPU 노드에서 아래 순서 진행 1. NVIDIA Conatainer Toolkit 설치 nvidia-container-toolkit : NVIDIA GPU를 사용하는 컨테이너를 빌드하고 실행하기 위한 도구 모음 저장소 및 GPG키 설정 # ubuntu curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-to..
-
[K8S] Kubespray 설정 파일 변경하기Kubernetes 2024. 3. 9. 20:32
Kubespray 내의 다양한 설정 파일을 조작하여 Kubernetes 클러스터를 사용자의 요구 사항에 맞게 자유롭게 조정할 수 있습니다. 변경한 설정 파일에 맞게 자동으로 설치 및 구성되기 때문에 클러스터의 구성을 쉽게 수정하고 맞춤형 환경을 만들 수 있습니다. 그럼 간단히 몇가지 설정을 변경하여 클러스터를 구성해보도록 하겠습니다! k8s-cluster.yml ( inventory/mycluster/group_vars/k8s_cluster/k8s-cluster.yml ) 'k8s-cluster.yml' 파일은 Kubernetes 클러스터를 배포하는데 필요한 구성 정보를 담고 있습니다. Container manager 지정 컨테이너 생성, 배포, 실행 등을 관리하는 소프트웨어 ex ) Docker ## ..
-
[K8S] Reserve Compute ResourcesKubernetes 2024. 3. 7. 19:32
Node Capacity Node의 자원 분배 allocatable : 노드에서 컨테이너가 사용할 수 있는 실제 리소스 양 kube-reserved : Kubernetes 시스템 구성 요소들이 사용하는 리소스 양 (ex. kubelet, kube-scheduler, kube-proxy 등의 서비스들이 동작하는 데 필요한 리소스 양) system-reserved : 노드 전체에서 시스템 프로세스 및 기타 운영 시스템 자원이 사용하는 양 eviction-threshold : 배치 제한 임계값 ( = 노드에서 허용 가능한 리소스 부족의 임계값 ) POD는 해당 Node에 allocatable만 사용 가능하다. Reserve Compute Resources : Kubernetes에서 특정 어플리케이션이나 컨테이..
-
[K8S] Kubespray를 이용한 Cluster초기화, Node 추가/제거Kubernetes 2024. 3. 7. 00:17
Cluster 초기화 kubespray에서 'reset.yml' 파일을 이용하여 배포된 Cluster를 배포 이전의 상태로 초기화 할 수 있습니다. 초기화 명령어 ansible-playbook -i inventory/mycluster/hosts.yaml --become reset.yml Are you sure you want to reset cluster state? Type 'yes' to reset your cluster.: yes Node 추가/제거 Worker Node 추가 Cluster 배포한 Master 노드에서 hosts.yaml 파일 수정 (kubespray/inventory/mycluster/hosts.yaml) 추가하려는 node의 정보 입력 (hosts 정보 추가, 역할 (kube_n..
-
부팅 시 Nvidia 전력 제한 설정Linux 2024. 3. 6. 20:03
Nvidia 전력 제한 설정 하는 이유 성능 조절 열 관리 배터리 수명 연장 소음 감소 Nvidia 전력 제한 설정 방법 1. 현재 전원 설정 확인 nvidia-smi -q -d POWER 2. 서비스 생성 nvidia-tdp.service vi /etc/systemd/system/nvidia-tdp.service [Unit] Description=Set NVIDIA power limit above default [Service] Type=oneshot ExecStartPre=/usr/bin/nvidia-smi -pm 1 ExecStart=/usr/bin/nvidia-smi -pl 275 nvidia-tdp.timer vi /etc/systemd/system/nvidia-tdp.timer [Unit] D..
-
[GPU] NVIDIA Driver 설치하기 (Ubuntu)Linux 2024. 3. 4. 20:41
1. 패키지 업데이트 sudo apt update sudo apt upgrade 2. GPU 종류 확인 lspci | grep -e NVIDIA 3. 사용 가능한 드라이버 확인 apt-get install alsa-utils ubuntu-drivers devices 4. NVIDIA Driver 자동 설치 #설치 sudo ubuntu-drivers autoinstall reboot # 확인 nvidia-smi +) 드라이버 삭제 sudo apt autoremove nvidia* --purge Reference How to Install Nvidia Drivers on Ubuntu 24.04, 22.04 or 20.04
-
[GPU] NVIDIA Driver 설치하기 (CentOS7/Rocky8)Linux 2024. 3. 2. 09:11
1. GPU 종류 확인 yum install pciutils update-pciids lspci | grep NVIDIA 2. 드라이버 다운로드 공식 드라이버 | NVIDIA : https://www.nvidia.co.kr/Download/index.aspx?lang=kr Download the latest official NVIDIA drivers Download the latest official NVIDIA drivers www.nvidia.com 드라이버 검색 Download → Agree & Download 우클릭 → 링크 주소 복사 설치 서버에 다운로드 wget {링크 주소} 3. 컴파일에 필요한 패키지 설치 yum -y install epel-release yum -y install gcc ..
-
[K8S] Kubespray로 Kubernetes 설치하기 - CentOS7/Rocky8Kubernetes 2024. 3. 1. 18:31
kubespray 란? Ansible 기반의 Kubernetes 클러스터 배포 자동화 및 관리하는 오픈 소스 도구 GitHub : https://github.com/kubernetes-sigs/kubespray GitHub - kubernetes-sigs/kubespray: Deploy a Production Ready Kubernetes Cluster Deploy a Production Ready Kubernetes Cluster. Contribute to kubernetes-sigs/kubespray development by creating an account on GitHub. github.com 설치 환경 OS : Rocky8.9 Kubernetes : v1.27.7 Kubespray : v2...