운영중인 vSphere 환경에서 갑자기 나타나는 가상 시스템 통합 필요 상태 알람..
대체 왜 발생을 하고 어떻게 해결해야 하는지 궁금하셨던 분이라면 잘 오셨습니다.
저 또한 이와 같은 상황을 너무 자주 봐왔었고 통합 버튼을 눌러서 잘 되는 경우 아닌 경우를 많이 봐왔었습니다.
우선 가상 시스템 통합 필요 상태란 무엇일까요?
가상 시스템 통합 = 스냅샷 디스크 통합을 뜻합니다.
스냅샷을 생성하면 -delta.vmdk라는 파일이 생성되고 변경사항 들은 모두 이 delta 디스크에 기록되며 -flat.vmdk에는 원래의 데이터가 기록되어 있기 때문에 데이터스토어에는 중복 데이터가 존재할 수가 있습니다.
때문에 긴 시간 스냅샷을 찍은 상태를 유지하면 데이터스토어의 사용량이 급격히 증가하지요. 실제 이 스냅샷 때문에 데이터스토어가 100% 사용되어 모든 시스템이 멈춰버리는 경우도 경험한 적이 있습니다.
스냅샷은 VM당 32개 이하, 최대 72시간 정도만 유지하실 것을 적극 권장드립니다.
스냅샷을 삭제하게 되면 이 -delta.vmdk에 기록된 변경사항을 모두 원래의 -flat.vmdk로 옮기는 작업이 시작됩니다.
명칭은 스냅샷 삭제 이지만 실제로는 delta에 쓰여진 데이터를 flat으로 복제를 하는 작업이기 때문에 데이터스토어의 추가 공간이 필요하고 I/O도 다수 일어나게 됩니다.
헌데 스냅샷 항목에 보면 통합(Consolidate)라는 버튼이 있습니다.
이 통합 버튼은 앞서 말한 "중복 데이터"의 제거를 의미합니다.
delta 파일과 flat 파일에 중복으로 저장되어 있는 중복 데이터만을 찾아서 flat쪽으로 밀어 넣는 작업을 의미합니다.
그럼 통합 필요상태 알람이 발생하는 원인은 무엇일까요?
이 알람이 발생하는 원인은 여러가지가 있습니다.
- VM의 스냅샷이 잘못 삭제되는 경우
- 통합할 데이터스토어의 디스크 공간이 충분하지 않은 경우
- VM이 실행 중인 ESXi 호스트에 연결된 스토리지의 성능이 낮을경우 (시간초과 발생)
- ESXi 호스트와 vCenter 간의 연결의 문제가 있는 경우
- 백업 등의 3rd party 솔루션에서 스냅샷 파일을 잠근(lock) 경우 (백업작업이 완료되지 않고 스냅샷을 잠근 경우가 있습니다.)
위와 같은 경우 통합 필요상태의 알람이 발생되며 대부분의 경우 VM 우클릭 - 스냅샷 - 통합 버튼 클릭 시 해소되는 경우가 있습니다.
허나 VM이 켜져 있는 경우 통합이 이루어 지지 않는 경우들이 있는데 이는 스냅샷 파일이 잠겼을 경우입니다.
이 때의 해결 방법은 두 가지가 있습니다.
1. 새로운 스냅샷을 만든 후 기존의 스냅샷을 모두 삭제 하고 통합합니다.
이래도 해소 되지 않는 경우 다른 호스트로 vMotion을 진행하여 통합합니다.
2. 그래도 해결되지 않는다면 VM의 전원을 끈 후, 백업 솔루션에서 백업을 중지한 후에 통합하면 해결되는 경우가 대부분 입니다.
그 외에 좀비가 된 -ctk.vmdk 파일이나 -delta.vmdk 파일등이 존재하는 경우, vmx 파라미터 중 asyncConsolidate.forceSync=True 항목이 빠져 있어 해결되지 않는 경우들이 존재합니다.
적절한 스냅샷의 사용과 백업 스케쥴을 정립하여 안전한 인프라 관리하세요~
'VMWare > vSphere' 카테고리의 다른 글
The Resource [NFS Datastore] is in use (unmount 불가) (0) | 2023.11.08 |
---|---|
vCenter Server Appliance 6.7 /storage/archive 디렉토리 100% 사용중일때 - VMware는 제이씨티에스 (0) | 2020.09.11 |
VMware vSphere VM의 mac 주소 변경방법 (0) | 2020.03.10 |
ESXi에서 NIC 정보(드라이버 및 펌웨어)와 하드웨어 호환성 체크방법 (0) | 2019.11.12 |
Thin 타입의 디스크에서 GuestOS와 vSphere 환경에서의 사용된 공간의 크기가 다르게 보일 때 (Reclaim Disk) (0) | 2019.11.04 |