Ceph에 Object를 저장할 때 PG ID가 결정되는 계산 과정

Ceph는 분산 객체 저장 시스템으로, 객체를 작은 조각인 객체(stripgs)로 나누어 복제하여 저장합니다. 이러한 객체를 처리하는데는 Placement Group(PG)라는 개념이 사용됩니다. PG는 일종의 로컬 데이터베이스로, 특정 객체의 복제본이 어디에 저장되어 있는지 추적합니다.

Ceph 클러스터에서 사용 가능한 OSD(객체 저장 디바이스)를 확인합니다. OSD는 클러스터 내에서 객체를 저장하는 물리적인 디바이스입니다.
OSD 맵을 사용하여 PG 수를 계산합니다. OSD 맵은 OSD와 관련된 정보를 포함하는 데이터 구조로, Ceph 클러스터가 시작될 때 생성됩니다.
계산된 PG 수와 CRUSH 맵을 사용하여 CRUSH 매핑을 수행합니다. CRUSH 매핑은 Ceph 클러스터의 데이터를 분산하는 알고리즘으로, 객체의 데이터를 저장할 OSD를 결정합니다.
CRUSH 매핑을 사용하여 객체를 저장할 PG ID를 계산합니다. 이 계산은 객체의 이름, 크기, 태그 등을 고려합니다.

예를 들어, Ceph 클러스터에는 OSD1, OSD2, OSD3과 같은 OSD가 있고, OSD 맵에서는 OSD1과 OSD2가 사용 가능한 것으로 나타납니다. 이 경우, PG 수는 64이고 CRUSH 매핑을 수행하면 다음과 같은 결과가 나올 수 있습니다.

root
|--- datacenter1
|    |--- rack1
|         |--- host1
|              |--- osd1
|--- datacenter2
|    |--- rack2
|         |--- host2
|              |--- osd2

위의 CRUSH 맵에서 객체를 저장할 OSD를 결정하는데, 데이터센터, 랙, 호스트 및 OSD와 같은 위치 정보를 고려합니다. 예를 들어, "object1"은 다음과 같은 위치 정보를 가지고 있을 수 있습니다.

location = { datacenter = "datacenter1", rack = "rack1", host = "host1", osd = "osd1" }

위의 위치 정보를 사용하여 CRUSH 매핑을 계산하면 다음과 같이 PG ID를 계산할 수 있습니다.

PG ID = hash("object1") % 64

이렇게 계산된 PG ID는 객체가 어느 PG에 저장될지 결정합니다. 예를 들어, PG ID가 12이면 객체의 모든 복제본은 PG 12에 저장됩니다.

이러한 방식으로 Ceph는 CRUSH 알고리즘을 사용하여 객체를 저장할 OSD를 선택하고, PG ID를 계산하여 객체를 저장할 PG를 선택합니다.

Ceph에서는 PG ID를 계산할 때 해싱 알고리즘이 사용됩니다. 해싱은 임의의 길이를 가진 데이터를 고정된 길이의 데이터로 매핑하는 알고리즘입니다. Ceph에서는 객체 이름, 크기, 태그 등을 해싱하여 PG ID를 계산합니다. 이렇게 함으로써, 객체 이름, 크기, 태그 등의 속성을 고려하여 객체를 저장할 PG를 선택할 수 있습니다.

Ceph에서는 PG 수를 조정하여 데이터의 분산을 조절할 수 있습니다. 예를 들어, PG 수를 증가시키면 데이터가 더 세분화되어 분산됩니다. 그러나 너무 많은 PG 수를 설정하면 클러스터의 성능이 저하될 수 있습니다. 따라서 적절한 PG 수를 설정하는 것이 중요합니다.

Ceph는 CRUSH 알고리즘을 사용하여 데이터를 분산합니다. CRUSH 알고리즘은 데이터의 위치 정보를 사용하여 데이터를 저장할 OSD를 선택합니다. 이렇게 함으로써, 데이터를 고르게 분산하여 클러스터의 안정성을 향상시킬 수 있습니다. CRUSH 알고리즘은 OSD 맵과 CRUSH 맵을 사용하여 데이터를 분산합니다. OSD 맵은 사용 가능한 OSD의 목록을 제공하고, CRUSH 맵은 OSD를 물리적인 위치 정보로 매핑합니다.

Ceph에서는 객체를 저장할 때 일반적으로 3개의 복제본을 만듭니다. 이러한 복제본은 서로 다른 OSD에 저장됩니다. 이렇게 함으로써, 하나의 OSD가 고장나더라도 데이터를 복원할 수 있습니다. 복제본을 만드는 것은 Ceph 클러스터의 안정성을 향상시키는 중요한 요소입니다.

Ceph는 분산 객체 저장 시스템으로, 객체를 작은 조각인 객체(stripgs)로 나누어 저장합니다. 이러한 객체는 PG라는 개념을 사용하여 처리됩니다. PG는 일종의 로컬 데이터베이스로, 특정 객체의 복제본이 어디에 저장되어 있는지 추적합니다. 객체를 저장할 때 PG ID를 계산하여 객체를 저장할 PG를 선택합니다.

이러한 방식으로 Ceph는 CRUSH 알고리즘을 사용하여 객체를 저장할 OSD를 선택하고, PG ID를 계산하여 객체를 저장할 PG를 선택합니다. 이렇게 함으로써, Ceph는 데이터를 고르게 분산하여 클러스터의 안정성을 향상시키고, 객체의 안정적인 저장을 보장합니다.

저작자표시 비영리 변경금지

Good Rich Dad

Ceph에 Object를 저장할 때 PG ID가 결정되는 계산 과정

댓글

티스토리툴바