DICOM
dicom 파일이 무엇인지 대강 알아보고자 합니다.
본 게시물은 아래 참고 사이트의 내용을 가지고 제가 저 스스로 읽기 쉽게 재편성 한 것에 불과함을 말씀드립니다.
https://89douner.tistory.com/293?category=991951
https://89douner.tistory.com/294?category=991951
1. DICOM format은 영상 이미지 한 장에 엄청난 용량을 담고 있습니다.
3000 X 3000 resoultion 을 사용하는 경우도 있다고 합니다. 만약 이를 평소 딥러닝 모델에서 사용하는 이미지 크기 244 X 244 로 줄여버린다면 엄청난 이미지 정보 손실이 있을 수도 있습니다. 따라서 DICOM 기반의 딥러닝 모델 연구가 필요하다고 합니다.
2. DICOM 은 이미지 정보 외 다양한 메타 데이터 들을 담고 있습니다. ( 환자의 나이, 성별, 등 )
나이 성별 등 여러 메타 데이터에 따라 진단 방식이 달라질 수 있기 때문에 정말 중요한 정보라고 하네요.
가령 Chest-X-ray 에서 어떠한 소견이 있을 때, 나이가 있으신 분이라면 일반적인 현상이라고 해석할 수 있는 반면에, 젊은 사람에게 발생한 것이라면 문제가 있다고 판별할 수 있습니다.
3. 의료용 디지털 영상 및 통신 (Digital Imaging and Communications in Medicine, DICOM) 표준
DICOM 은 의료분야에서 사용되는 표준 가운데 디지털 영상 자료를 주고 받을 때 지켜야할 표준 입니다.
참고로 병원에서 Chest X-ray, CT, MRI 등 디지털 의료 영상 이미지를 촬영하게 되면 병원의 PACS (Picture Archiving and Communication System) 서버로 전송되고, PACS는 이를 DICOM 이라는 국제 표준 규약에 맞게 저장, 가공, 전송 한다고 합니다.
4. DICOM file (.dcm 파일) 은 두 파트(메타 information + Object Instance) 로 구성되어 있습니다.
5. File Meta Information 파트
- File Preamble : 128 byte로 구성된 dummy byte, 주로 zero로 구성되어 있는데, 필요한 정보를 담을 수 있습니다.
- DICOM Prefix : "D", "I", "C", "M" 이라는 글자가 Preamble 뒤에 바로 나옵니다. 일종의 DICOM 파일이라는 인증마크 라고 합니다.
- File Meta Elements : 이 섹션에서는 DICOM 파일 형식의 파일 메타 정보 형식을 지원하는 데 필요한 파일 메타 요소를 지정합니다.
6. Information Object
- Data Elemnet 가 모인 Dataset으로 구성되어 있습니다.
- Dataset 은 IOD ( Information Object Definition ) 형식을 따른다고 합니다.
- IOD는 Entity-relationship 을 중심으로 information entities, modules, attributes 로 구성되어 있다고 합니다.
무슨 말일까요.
예를 들어, MRI 라는 것을 하나의 객체 (information object)라고 설정하고, 해당 객체를 여러 entitiy를 이용해 표현합니다.
환자 정보를 나타내는 entitiy, 검사 정보를 나타내는 entity, 이미지 정보를 나타내는 entity 등이 있습니다.
그리고 각각의 entity는 해당 entity에 어울리는 데이터 종류 (= Module) 들로 구성 됩니다. 예를 들어 환자 정보에는 나이, 체중, 이름과 같은 데이터 종류 등이 있습니다. 그리고 실제로 부여되는 구체적인 값을 attribute 라고 합니다.
다음 링크에서 각각의 entitiy 정보를 찾아볼 수 있다고 합니다.
https://dicom.nema.org/dicom/2013/output/chtml/part03/chapter_A.html
- 그리고 각각의 entity는 계층구조 (연결관계) 를 이루고 있습니다.
- Data element는 attribute에 속한다고 합니다.
- 각각의 data element는 group과 element로 구성된 tag를 통해 구별 합니다.
- attribute의 인코딩과 길이, 데이터 타입과 format은 VR(Value Representation) 에 의해 결정됩니다.
다음은 VR 종류 입니다.
7. DICOM 에서 실제 사용되는 Image 데이터 접근
- Image entity → Image Pixel module → PixelData attribute
실제 저희 대회 데이터에 대한 접근은 다음 게시물에서 해보도록 하겠습니다.
'Brain Tumor Radiogenomic Classification' 카테고리의 다른 글
[Brain Tumor] 대회의 DICOM 파일 확인 (EDA) (0) | 2022.10.09 |
---|---|
[Brain Tumor] T1W, T2W, T1Gd, Flair 영상 비교 - 용어정리 2 (0) | 2022.09.29 |
[Brain Tumor] MRI, T1 강조, T2 강조 - 용어 정리 1 (0) | 2022.09.28 |
[Brain Tumor] 데이터 설명 (0) | 2022.09.28 |
[Brain Tumor] 대회 설명 (0) | 2022.09.28 |