의학 영상 검사를 분석하기 위한 딥러닝 기반의 인공지능 알고리즘을 구축하고 이를 실제 의학 검사의 분석에 적용하여 알고리즘의
정확도를 확인하고자 하며 , 최종적으로 영상 데이터 셋 구축을 통하여 진단을 지원하는 솔루션 개발을 지향하여 보다
효율적인 진단이 가능하게 할 수 있다.
연구대상 : 뇌 질환 환자
환자 선별 당 연구는 2가지 방법에 의한 환자의 선별로 수행할 것이며,
그 분류는 환자의 동의를 받은 영상과 오직 영상 분석만을 목적으로 환자의 정보를 배제한 영상으로 나뉜다.
전향적 연구 방법 : 환자 동의서 작성
환자에게 연구의 취지와 목적을 춘부하게 설명하고 그에 부합하는 개인 정보 활용에 대한 동의를 득한 후 영상에 대한 연구를 진행한다.
후향적 연구 방법 : 환자 정보 삭제
뇌질환 분석을 위한 영상 자료로만 활용이 되며, 가명화 작업을 통해 환자의 정보를 배제한 상태로 연구에 사용된다.
시험 방법
GT (Ground -Truth , 실제 / 정답 영상) 를 이용한 딥러닝 기법 : 기계 학습의 관점에서 보았을 때 GT는 학습하고자 하는 데이터의
원본 혹은 실제 값을 표현
Ground-truth는 기상학에서 유래된 용어로 어느한 장소에서 수집된 정보를 의미합니다.
Ground-truth는 보통 '지상 실측 정보'로 해석되며 인공위성과 같이 지구에서 멀리 떨어져서 지구를 관찰하였을 때
지구의 전체적인 관점을 보는 것에는 넓은 시야를 가질 수 있지만 실제 지면의 구조를 세밀하게 보는 것은 빛이 구름이나 대기를 통과하게 되면서 실제 모습이 왜곡되어 제대로 파악하는 것은 어렵습니다.
이러한 상황에세 지상 정보를 직접 측정한다면 보다 정확한 정보를 얻을 수 있는 것입니다.
이러한 정보에 인공위성에서 관측된 데이터를 참조하여 사용한다면 좀 더 정확한 데이터를 얻을 수 있습니다.
쉽게 말해 객체 예측을 통해 데이터화하는데 그치지 않고 실측 값을 추가하여 보다 정확한 데이터를 생성하겠다는 의미
딥러닝 모델이 예측을 잘했다는 의미는 GT 와 가장 가까운 예측값을 내 놓은 모델이 좋은 성능을 가진 딥러닝 모델
IoU(Intersection over Union)
공식을 사용 IoU 공식은 GT 의 경계 상자와 예측된 경계 상자가 겹치는 부분이 너비에 두 경계상자가 사진에서 차지하는 너비를 나눈 값입니다.
IoU = Area of Overlap / Area of Union
1. DICOM이란?
DICOM(Digital Imaging and Communications in Medicine)은 의료용 디지털 영상의 저장, 출력 및 전송에 사용 되는 여러가지 표준을 총칭하는 말이다.
DICOM 표준을 따르는 파일의 확장자는 .dcm을 사용한다.
2. DICOM의 필요성
X-ray 촬영, 초음파 검사, CT 촬영, MRI 촬영 등 다양한 의료용 디지털 영상 촬영 장비가 개발됨에 따라 각 장비에서 촬영한 영상을 효율적으로 통합하여 관리 및 조회할 필요가 생겼고,
서로 다른 제조사 간의 호환성 문제가 대두되었다.
예를 들어 다양한 워드 프로세서(ex: MS워드, Mac Pages, 한글 등)로 글을 작성할 경우 각기 다른 포맷의 파일(ex: .doc, .pages, .hwp)은 호환성의 문제가 있지만,
pdf 포맷으로 저장할 경우 하나의 뷰어로 관리 및 조회할 수 있다. 이처럼 다양한 제조사 장비와 다양한 종류의 영상 간의 호환을 위한 표준이 필요했다.
한편 의료 영상은 일반적인 영상과 달리 환자 정보, 검사 정보 등 의료 영상으로서 효과적으로 사용하기 위해 영상 자체 정보 외에 고유한 정보들을 함께 저장해야 한다.
또한 촬영 장비, OCS(처방전달시스템), PACS(의료영상저장전송시스템), 아카이브, 프린터 등 의료 영상과 관련한 다양한 장비들간의 통신을 위해서는 네트워크 프로토콜도 필요하다.
(의료용 영상은 환자의 개인정보가 있어 보안 이슈가 중요하여 독립된 프로토콜이 필요) 이러한 목적을 위해 새로운 표준의 개발이 필요했으며 그렇게 개발된 것이 DICOM이다.
대상 영상을 PACS 에서 DICOM 형태의 파일로 다운 받아서 분석 프로그램이 있는 서버로 옮겨 분석을 시행하며,
프로그램은 유병자와 정상인의 영상을 나눠서 학습하게 되며 상병 부위에 대한 범위 지정과 검수는 병원 내에서 행함
* 딥러닝 Program은 재영소프트가 경성 대학교와 함께 GT 작성과 학습이 가능한 프로그램을 개발한다.
질병이 있는 환자와 정상인 혹은 완치 후의 영상에 대한 학습을 해서 보다 정밀한 영상 분석이 가능하게 한다.
평가 기준 : 학습된 인공지능 영상분석 알고리즘의 정확도를 분석하며, 육안 검사와의 정확도를 비교
IRB ( Institutuinal Review Board, 생명윤리 위원회)
임상연구에 참여하는 연구 대상자의 권리 , 안정 ,복지를 위하여 인간을 대상으로 하는 모든 생명의과학연구의 윤리적, 과학적 측명을 심의하여,
연구 계획을 승인할 수 있는 독립된 합의제 의결기구이다.
IRB 설치의 주요 목적은 인간 대상 연구를 비롯한 생명과학기술 연구의 윤리적 과학적 타당성을 심의하여 연구대상자를 보호하기 위함이다.
이를 위해 연구자로부터 연구 계획서, 연구대상자 설명문 및 동의서 , 증례기록서 등 관련 자료를 받아 심의 및 승인하여 적절한 연구 진행이 이루어 질 수 있도록
관리 및 감독하는 역할을 수행한다.
영상 데이터 이용 권한 ( PACS 접근)을 위한 IRB 승인 절차 진행 중!
재영소프트 : 1. 영상데이터 서비스 분석 설계 ( 아키텍처 및 DB 연동 설계 )
2. IRB 승인, 영상 데이터 저장소 구축
3. 동아대학교 병원에서의 개인 동의 Process 협의
4. 실제 영상 보유자에 대한 접근 용이성 확보 ?
(환자)마이테이터 소유권자 -> (병원) 방문 , 앱가입 -> (환자)사전 동의 및 전자 자필 서명한 전자문서 제출 (BApp상)
->(BApp) 병원으로 환자 제출 서류 및 대인 증명서류 온라인 제출 -> (BApp) 동일 서류 국민 건강보험 공단에 제출
->(병원)에서 증빙서류 확인 후 진료기록 사본제공 -> (국민건강보험공단) 국가건강검진 결과 사본제공
->(환자) 종합건강검진 업로드 , 전자 처방전 업로드 -> (BApp) 상 등록 완료 -> (수요기관) 의료데이터 요청
->(환자) 요청 확인 후 수요처별 데이터 활용 동의 -> (BApp) 가명처리된 의료 데이터 제공 (수요기관)
***********************************************************************************************************
->개인정보 동의 이력정보 / 데이터제공 이력정보/ 의료데이터저장 이력정보 /데이터 활용 이력 정보
===> 해당 정보들이 블록체인에 저장
이모든 것들이 중앙 집중형 의료데이터 시스템의 약점을 보안하기 위함
-> 단점들은 해킹으로 인한 위조 변조 복구의 어려움에서 벗아날 수 있음.
여기에 플러스해서 자료 취득의 간편한 과정 !
부산=연합뉴스) 박창수 기자 = BNK부산은행은 블록체인 기반의 새로운 전자 지갑인 '디지털 바우처' 서비스를 출시했다고 29일 밝혔다.
이 서비스는 결제와 송금, 수당 관리 등으로 분산돼 지급 수단을 통합 관리할 수 있는 장점을 갖추고 있다.
또 디지털화폐 발행 플랫폼 기능을 통해 공공기관은 정책지원금 등을 디지털 바우처로, 일반 기업은 직원 복지 포인트 등을 각각 발행할 수 있다.
사용자와 사용 장소 및 기간 등 규칙을 정해 발행할 수 있으며, 블록체인을 통해 사용 현황을 투명하게 관리할 수도 있다.
발행된 디지털 바우처는 부산은행 앱에 보관되고 썸패스 가맹점에서 QR코드로 결제하거나 타인에게 선물도 가능하다.
부산은행은 올해 말까지 계좌가 없는 외국인이나 미성년자를 대상으로 디지털 바우처 서비스를 확대할 계획이다.
부산은행은 디지털 바우처와 결제 수단을 통해 외부 자금이 지역 안으로 유입돼 지역경제 활성화에 이바지할 것으로 기대했다.
은행 관계자는 "블록체인 기반의 새로운 디지털화폐를 지역 내 유통함으로써 지역 상공인을 지원하고 지자체 정책 예산 및 행정 효율화에 기여할 것으로 기대한다"며 "앞으로 블록체인 규제자유특구 사업자와 연계해 관련 산업 생태계 조성에 힘쓰겠다"고 말했다.
컴퓨터 클러스터(영어: computer cluster, 문화어: 콤퓨터 클라스터)
는 여러 대의 컴퓨터들이 연결되어 하나의 시스템처럼 동작하는 컴퓨터들의 집합을 말한다.
클러스터의 구성 요소들은 일반적으로 고속의 근거리 통신망으로 연결된다.
서버로 사용되는 노드에는 각각의 운영 체제가 실행된다.
컴퓨터 클러스터는 저렴한 마이크로프로세서와 고속의 네트워크, 그리고 고성능 분산 컴퓨팅용 소프트웨어들의 조합 결과로 태어났다.
클러스터는 일반적으로 단일 컴퓨터보다 더 뛰어난 성능과 안정성을 제공하며,
비슷한 성능과 안정성을 제공하는 단일 컴퓨터보다 비용 면에서 훨씬 더 효율적이다.
[1] 따라서 열 개 안팎의 중소 규모의 클러스터부터 수천 개로 이루어진 대형 슈퍼컴퓨터에 이르기까지 널리 사용되고 있다.
Hyperledger Fabric은 고도의 기밀성, 탄력성, 유연성 및 확장 성을 제공하는 모듈러 아키텍처를
기반으로하는 분산 원장 솔루션을위한 플랫폼입니다.
이것은 다양한 구성 요소의 플러그 가능 구현을 지원하고 경제 생태계 전반에 걸쳐 존재하는 복잡성과 복잡성을 수용하도록 설계되었습니다.
Hyperledger Fabric은 고유 한 탄성과 확장 성을 지닌 아키텍처를 제공하여이를 대체 블록 체인 솔루션과 구별합니다.
미래의 엔터프라이즈 블록 체인을 계획하려면 완전히 검증 된 오픈 소스 아키텍처를 구축해야합니다.
Hyperledger Fabric이 출발점입니다.
최초 사용자는 블록 체인이 작동하는 방식과 Hyperledger Fabric의 특정 기능 및 구성 요소에 익숙해지기 위해
아래 소개의 나머지 부분을 수행하는 것으로 시작하는 것이 좋습니다.
일단 편안하게 - 또는 블록 체인 및 Hyperledger Fabric에 이미 익숙한 경우 - 시작하기 로 이동 하여 데모, 기술 사양, API 등을 살펴보십시오.
딥러닝 = 머신러닝 +빅데이터 !
1. 딥러닝
- 딥러닝 모델 종류 및 개념 공부 (Pix2Pix는 GT 필요 / CycleGAN은 GT x)
- GT에 대하여 (이상적인 기대결과 / 답지) : 정확도를 올려 줄 수 있는 표본 !
- segment에 대하여 (CV Studio 참고)
Pix2Pix의 경우 GT가 필요하다. Input 이미지 에 GT 를 기반으로 Output 이미지를 만들어 낸다.
1. GAN(Generative Adversarial Network)이란?
Generative : "생성적인, 생산하는"이라는 뜻으로 GAN모델 안에서의 의미는 이미지를 생성한다라는 의미입니다.
Adversarial : "적대적인" 이르는 뜻으로, 서로 경쟁하면서 무엇인가를 좋게하는 의미입니다. 즉, 이미지를 만들긴 하는데, 서로 경쟁하면서 좋게 만든다라는 의미가 됩니다.
따라서, 전반적인 GAN의 의미는 서로 경쟁하면서 가짜이미지를 진짜이미지와 최대한 비슷하게 만들어내는 네트워크를 말하게 되는 것 입니다.
GAN의 구조는 보시는 처럼 판별기 와 생성기로 구성되어 있습니다.
판별기 :가짜 데이터와 진짜 데이터에 대해서 0과 1로 판별하는 역할
생성기 :lantent sample 노이즈를 통해 가짜 데이터를 생성하는 역할
원리와 학습 순서
앞에서 언급했던것 처럼 적대적인 원리를 가지고 있습니다. 판별기와 생성기는 서로 적대적으로 경쟁하며 가짜 이미지를 진짜 이미지처럼
만듭니다. 그렇다면 어떻게 학습이 진행되는 것일 까요 순서는 다음과 같습니다.
1. 훈련 데이터(진짜 데이터) 를 가지고 판별기를 학습시킵니다. 이를 통해 훈력 데이터의 분포를 얻게됩니다.
2. Latent sample를 통해 노이즈한 값을 생성기에 주고 생성기에서는 이미지를 생성합니다. 물론 처음에는 굉장히 허접한 데이터를 생성하지만 분포가 점점 훈련 데이터
분포에 따라갈수록 진짜 이미지와 비슷한 이미지를 생성합니다.
3. 생성된 이미지(가짜데이터)는 판별기에서 가짜 데이터와 진짜데이터를 구별하게 되고 오차 역정파를 통해 생성기를 좀더 진짜 데이터로 만들 수 있는 방향을 학습하게됩니다.
CycleGan이란
하나의 이미지 도메인을 다른이미지의 도메인으로 바꾸는 모델이다.
Pix2Pix와 CycleGAN의 차이점은 Pix2Pix
은 인풋이미지와 타겟이미지가 페어를 이르는 데이터 셋이 필요하지만
CycleGan 은 위와 같이 페어를 이룰 필요가 없다
이게 무슨 뜻이냐 하면 만약 오렌지를 사고로 바꾸는 모델을 만들고 싶다면 사과와 오렌지의 이미지가 1:1를 이룰 필요가 없이 사과 이미지 셋과
오렌지 이미지 셋이 있으면 된다는 뜻이다.
CycleGAN의 Loss는 Cycle consistency를 고려한다. 이는 하나의 도메인에서 다른 도메인으로 바꾼 이미지를 다시 원래 이미지로 되돌렸을 때 진짜 이미지와 얼마나 차이 나는지 계산하게 된다. 즉 Generator를 각 도메인마다 G()과 F()로, Discriminator를 D_X()과 D_Y()로 표현했을 때, 아래의 그림과 같이 표현할 수 있다.
'DeepLearning' 카테고리의 다른 글
[책]혼자 공부하는 머신러닝 / 딥러닝 _정말 혼자 공부하는 AI_구글 코랩 사용법 (0) | 2023.02.28 |
---|---|
온오프믹스 모임문화 플랫폼을 통해 참여하게 된 AI 개발 스터디 모임 (0) | 2023.02.18 |
How to create a Google Chrome extension program with ChatGPT(ChatGPT로 구글 크롬 확장 프로그램 만드는 방법) (0) | 2023.02.03 |
Chatbots: The Future of Customer Service (0) | 2023.02.02 |
ChatGPT 전세계에서 난리난 인공지능 챗봇 사용법 (How to use ChatGPT) (0) | 2023.02.02 |
1일차 처음 만드는 인공지능 모델링 (0) | 2022.11.09 |