본문 바로가기

DeepLearning

데이터 어노테이션(Data Annotation) :데이터 라벨링 6가지에 대한 설명

반응형

메타데이터 : 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터이다. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말한다.

데이터 셋  : 데이터의 집합 . 동일한 정보를 가진 데이터의 덩어리 

6가지 

바운딩박스 : 영상 또는 이미지 가장 자리에 딱 맞춰 박스를 그리는 기법 : 자율 주행 차량 개발에 사용

빠르고 간단하게 객체를 구분할 수 있지만 또 해당 박스 안에 원치 않은 객체의 픽셀이 들어 갈 수 있다는 단점이 존재

폴리곤 : 이동하는 객체 등 규칙적이지 않은 객체를 정밀하게 구분할 수 있지만 시간이 오래 걸린다. 그리고 겹쳐져 있는 객체의 경우 인식률이 떨어지는 경우가 있다. 

폴리라인: 객체의 시작점과 끝점이 달라도 인식 가능 자율 주행 차량의 차선 인식에 사용된다. 곡선에도 유용하다. 하지만 객체의 선이 1픽셀 너비에 가까운 경우에만 사용 가능 객체의 선이 너무 넓으면 폴리곤 사용

포인트 : 이미지 상 단일 픽셀을 찾아내는 경우 사용 이경우는 객체가 명확하게 구분되어 있어야 사용 가능 

큐보이드 : 바인딩 박스와 유사하지만 높이 너비 폭 까지 측정하여 2D 만으로는 측정이 어려운 객체도 구분 가능 산업 로봇이 객체를 구분할 때 주로 사용

시맨틱 세그멘테이션 : 모든 픽셀에 채색을 하여 같은 색을 클래스로 묶는 방법 이미지의 모든 영역을 인식하게 하는 고차원의 방법이다. 단점은 손이 많이 가 높은 비용이 발생한다.

반응형