Computer   Vision

 

Computer vision 은 인공지능 (Artificial Intelligence) 의 한 분야로서, 어떤 영상에서 장면이나 특징 (scene or features) 들을 "이해 (Understanding)" 하는 컴퓨터를 프로그램하는 것이 목적이다. 컴퓨터비전의 일반적인 목표는 다음과 같다 :

이러한 목표들은 패턴인식 (Pattern Recognition), statistical learning, projective geometry, image processing, 그래프 이론 (Graph Theory) 등등에 의해 성취될수 있다. Cognitive computer vision 은 인지 심리학 (Cognitive Psychology), biological computation 과 밀접하게 관련되어있다.

관련되는 machine vision 과 medical imaging 분야에서, 컴퓨터비전 기술을 사용한 시스템들은 매년 수십억달러의 시장을 형성하고 있다. 흥미로운 응용분야는 영화와 방송, 즉 camera tracking 또는 matchmoving 으로 visual effects 를 만드는데 흔히 사용된다는 것이다. 컴퓨터비전은 의학, 군사, 보안과 감시 (surveillance), 품질검사 (quality inspection), 로봇, 자동차산업 등등 여러분야에 응용된다. .... (Wikipedia : Computer Vision)

definition    term    site    lab    book   demo    paper

시각 (vision) 은 인간이 지니고 있는 지적 감각능력 중에서 아마도 가장 뛰어난 것이라고 할 수 있을 것이다. 인간은 사물과 직접 접촉하지 않고서도 시각시스템을 통하여 주변 환경에 대한 정보를 얻을 수 있다. 또한, 인간의 시각은 다른 어느 시스템보다도 경이적인 속도와 가장 높은 해상도 (resolution) 로서 정보를 얻을 수 있다. 그 차이를 알기 위해서는, TV 카메라와 인간의 해상도를 비교하는 것만으로도 충분하다. 대략적으로 TV 카메라는 1 ㎠ 당 500 점의 해상도를 지닌데 비하여, 인간의 눈은 1 ㎠ 당 거의 25 × 106 점의 해상도를 지니고 있다. 따라서, 인간의 눈은 TV 카메라보다 적어도 10,000 배 이상의 정밀한 시각 해상도를 지니고 있다. 더욱 주목할 만한 사실은, 인간은 힘들이지 않고 다양한 화상을 느끼고 인지할 수 있다는 점이다. 이러한 행동은 거의 노력을 기울이지 않고 이루어지기 때문에, 우리가 그것을 인식하는 일은 거의 없다 .........

인간에게 있어서 시각 (Vision) 능력이란 태어날 때부터 주어지는 것이지만 기계 (컴퓨터 또는 로봇) 에 시각 능력을 부여하는 것은 상당히 어려운 문제이다. 왜냐하면 변화가 심하고 제어되지 않는 조명, 그림자, 복잡하고 기술하기 어려운 풍경이나 다른 물체를 포함하고 있는 물체 등은 기계가 인식하기 어렵기 때문이다. 이러한 문제점들 때문에 컴퓨터 시각 (Computer Vision) 은 건물 내부 등과 같이 인위적으로 만들어진 환경에서만 성공적으로 작동하고 있다.

풍경 속의 화상으로 추측되는 물체에 대한 특화된 지식과 풍경을 구성하고 있는 표면의 속성, 그 표면을 비추고 있는 주변의 광도들에 관한 지식들이 추출되어 에이전트 (로봇) 에게 유용한 주변 정보로 사용된다 ....... 추출되는 정보는 주로 에이전트의 목적이나 수행 임무에 따라 다르다. 예를 들어, 장애물이 많은 지역을 안전하게 이동하기 위해서는 에이전트가 장애물의 위치, 경계, 그리고 지역을 구성하는 표면의 속성 등을 알 필요가 있다 (예를들면 Dean Pomerleau 가 만든 신경망을 이용한 무인자동차 ALVINN). 그리고 물체를 조작하기 위해서는 물체의 방향, 크기, 구성요소, 질감(texture) 등의 정보가 필요하다. 또 다른 형태의 임무를 수행하기 위해서 물체의 색상이나 종류를 알 필요도 있다. 에이전트는 지정된 시간 동안에 이러한 물체에 대한 정보의 변화에 기반하여 미래의 가능한 변화를 예측하는 일이 필요할 수도 있다. 하나 이상의 화상으로부터 이러한 정보를 추출하는 것은 어려운 문제이다.......

시각처리 과정을 두 단계 나눌 수 있다. 화상처리 단계(image processing stage)는 원래의 화상을 배경 분석 단계에서 이용하기 쉬운 형태로 변형시키는 단계이다. 다양한 필터링(filtering)을 이용해서 노이즈를 줄이고, 간선을 강조하기도 하며, 영역을 발견해내는 등의 여러 가지 작업을 한다. 배경 분석 단계(scene analysis stage) 는 한 단계 처리된 화상으로부터 에이전트가 임무 수행에 필요로 하는 정보 형태를 생성해내는 단계이다. 로봇 시각 분야를 여기서처럼 두 단계로 나누는 것은 단지 설명을 위하여 단순화시킨 것이고, 실제 응용에서는 보다 많은 단계를 거치며 단계간의 상호작용도 훨씬 활발하다. ........

video :

딥 러닝 기반의 영상인식 기술 - 1강 : SKtechx Tacademy : 2017/06/06 ... 동영상 2개 ... 딥 러닝 (Deep Learning)

 

어떻게 컴퓨터가 사진을 이해하게 되었는가? : TED  에듀앤스쿨 : Fei-Fei Li  2015/10/18

 

무인 자동차가 도로를 보는 방법 : TED  에듀앤스쿨 : Chris Urmson  2015/10/05

 

Computer Vision 2012 : UCF  CRCV : Mubarak Shah, 2012/09/19 ... Playlist 20   

Computer Vision 2014 ... Playlist 18