본문 바로가기
[Public] 신호처리/영상 객체검출

[SIFT] 1. Scale-Space Extrema Detection

by 차출발 2010. 4. 7.
반응형


1)     Scale Space

-      Need to find characteristic scale for feature

-      Scale-Space : continuous function of scale 


☞ Scale Space

특징개체를 찾기 위하여 특유의 scale을 찾는 게 필요하다 

Scale-Space : Scale σ 연속적인 계층 함수 (적절한 함수는 가우시안 함수이다.)

(Koenderink 1984) (Lindeberg 1994) 를 참고 하여라

특히 Lindeberg 의 Scale-Space 이론은 매우 중요하다.


-----------------------------------------------------------------------------------------------------------------------

2) Scale Selection

 -      Experimentally, Maxima of Laplacianof Gaussian gives best notion of scale



-      Thus use Laplacian of Gaussian(LOG) operator 

☞ Scale의 선택

실험적으로 LOG의 극값은 최적의 scale 개념을 가진다. 

그래서 LOG 연산자를 사용한다.

(Mikolajczky 2002)를 참고 하여라...


-----------------------------------------------------------------------------------------------------------------------

3) Approximate LOG

 - LOG is expensive, so let's approximate it

 - Using the heat-diffusion equation.


- Define Difference Of Gaussian(DOG)


☞ LOG 의 근사화

  라플라시안 오브 가우시안(LOG)는 매우 연산량이 많다. 그래서 이것과 근사화 시킨다. 

  흐려짐의 차이의 방정식을 자용한다.

  이를 DOG라 정의한다. 

  이때  σ = 1.6 일때 LOG와 가장 근사하다고 한다.


-----------------------------------------------------------------------------------------------------------------------

4) DOG efficiency

  - The smoothed images need to be computed in any case for feature description.

  - We need only to subtract two images.

 



☞ DOG의 효과 

 어떤 경우라도 묘사될 수 있게하기 위하여 부드러운 이미지들로 계산하는 것을 필요로한다. 

 우리는 단지 부드러운 이미지들의 차이만 필요하다.


-----------------------------------------------------------------------------------------------------------------------

 5) DOB filter(Difference Of Boxes) 

  - Even faster approximation is using box filters (by integral image)

  


☞  Difference Of Boxes

  심지어 빠른 접근을위해 DOB를 사용한다. (이는 적분된 이미지를 사용하는 것이다.)

  이에 대한 내용은 나중에 Integral Image 설명 할때 따로 하겠다.

  (Bay ECCV 2006) 을 더 참고해보라


-----------------------------------------------------------------------------------------------------------------------

6) Scale-Space Construction

 - First construct scale-space

 


☞ Scale-Space 의 구성

 먼저 Scale-Space를 사진과 같이 구성한다. 

그러기 위하여 가우시안 함수를 적용한다.

여기서 볼게 σ 값을 어떻게 설정하는가 이다.

octave는 이미지의 크기를 나타낸다.  (논문에서는 이미지 크기를 1번 확대 한후 시작한다.)

이미지 크기가 크면 지속적으로 일정 수준까지 축소해서 가기 때문에 시간이 더 오래 걸린다.

보간 방법에 대해서는 언급하지 않겠다. 

(논문에서는 선형 보간 방식을 쓴거 같은데 오픈 소스에서는 CUBIC 방식을 썻던거 같다.)

 자세한건 모르겠다. 직접 찾아보아라

 

-----------------------------------------------------------------------------------------------------------------------

 7) Difference Of Gaussian

 

 

 ☞ DOG 만들기

  아까 만들었던 이미지에서 이미지의 차이를 구한다.

  논문에서는 하나의 Octav 당 5개의 이미지를 만들었다. 

  이는 DOG 이미지는 4개가 나온다. 

 가장 위의 것과 가장 아래의 것은 사용하지 않는다는 것이다.

  

---------------------------------------------------------------------------------------------------------------------

8) Scale-space Extrema

 - Choose all extrema within 3 X 3 X 3 neighborhood.

 - Low cost  :  only several usually checked.



☞ Scale-Space 의 극값

이전에 DOG 영상 4장이 나왔다.

논문에서는 4장중 가장 위와 가장 아래의 DOG 이미지를 사용하지 않는다.

예를 들어 (1 - 2 - 3 - 4 )  4장의 이미지가 있다면 

1-<2>-3,    2-<3>-4   이렇게 2, 3 두개의 이미지의 극값만 구한다는 것이다.

좌표 x, y 하고, 위의 3장 이미지를 z 축이라 이해하면

 3 X 3 X 3 영역에서 이웃을 확인하여 극값을 구한다. 

(총 27개의 점들중 가운데 점이 주변점과 비교하여 최대값 또는 최소값을 가지면 극값이다.)

한 octave 에서만 하지 않고 여러 octave에서 한 이유는 최대한 후보점을 많이 가질려는 것이다.


자 지금까지 

1단계 Scale-Space Extrema Detection 부분이었다.