[SIFT] 1. Scale-Space Extrema Detection
1) Scale Space
- Need to find characteristic scale for feature
- Scale-Space : continuous function of scale
☞ Scale Space
특징개체를 찾기 위하여 특유의 scale을 찾는 게 필요하다
Scale-Space : Scale σ 연속적인 계층 함수 (적절한 함수는 가우시안 함수이다.)
(Koenderink 1984) (Lindeberg 1994) 를 참고 하여라
특히 Lindeberg 의 Scale-Space 이론은 매우 중요하다.
-----------------------------------------------------------------------------------------------------------------------
2) Scale Selection
- Experimentally, Maxima of Laplacianof Gaussian gives best notion of scale
- Thus use Laplacian of Gaussian(LOG) operator
☞ Scale의 선택
실험적으로 LOG의 극값은 최적의 scale 개념을 가진다.
그래서 LOG 연산자를 사용한다.
(Mikolajczky 2002)를 참고 하여라...
-----------------------------------------------------------------------------------------------------------------------
3) Approximate LOG
- LOG is expensive, so let's approximate it
- Using the heat-diffusion equation.
- Define Difference Of Gaussian(DOG)
☞ LOG 의 근사화
라플라시안 오브 가우시안(LOG)는 매우 연산량이 많다. 그래서 이것과 근사화 시킨다.
흐려짐의 차이의 방정식을 자용한다.
이를 DOG라 정의한다.
이때 σ = 1.6 일때 LOG와 가장 근사하다고 한다.
-----------------------------------------------------------------------------------------------------------------------
4) DOG efficiency
- The smoothed images need to be computed in any case for feature description.
- We need only to subtract two images.
☞ DOG의 효과
어떤 경우라도 묘사될 수 있게하기 위하여 부드러운 이미지들로 계산하는 것을 필요로한다.
우리는 단지 부드러운 이미지들의 차이만 필요하다.
-----------------------------------------------------------------------------------------------------------------------
5) DOB filter(Difference Of Boxes)
- Even faster approximation is using box filters (by integral image)
☞ Difference Of Boxes
심지어 빠른 접근을위해 DOB를 사용한다. (이는 적분된 이미지를 사용하는 것이다.)
이에 대한 내용은 나중에 Integral Image 설명 할때 따로 하겠다.
(Bay ECCV 2006) 을 더 참고해보라
-----------------------------------------------------------------------------------------------------------------------
6) Scale-Space Construction
- First construct scale-space
☞ Scale-Space 의 구성
먼저 Scale-Space를 사진과 같이 구성한다.
그러기 위하여 가우시안 함수를 적용한다.
여기서 볼게 σ 값을 어떻게 설정하는가 이다.
octave는 이미지의 크기를 나타낸다. (논문에서는 이미지 크기를 1번 확대 한후 시작한다.)
이미지 크기가 크면 지속적으로 일정 수준까지 축소해서 가기 때문에 시간이 더 오래 걸린다.
보간 방법에 대해서는 언급하지 않겠다.
(논문에서는 선형 보간 방식을 쓴거 같은데 오픈 소스에서는 CUBIC 방식을 썻던거 같다.)
자세한건 모르겠다. 직접 찾아보아라
-----------------------------------------------------------------------------------------------------------------------
7) Difference Of Gaussian
☞ DOG 만들기
아까 만들었던 이미지에서 이미지의 차이를 구한다.
논문에서는 하나의 Octav 당 5개의 이미지를 만들었다.
이는 DOG 이미지는 4개가 나온다.
가장 위의 것과 가장 아래의 것은 사용하지 않는다는 것이다.
---------------------------------------------------------------------------------------------------------------------
8) Scale-space Extrema
- Choose all extrema within 3 X 3 X 3 neighborhood.
- Low cost : only several usually checked.
☞ Scale-Space 의 극값
이전에 DOG 영상 4장이 나왔다.
논문에서는 4장중 가장 위와 가장 아래의 DOG 이미지를 사용하지 않는다.
예를 들어 (1 - 2 - 3 - 4 ) 4장의 이미지가 있다면
1-<2>-3, 2-<3>-4 이렇게 2, 3 두개의 이미지의 극값만 구한다는 것이다.
좌표 x, y 하고, 위의 3장 이미지를 z 축이라 이해하면
3 X 3 X 3 영역에서 이웃을 확인하여 극값을 구한다.
(총 27개의 점들중 가운데 점이 주변점과 비교하여 최대값 또는 최소값을 가지면 극값이다.)
한 octave 에서만 하지 않고 여러 octave에서 한 이유는 최대한 후보점을 많이 가질려는 것이다.
자 지금까지
1단계 Scale-Space Extrema Detection 부분이었다.