본문 바로가기
[Public] 신호처리/MPEG-4

[MPEG-4] MEPG-4 비디오 압축

by 차출발 2009. 5. 1.
반응형

 데이터의 압축은 인간 시각이 인지할 수 없는 정도의 범위 내에서 영상 정보를 압축하게 되는데 이는 영상 내에 있는 중복 정보를 제거하는 것을 목적으로 한다.

위 사진과 같이
시간, 공간, 통계적인 중복 사항(Redundant Infomation)을 제거하는 것이 Video 압축의 기본 원리이다.



Redundant Infomation

동 작

응 용

Temporal Redundancy

연속되는 화면 간 유사성

화면간 상관 관계 최소화

움직임 보상 예측 부호화

Motion Estimation

Spatial Redundancy

이웃한 화소 간 유사성

화소 간 상관관계 최소화

DCT 및 적응 양자화

DCT 계수, 움직임 벡터의 예측 부호화

Statistical Redundancy

데이터의 출현 확률에 따라 평균

비트 수를 작게 유지

평균 비트 수를 줄임

Huffman Coding

Arithmetic Coding


 

1. 시간적 중복 정보 압축 (Temporal Redundancy)

 
시간적 중복 압축은 각각의 프레임내에서의 압축이 아닌 연속된 프레임간의 공통점을
  찾아내어 유사한 블록에 대해서는 압축을 수행하지 않고 방향 좌표만을 설정하는 방법을
  이용하여 압축하는 기술이다
.

 MPEG-4 에서는
 I-Frame(Intra-coded frame)
 P-Frame(Predictive-coded frame)
 B-Frame(Bidirectionally predictive-coded frame) 
 
  3
가지 종류의 프레임이 있는데 

  I-Frame
같은 경우에는 이미지 전체를 코딩하고
 
  P-Frame
의 경우 이전에 코딩 되있던 I-Frame 또는 P-Frame을 조사하여 공통점을 찾고
 공통되지 않은 부분에 대해서만 코딩을 한다
.
 
  B-Frame
의 경우 이전 I/P Frame 그리고 다음 I/P Frame을 조사하여 공통된 부분을 찾아
 다른 부분에 대해서만 코딩을 한다
.
 
압축된 데이터 크기는 I Frame > P Frame > B Frame 순서로 압축이 된다

 

2. 공간 중복 정보 압축(Spatial Redundancy)

  공간 중복 압축이란 사람의 시각이 공간에서 특정 영역의 데이터를 민감하게 반응하지
 못하는 점을 이용하여 데이터의 손실 압축하는 방법으로 하나의 프레임 내에서 이루어
 지는 압축과정이다
.

  공간 정보 압축에는 첫 번째로 RGB평면을 YCbCr로 변환하면서 

  4:4:4
데이터를 4:2:0으로 만드는 Sub Sampling 과정 

  두 번째로
YCbCr데이터를 주파수로 변환시키는 DCT과정

  이 결과에서 고주파 영역을 일정 레벨로 나누어 제거하는 방법으로
Quantization과정

 공간중복 압축은 기본적으로 손실 압축의 일종으로
 인간의 눈에 거슬리지 않는 정도의 화질을 유지하면서 데이터를 압축하는 기술이다
.  

 

 3. 통계적 중복 정보 압축(Statistical Redundancy)
 
  통계적 압축은 공간 중복 압축과는 다르게 손실이 없는 압축 방법으로 수학적인 공식을
 이용하여 데이터 압축을 수행한다
이는 공간적 중복 압축 데이터 뿐만 아니라 시간적 중복 압축의 데이터에도 모두 적용된다.

  MPEG-4 에서는 공간적 압축이 끝난 데이터를

Zigzag scan
을 통해 저주파 성분에서 고주파 성분으로 정렬

  Quantization에 의해 반복된 0이 많이 나오게 되는데 이때 연속된 0을 데이터가 아닌 개수로서 표시하여 압축을 수행하는 Run Length 코딩

 출현 빈도에 따라 코드길이를 재배치하는 Huffman 코딩이 Run Length 코딩과 함께 사용

 이는 자주 발생하는 숫자에는 짧은 코드를 드물게 발생하는 숫자에
 긴 코드를 할당하는 방법이다




'[Public] 신호처리 > MPEG-4' 카테고리의 다른 글

[MPEG] DCT  (0) 2009.07.08