1. 패턴인식의 개요
(1) 패턴인식의 정의
- 패턴인식은 “계산이 가능한 기계적인 장치가 어떠한 대상을 인식하는 문제를 다루는 인공지능의 한 분야“로 표현 할 수 있다고 한다.
(2) 특징과 패턴
- 패턴이란 개별 객체의 특색 혹은 특징을 의미하며 특징을 모아놓은 집합으로 정의 됨
- 패턴을 이루는 특징 벡터는 특징 공간상에서 분포하는 유형에 따라 분류가 가능
ü 선형 분리 가능한 유형
ü 비선형 분리 가능한 유형
ü 높은 상관을 가진 유형
ü 멀티 모달 유형
- 또한 시변성에 따라 정적과 동적 패턴으로 분류 할 수 있다고 하는데 시변성이 뭘까? 찾아보니깐 시변성이랑 시간의 흐름이라 ….. 음
(3) 패턴인식 시스템의 구성 요소와 설계 사이클
- 1단계 : 데이터 수집 단계
- 2단계 : 특징 선택 단계
- 3단계 : 모델 선택 단계
- 4단계 : 학습 단계
- 5단계 : 인식 단계
(4) 패턴인식의 유형과 분류기
1) 문제 유형
① 분류
- 어떠한 대상객체를 특정한 클래스에 할당하는 것
- Fuzzy가 아닌 명확한 결정을 요구하는 분류가 대표적인 예
② 회귀
- 분류를 일반화하는 것
- 학습데이터로부터 모델링된 모델로 시험 데이터에서도 그 모델로부터 유효한 결과를 얻을 수 있는 경우에 붙일 수 있는 말이라 한다. 회귀분석이랑 같은건가 ?
- 회귀는 예측이 가능하다.
③ 군집합
- 클러스터링이라고도 하며 어떤 집합을 의미있는 복수개의 그룹들로 조직하는 문제
- 군집화는 생명체를 종으루 분류하는 경우처럼 계층적으로도 처리될 수 있다고 한다. 이건 군집분석?
④ 서술
- 대상 객체를 일련의 원형 혹은 기본형으로 표현하는 문제를 말한다.
- ECG(심전도) 생체신호를 P, QRS 그리고 T 항으로 라벨을 붙이는 경우가 이에 해당한다 한다 먼 말인지 나도 모르겠다.
2) 분류기
- 분류기는 판별함수의 집합으로 표현 한다고 아래는 그럼 신경망이겠군 .
(5) 패턴인식의 접근법
- 어디서 많이 본 사진인듯….. 패턴인식 신경망 하면 저 그림은 꼭 나오는 것 같은 사진 그래 나도 한번 써보장. ㅋ
1) 통계적 접근법
- 통계적 모델을 기반으로 하여 패턴을 분류하는 방법
- 패턴들의 모델은 해당 클래스에서 확률밀도함수가 되며 베이즈의 결정 규칙을 이용하여 분류하여 인식한다. 베이즈안 정리 베이즈안 통계가 이거인가.
2) 신경망 접근법
- 패턴의 분류를 입력 자극에 대한 처리 단위로 이루어진 망의 응답과정으로 분류를 행하는 접근법
- 시냅스의 연결 강도 가중치들로 저장하여 학습이 가능하고 알고리즘적이지 않으며 블랙박스와 같이 취급이 가능
- 사전 지식을 최소화하고 뉴런의 층이 충분하면 이론적으로 어떤 복잡한 결정 영역도 만들 수 있다.
3) 구조적 접근법
- 패턴의 구조적인 유사성을 조사하여 이를 이용하여 분류를 행하는 방법
- 형식문법 혹은 그래프적 관계 설명으로 표현
- 분류뿐만 아니라 해당 객체를 서술하기 위해서도 사용됨
- 유사한 부분 패턴들로부터 구축된 복잡한 패턴의 계층적 서술을 수식화하는 접근법이라고 할 수 있다.
(6) 패턴인식의 응용 분야
1) 문자인식 분야
- 자동 우편물 분류기,
- 스캐너로 받아들인 텍스트 이미지를 컴퓨터에서 편집 가능하게 하는 장치,
- 필기체 문자인식, 수표 및 지폐인식, 차량번호판 인식
2) 생체인식과 인간 행동 패턴 분석 분야
- 음성인식, 지문인식, 홍체인식, 얼굴인식
- DNA 매핑, 보행 패턴 분석 및 분류, 발화 습관 분석 및 분류
3) 진단 시스템 분야
- 자동차 오동작 진단
- 의료진단, 뇌전도, 심전도, X-Ray판독
- 신호 분석 및 분류
4) 예측 시스템 분야
- 인공위성 데이터에 기반한 날씨 예측
- 지진 패턴 분석과 예측 시스템
- 주가 예측시스템
5) 보안과 군사 분야
- 네트워크 트래픽 패턴분석을 통하여 컴퓨터 공격확인
- 물품 자동검색 시스템
- 인공위성 영상 분석을 통한 테러리스트 캠프 혹은 지형 목표물 추적 공격
- 레이더 신호 분류, 항공기 피아 식별 시스템
(7) 패턴인식의 응용 예
1) 간단한 영문자 인식 시스템
- 영문자 LPOEQ를 인식하는 인식 시스템의 예를 들어보자
- 특징 4가지 (수직선의 개수(V), 수평선의 개수(H), 기울어진 수진선(O), 커브의 개수(c))로 분류
2) 자동 어류 분류 시스템
- 연어와 농어 분류하는데 크기가 다르다는 특징을 이용하여 크기로 분류 60% 인식률이 왔다. 60%로 사용할 수 없다. 그래서 평균 명암 스케일을 추가하여 95.7% 인식률이 나왔다. 높은 수치이다. 하지만 신경망 알고리즘을 이용한다면 99.975% 인식률이 나왔다. 그렇다 이제 만들면 된다. 만들고 나서 적용해보니 고기의 25%가 분류가 잘못되었다. 얼래 먼 일이래 찾아보니 일반화의 오류가 나타났다고 한다. 일반화의 오류란 무엇 일까? 쉽게 말하면 일반화의 오류란 일부만 가지고 전체를 판단해서 생기는 오류라 한다. 즉 표본만 가지고 판별하니깐 그런 결과가 나온 것이다. 만약 표본의 수를 증가 시키면 더 높은 인식률이 나오지 않을까 생각된다.