12x12 행렬에서 3x3 행렬을 떼냄
무작위 숫자로 이루어진 3x3 행렬을 곱해줌, 이를 filter라고 함
같은 행과 열 요소들끼리 곱해준 다음 더해서 하나의 값으로 내보냄
이것을 오른쪽으로 한칸, 아래로 한칸씩 이동하면서 반복하면 10x10 행렬이 나옴
최종적인 결과를 feature map이라고 함
이때 이미지 크기가 작아지는 문제가 발생함
원래 이미지는 12x12인데 3x3 필터를 적용하자 10x10이 됨
이미지 상하좌우에 0을 붙여 사이즈를 늘려주면 필터를 적용시켜도 원래 이미지 크기를 유지할 수 있음
이것을 padding이라고 함
필터를 많이 적용할 수록 결과물인 feature map이 많아짐
행렬의 크기를 줄이는 방법을 pooling라 함
종류로는 가장 큰 수만 뽑는 max pooling과 평균값을 뽑는 average pooling이 있음
정리하자면
CNN=convolution neural network=합성곱 신경망
컬러이미지가 입력되면
-> rgb 3가지 채널로 인식됨
-> 필터를 통해 특성지도가 만들어짐
-> 풀링으로 크기는 줄이고
-> 분류기로 분류
원본이미지에 필터를 씌워서 feature를 파악함 (수염을 인식하는 필터, 물체의 경계를 인식하는 필터 등)
구체적으로, 필터함수가 원본이미지를 훑어나가며 최종값을 도출함
이런 연산방식을 합성곱이라 부르고, 결과물이 feature map임
자율주행이나 ocr 등에 활용됨
실시간 객체인식 알고리즘으로는 Yolo가 유명하고, ocr은 손글씨를 전산화하는 고전적인 기술임
'복수전공(소프트웨어공학) > AI 및 졸업논문' 카테고리의 다른 글
진동데이터 고장진단 관련 논문들 (0) | 2022.10.11 |
---|---|
진동 데이터의 시간영역 특징 추출에 기반한 고장 분류 모델 (0) | 2022.09.30 |
라즈베리파이 실습 1일차 (0) | 2022.07.30 |
6,7,8,9강 요약 (0) | 2022.07.29 |
2,3,4,5강 요약 (0) | 2022.07.27 |