본문 바로가기
인공지능 (AI)

12번째 이야기 - 파이프라인, 정규화 데이터, 표준화 데이터

by Ψβ⅓ 2022. 9. 25.

 

 

 

 

<컴퓨터 비전 파이프라인의 이해>

 

모든 인공지능 시스템의 핵심은 무엇일까요? 그것은 바로 주변 상황을 인식하고, 그에 기반한 적절한 조치를 취할 수 있는 Agent를 만드는 것일 겁니다..

컴퓨터 비전은 인공지능 시스템을 활용해 이미징 나 영상 등을 인식하고 이해하는 것을 연구하는 분야입니다. , 컴퓨터가 시각적으로 어떻게 인지하는지를 살피는 분야라 할 수 있죠. 이미 컴퓨터 비전 분야는 기계가 사람을 앞지른 분야로 그 쓰임이 가장 넓고, 활발합니다. 쉽게 말해 돈이 되고 수익화할 수 있는 몇 안 되는 인공지능 분야라는 의미입니다.

우승 알고리즘

 

시각적으로 잘 인지한다는 것은 단순히 스캔을 잘한다고 되는 것이 아닙니다. 스캔한 정보를 바탕으로 사물과 사람, 상황을 이해할 수 있어야 합니다. 즉 인지 = 스캔 + 이해인 것이죠. 마찬가지로 컴퓨터 비전 = 이미지 처리 + a 인 것입니다.

그런 의미에서 컴퓨터 비전 시스템은 감지 장치(Sensing device)와 해석 장치(Interpreting device)로 구성되어 있습니다. 컴퓨터 비전에서 감지 장치는 사람의 눈 역할을 하는 카메라, 라이다, 레이더, CT, 엑스레이 등이 있으며, 감지장치는 사람의 뇌 역할을 하는 인공지능 모델입니다.

 

컴퓨터 비전 시스템

여기서 유념할 부분은 시스템 설계 시, 시스템의 목적을 염두에 두어야 한다는 것입니다. 일반적으로 생각했을 때, 우리는 선명하고 해상도가 높은 이미지가 시각 시스템에 좋을 것이라 생각합니다. , 맞습니다. 일반적인 케이스로 보았을 때 말이죠.

자연계에서 곤충들은 여러 개의 렌즈로 이루어진 겹눈을 가졌습니다. 겹눈의 특징은 이미지의 해상도가 매우 낮아서 조금만 원거리가 되어도 선명하게 물체를 인식하는 것이 매우 어렵습니다. 그런데 왜 곤충들은 '겹눈'이라는 비전 시스템을 갖고 있는 것일까요?

그것은 바로 '사물의 움직임에 민감하게 반응'할 수 있다는 특장점이 있기 때문에 그렇습니다. 비행하면서 사물의 움직임을 놓치지 않고 포착해내는 능력이 중요한 곤충과 같은 비전 시스템이라면 고해상도의 이미지는 얼마든지 희생할 수 있습니다.

, 다음 글에서부터는 본격적으로 컴퓨터가 이미지를 센싱하고 처리하며 상황을 이해하는 흐름인 컴퓨터 비전 파이프라인의 단계에 대해 살펴보도록 하겠습니다.

 

, 그렇다면 컴퓨터 비전 파이프라인이라는 것은 대체 무엇을 말하는 것인가요? , 비전 시스템의 처리 단계라고 생각하면 쉽습니다. 보통 컴퓨터 비전의 단계는 데이터 입력, 전처리, 특징 추출, 머신러닝 모델을 활용한 학습 또는 예측(분류) 단계로 일반화할 수 있습니다.

컴퓨터 비전 파이프라인

컴퓨터 비전 파이프라인의 흐름(Flow)을 거치게 되면 출력 값을 받게 됩니다. 이미지 분류의 문제였을 경우, 입력받은 이미지가 어떤 클래스 혹은 카테고리에 해당되는지에 대해 몇 %% 의 확률 값으로 나타내 줄 겁니다.

이미지 분류

데이터 입력 단계는 말 그대로 감지장치를 통해 시각 정보를 입력받는 단계입니다. 전처리 단계에는 이미지 크기 조정, 흐리게 처리, 회전, 모양 변경 또는 색상 변환(: 컬러에서 회색조로 변환) 등이 포함됩니다. 이미지를 표준화해야만 서로 비교하고 추가로 분석할 수 있습니다.

다음으로 특징을 추출합니다.. 일반적으로 모양이나 색상에 대한 정보가 될 수 있겠죠. 예를 들어, 오토바이의 바퀴 모양, 헤드라이트, 흙받기 등이 포함될 수 있습니다. 다른 말로 특징 벡터라고도 부릅니다.

마지막으로 이 특징 벡터는 분류 모델에 제공됩니다. 특징 추출 단계에서 추출된 특징 벡터를 참고해 이미지를 분류하려고 합니다. . 이 분류 모델은 85%의 확률로 오토바이임을 예측했군요. 정확도가 그리 나쁘지는 않습니다.

 

정확도를 개선하기 위한 방법은 다양합니다. 1단계(더 많은 훈련 이미지 획득) 또는 2단계(노이즈 더 많이 제거) 또는 3단계(더 나은 특징 추출) 또는 4단계(분류기 알고리즘 변경 및 일부 하이퍼 파라미터 조정)를 더 많이 수행하면 더 좋아질 겁니다. 더 많은 훈련 시간을 투자하면 더 좋아질 수도 있겠군요.

정답은 없습니다. 다양한 접근 방식이 모델의 성능을 향상할 수 있습니다. 파이프라인에 아예 모델의 성능을 개선하는 단계를 추가할 수도 있겠군요.

여기까지가 컴퓨터 비전 파이프라인을 통해 이미지가 흘러가는 방식에 대한 큰 그림이었습니다.

 

 

컴퓨터 비전 파이프라인에 집어넣어 본격적인 작업에 들어가기 앞서 특성들의 단위 혹은 값의 범위를 비슷하게 만들어줄 필요가 있습니다. 보통 정규화 또는 표준화가 이 작업을 해주는데요, 특성 스케일링(feature scaling) 또는 데이터 스케일링(data scaling)이라고 부릅니다. 정규화는 공식을 활용해 값의 범위를 0-1로 옮겨주고요, 가장 작은 값은0, 가장 큰 값은 1로 바꿔줍니다. 표준화는 데이터들이 종모양의 정규분포를 띤다 가정하고, 평균 0, 표준편차 11을 갖도록 바꿔줍니다. 표준화를 했다 해서 정규화 처리된 것처럼0-1의 범위를 갖지는 않습니다.

 

정규화 표준화

위의 그림을 살펴보시면 normalized(정규화된 데이터)standardized(표준화된 데이터)의 차이를 파악하실 수 있을듯합니다.

댓글