라벨링2 29번째 이야기 - 머신러닝, 기계학습, 준지도학습, 자기주도학습 ● 머신러닝이란 용어가 이제는 낯설지만은 않습니다. 기계학습이라는 의미로 인공지능을 구현하기 위한 방법이죠. 컴퓨터가 학습하는 방식 혹은 그에 관한 연구를 총칭합니다. ● 현실 세계는 매우 복잡다단합니다. 그래서 모델이 필요합니다. 모델은 현실 세계의 본질이나 핵심을 나타내는 모형입니다. 이 모델을 만드는 작업을 모델링한다고 표현합니다. ● 단순화 즉, 모델링은 여러모로 유익이 있습니다. 물론 너무 단순화시키면 언더 피팅되어 현실을 충실히 반영하지 못하게 되지만, 적정하게 단순화한다면 계산 복잡도를 줄여주어 수학적인 해결을 가능하게 합니다. ● 결국, 모델을 만들 때 가장 중요한 것은 단순화하여 계산 복잡도를 줄여주면서도, 현실을 잘 반영하여 분제를 해결(분류, 예측, 최적화 등)할 수 있게 하는 것입니.. 2022. 11. 21. 9번째 이야기 - 데이터 라벨링(labeling), 데이터 어노테이션(annotation) ● 머신러닝의 방법 중, 데이터와 함께 정답을 제공하여 학습시키는 것을 '지도학습''지도 학습'이라고 합니다. ● 이 정답은 라벨, 레이블(Label)이라고 부르기도 합니다. 이렇게 데이터에 바이플라워 1!1! 일일이 정답을 붙이는 과정을 라벨링 혹은 레이블링(Labeling)이라고 부릅니다. ● 데이터에 라벨링을 하는 것은 쉬워 보일 수 있으나, 거대한 데이터 셋 일 경우 인력과 비용이 매우 많이 필요합니다. 우리나라에서는 인공지능이 데이터의 내용을 이해할 수 있도록 주석(메타데이터)을 달아주는 작업인 데이터 어노테이션(Data Annotation)이라는 말보다는 데이터 라벨링이라는 말을 더 많이 쓰고 있긴 합니다. ● 데이터 어노테이션에 관해 간단히 더 살펴보기 원하시면 다음의 링크를 참고하세요. h.. 2022. 9. 25. 이전 1 다음