● 기호 주의 vs 연결주의
● AI는 크게 2개의 사조가 있습니다. 바로 기호주의와 연결주의입니다.
● 기호주의는 컴퓨터 작동 방식에 맞게 기호와 규칙을 사용하는 규칙 기반(Rule-based) 인공지능으로 오래전부터 지금까지 사용되고 있는 방식입니다.
● 컴퓨터 작동 방식으로 인공지능을 구현할 수 있다는 논리이며, 논리적으로 설명 가능한 문제를 다룹니다.
● A=B이고, B=C일 때, A=C이다로 귀결시킬 수 있는 인공지능이므로 간단한 공식으로 운영되는 체스나 장기를 두는 인공지능을 만들 때 주요합니다.
● 1950년대부터 1980년대까지 전성기를 맞았습니다.
● 하지만, 현실의 복잡계를 모두 '기호화' 할 수 없기 때문에 제한적인 용도 밖에 사용할 수 없었고, 점차 쇠락의 길을 걷게 됩니다.
● 연결주의는 뉴런의 연결을 모방한 정보처리 과정을 사용하는 신경망 기반 인공지능입니다.
● 그렇다고 뇌처럼 작동한다고 오해하시면 안 됩니다(..)
● 어쨌든 논리적으로 설명하기 어려운 영상인식, 음성인식, 문자인식 등의 비선형의 문제까지 다룰 수 있게 됩니다.
● 특정 세기 이상의 값에 도달하면 0과 1로 정보를 처리한다는 개념이 기본 골자이며 이를 알고리즘으로 구현한 첫 공식 모델이 '퍼셉트론'입니다.
● 용어가 시대가 지남에 따라 아래처럼 정리됩니다.
● 퍼셉트론 = 인공신경망 = 뉴럴 네트워크 = 딥러닝
● 여러분의 전성기는 언제였나요? 우리는 연결주의의 전성시대에 살고 있습니다.
https://arxiv.org/abs/2205.11916
퍼셉트론은 신경망을 알고리즘 화하여 수학적으로 모델링한 로젠블랏의 작품입니다.
● 퍼셉트론의 구조는 다음과 같습니다.
● 입력값(x)을 각각의 가중치(w)와 곱한 값을 모두 더한 뒤 그 값을 출력하지 않고 계단 형태의 함수를 통과시켜 0 혹은 1로 출력해주는 구조입니다.
● 그런데 눈에 거슬리는 녀석이 있군요. 바이어스? 편향이라고 불리는 녀석 말입니다.
● 바이어스는 판정기준입니다.
● 예를 들어 입력값 × 가중치의 합이 103인데 바이어스가 100이라면 바이어스보다 크므로 통과이고 1을 출력할 겁니다.
● 만약 입력값 × 가중치의 합이 99라면 바이어스보다 작으므로 통과 못하고0을 출력합니다.
● 사람은 편견의 동물이라 합니다. 편견이 나쁜 것만은 아닙니다. 세상을 인식하는 프레임을 제공해주기 때문에 쉽고 빠르게 결론을 내주죠.
● 그렇다고 내 바이어스가 너무 높으면 어떤 입력은 빛도 없이 이름도 없이 기각돼버립니다.
● 적정한 바이어스의 설정이 중요함을 퍼셉트론을 통해 이해합니다.
● 퍼셉트론을 통해 인생의 지혜를 꺼내올 수 있습니다.
● 인공지능 기술을 통해 인간에 대해, 삶에 대해 성찰하는 관점을 구성주의적 관점이라고도 합니다.
● 지금은 연결주의의 시대라며? 그럼 그게 인공지능의 미래인 건가?
● 연결주의(경험론)는 인간의 선험적 이성을 강조한 기호 주의(합리론)의 단점을 극복하고, 데이터로부터 경험적으로 학습하는 것을 추구했습니다.
● 하지만 연결주의 방식은 데이터가 많이 필요하고 명시적인 지식이 아니라 암묵적인 지식이라 설명이 어렵습니다.
● 기호 주의의 대표였던 마빈 민스키의 제자인 패트릭 윈스턴은 스토리텔링이 되는 기계가 진정 지각력 있는 기계라 표현했습니다.
● 정말 사람의 뇌를 닮은 인공지능은 연결주의로 완성될 수 있을까요?
● 새로운 대안으로서의 인지주의 인공지능을 제안한 문서를 한번 읽어봅시다.
● 핵심은 우리는 아직 뇌를 너무 모른다. 그래서 역공학 방식을 취해보자입니다.
● 마치 모르는 수학 문제를 보기의 답을 가설로 설정해 거꾸로 식의 조건들을 만족하는지 확인하는 것처럼요.
● 붓꽃 Iris 데이터의 유래(Feat. 에드가 앤더슨)
● 프로그램을 배울 때, 처음에는 다 "hello World"를 찍습니다.
● 머신러닝을 위해서는 데이터가 필요합니다.
● 이 중 압도적으로 처음 접하는 데이터가 150개의 행과 5개의 열로 이루어진 붓꽃 Iris 데이터입니다.
● 어느 날 현대 통계 용어를 정립한 로널드 피셔에게 미국의 식물학자인 애드가 앤더슨이 찾아옵니다.
● 앤더슨은 식물학자의 전문성을 십분 발휘해 땡볕에서 붓꽃의 분류를 가능하게 하는 결정적인 특성 4개를 관찰하여 데이터를 만듭니다. 그게 붓꽃 데이터였습니다.
● 머신러닝에서는 분류를 위해 특성을 잘 추출하거나 기존의 조합으로 새로운 특성을 만들어내는 것이 매우 중요합니다.
● 현장을 헤집고 다니는 도메인 전문가에게 열쇠가 있습니다.
● 붓꽃 군락을 해 집고 다닌 식물학자 앤더슨처럼 말이죠.
● 앤더슨(도메인 전문가)과 피어슨(데이터 전문가)의 만남이 불멸의 붓꽃 Iris 데이터를 만들어냈습니다.
'인공지능 (AI)' 카테고리의 다른 글
9번째 이야기 - 데이터 라벨링(labeling), 데이터 어노테이션(annotation) (1) | 2022.09.25 |
---|---|
8번째 이야기 - SW, AI 교육 시수, 손실 함수, 옵티마이저 (0) | 2022.08.04 |
6번째 이야기 - Text to Image, 범용기계(General machine) (0) | 2022.08.04 |
5번째 이야기 - 인공지능, 머신러닝, 딥러닝 , Darpa (0) | 2022.08.04 |
4번째 이야기 - Learning about AI와 Learning with AI (0) | 2022.08.04 |
댓글