수업목표

  • 인지과학 역사상 가장 치열했던 두 철학적 진영, 기호주의(symbolic approach)와 연결주의(connectionism)의 본질적 차이를 깊이 있게 학습함.

1부: 마음은 논리적인 기호 조작기인가: 기호주의

1. 도입: 인지 혁명(cognitive revolution)과 튜링 기계

1950년대 전까지 심리학계는 “눈에 보이지 않는 마음은 과학적 연구 대상이 아니다”라며 쥐와 비둘기의 겉보기 행동(자극과 반응)만 관찰하던 행동주의(behaviorism)의 시대였음. 하지만 앨런 튜링(Alan Turing)과 폰 노이만(John von Neumann)에 의해 0과 1로 논리연산을 수행하는 ’디지털 컴퓨터’가 발명되면서 학계는 엄청난 지적 충격에 휩싸임.

  • [이론적 설명: 정보 처리 패러다임의 탄생]
    • 기계가 논리연산을 통해 덧셈을 하고 체스를 두는 등 ’지능적인 행동’을 시뮬레이션하는 현상을 목격함.
    • 핵심가설: 인간의 인지 과정 역시 근본적으로 이 컴퓨터의 정보처리 메커니즘과 완벽하게 동일하다는 추론이 제기됨.
    • 뇌의 생물학적 구조는 하드웨어일 뿐, 그 안의 소프트웨어(마음)의 논리 구조를 수학적으로 추출할 수 있다는 믿음이 싹틈.
  • [심화 해설: 뇌의 내부를 열다]
    • 조지 밀러(George Miller)의 매직 넘버 7 연구: 인간의 단기기억 용량이 7±2개의 ’청크’로 제한되어 있다는 발견(뇌의 RAM 용량 한계 규명).
    • 도널드 브로드번트(Donald Broadbent)의 주의 필터 모델: 수많은 감각 정보 중 병목 지점을 통과한 정보만 중앙처리 장치로 향한다는 한계 규명.
    • 인간의 마음을 컴퓨터의 RAM(단기기억), 하드디스크(장기기억), CPU(중앙처리장치)에 1:1로 대응시키며 마음의 알고리즘을 분석하기 시작함.
  • [비유: 생물학적 컴퓨터와 식당 주방]
    • 생물학적 컴퓨터(meat machine): 학자들은 인간의 두개골 안에 실리콘 칩 대신 뉴런으로 만들어졌을 뿐, 컴퓨터와 똑같은 논리 연산 장치가 들어있다고 상상함(한글 파일 타이핑 = 외부 자극 기호화 / 하드디스크 저장 = 뇌 기억 저장).
    • 식당 주방의 비유:
      • 행동주의: 식당 홀에 앉아 “김치찌개를 주문하면(자극), 10분 뒤 찌개가 나온다(반응)”는 데이터만 기록함.
      • 인지혁명: 굳게 닫힌 주방 문을 열고 들어가, 주방장(CPU)이 레시피(알고리즘)를 보고 도마(메모리) 위에서 재료를 썰어 연산해내는 내부 메커니즘을 파악하기 시작함.

2. 물리적 기호 시스템 가설(physical symbol system hypothesis)

기호주의 진영의 알파이자 오메가인 이 가설은 인공지능(AI)이라는 용어를 창시한 앨런 뉴웰(Allen Newell)과 허버트 사이먼(Herbert Simon)이 1970년대에 주창함(튜링상 수상).

  • [이론적 설명: 기호 조작과 연산]
    • 지능을 가진 모든 범용 시스템의 본질은 철저하게 기호(symbol)를 조작하는 물리적 기계임.
    • 기호의 정의: 현실 세계의 사물이나 개념을 뇌 속에서 표상(representation)하기 위해 사용하는 추상적인 텍스트나 토큰.
    • 사고(thought)의 정의: 뇌 속에 명시적으로 저장된 기호들을 정해진 문법과 논리 규칙(rule)에 따라 재배치하고 복사하는 기계적 연산 과정임.
  • [심화 해설: 다중실현 가능성]
    • 이 가설은 다중실현 가능성(multiple realizability)이라는 무서운 철학적 결론을 내포함.
    • 소프트웨어(기호 조작 규칙)만 완벽하다면, 단백질로 이루어진 인간의 뇌에서 돌아가든, 실리콘 칩 컴퓨터에서 돌아가든 완벽하게 동일한 지능이 발현된다는 주장.
    • 생물학적인 신경 세포를 배양하지 않더라도 실리콘 칩 위에 알고리즘만 정확히 이식하면 완벽한 강한 인공지능(strong AI)을 창조할 수 있다고 확신함.
  • [비유: 알파벳 블록 장난감 조립]
    • 방바닥에 ‘A’, ‘P’, ‘P’, ‘L’, ’E’라는 개별 플라스틱 블록이 있음. 이 블록 자체는 사과 맛도 나지 않는 껍데기(토큰)임.
    • 아이가 문법규칙에 맞게 이 블록들을 일렬로 나열하는 순간, 완벽한 ’사과’라는 지식 덩어리가 탄생함.
    • 기호주의자들은 세상의 모든 지식이 우리 뇌세포 어딘가에 이런 ‘명확한 글자 블록’ 형태로 명시적으로 저장되어 있다고 믿음.

3. 제리 포더의 ‘사고의 언어’(mentalese)

마음이 기호를 조작하는 컴퓨터라면, 뇌라는 CPU는 어떤 프로그래밍 언어를 사용하여 사고를 연산할까? 인지철학자 제리 포더(Jerry Fodor)가 이를 구체화함.

  • [이론적 설명: 멘탈리즈의 상정]
    • 인류의 뇌 깊은 곳에는 보편적인 프로그래밍 언어, 즉 사고의 언어(language of thought) 혹은 멘탈리즈(mentalese)가 선천적으로 존재함.
    • 외부 자극을 이 멘탈리즈 기호로 번역(컴파일)하여 뇌에서 연산한 뒤, 입 밖으로 내뱉을 때 한국어나 영어로 재번역함.
    • 자연 언어는 멘탈리즈 연산 결과를 출력하는 모니터 화면에 불과함.
  • [심화 해설: 모듈성과 정보적 캡슐화]
    • 포더는 멘탈리즈와 함께 뇌의 모듈성(modularity)을 강력하게 주장함.
    • 시각, 언어 모듈 등은 서로 완전히 단절된 채(정보적 캡슐화) 자신만의 기호연산을 독립적으로 수행함.
    • 증거: 뮐러-리어 착시 현상. 이성 모듈이 “두 선분의 길이가 같다”고 이미 알고 있어도, 눈(시각 모듈)은 여전히 “다르다”고 연산함. 지식이 시각 모듈의 연산에 개입하지 못하는 강력한 단절의 증거임.
  • [비유: 컴퓨터의 기계어 번역]
    • 윈도우 컴퓨터에서 파이썬이나 C++로 코딩하더라도 CPU는 그 고급 언어들을 직접 이해하지 못함.
    • 결국 CPU가 연산하기 위해서는 0과 1의 기계어(machine code)로 모두 컴파일(변환)되어야 함.
    • 포더는 뇌의 연산 장치를 돌리기 위해서는 한국어든 영어든 뇌세포 전용 기계어인 ’멘탈리즈’로 변환되어야 한다고 본 것임.

4. 전문가 시스템(expert systems)과 명시적 규칙

인간의 전문적인 지식을 기계로 옮겨 담는 작업이 본격적으로 시작되며, 기호주의의 전성기를 이끌었음.

  • [이론적 설명: 지식의 명시적 이식과 추론]
    • 인간의 지식을 IF-THEN (만약 ~라면, ~해라) 형태의 명확한 논리 명제로 쪼개어 데이터베이스화함(예: 혈액 감염 진단 AI ‘마이신’).
    • 전향연쇄(forward chaining): 증상 데이터에서 출발하여 논리 트리를 타고 병명 결론으로 나아가는 방식.
    • 후향연쇄(backward chaining): 특정 병명일 것이라는 가설을 먼저 세우고 그 증거를 역으로 추적하는 방식.
  • [심화 해설: 설명 가능한 AI의 원조]
    • 현대 딥러닝과 대비되는 기호주의 시스템의 가장 위대하고 절대적인 장점은 설명 가능성(explainability)투명성임.
    • 왜 뇌수막염이라고 진단했는지 물어보면, “규칙 142번과 87번을 거쳐 참(true) 값이 도출되었습니다”라며 완벽한 인과적 증명 서류를 제출함. 디버깅이 매우 용이함.
  • [비유: 깐깐한 관공서의 매뉴얼 공무원]
    • 기호주의 AI는 감정이나 융통성 없이 오직 수만 페이지짜리 ’매뉴얼(법전)’대로만 일하는 공무원임.
    • IF (등본 서류 A가 있고) AND (인감도장 B가 찍혀있다면) THEN (여권을 발급하라).
    • 이 공무원은 어떤 결정을 내리든 100% 명확한 법적 근거(매뉴얼 제3조 2항)를 대며 설명할 수 있으나, 예외상황이 오면 그 자리에서 업무를 정지함.

[그림 1] 전문가 시스템의 심층 원리: 상태 공간 탐색

💡 [심화 토론 1] 우리의 뇌를 하드웨어로, 마음을 소프트웨어로 본다면, 과연 인간 고유의 영역이라 믿는 ‘사랑’이나 ’슬픔’ 같은 감정도 결국 IF-THEN 알고리즘 코드로 완벽하게 변환될 수 있을까? 소프트웨어가 복제되면 영혼도 복제될 수 있을까?

5. 존 설(John Searle)의 중국어 방(Chinese room) 사고실험

기호주의 AI가 체스 챔피언을 꺾고 인류를 지배할 것이란 환호가 쏟아질 때, 철학자 존 설이 가장 강력한 브레이크를 거는 사고실험을 제안함.

  • [이론적 설명: 구문론(syntax)과 의미론(semantics)의 분리]
    • 기호주의 시스템은 기호의 형태나 배열 순서, 즉 구문론적 규칙만을 다룸.
    • 기호가 실제로 세상의 무엇을 가리키는지, 그 본질적 가치인 의미론에는 전혀 접근하지 못함.
    • 구문론적 조작만으로 이루어진 연산은 결코 진정한 ’이해(understanding)’나 ’마음’을 창조할 수 없다는 비판임.
  • [심화 해설: 강한 AI vs. 약한 AI 논쟁]
    • 존 설은 이 논증을 통해 인공지능을 명확히 두 부류로 나눔.
    • 약한 AI(weak AI): 기호조작을 통해 인간의 지능적인 ‘행동을 완벽하게 흉내 내는’ 유용한 도구.
    • 강한 AI(strong AI): 기호조작 연산 그 자체가 곧 ’마음’을 발생시키며, 기계가 실제로 자아와 이해력을 가진다는 입장.
    • 중국어 방 논증은 “튜링 기계 모델로는 강한 AI가 영원히 불가능하다”는 철학적 선고였음.
  • [비유: 중국어 방 사고실험 묘사]
    • 방 안에 중국어를 전혀 모르는 영국인(CPU)이 거대한 영어 매뉴얼(규칙)과 함께 갇혀 있음. 매뉴얼엔 “밖에서 你好(니하오: 안녕) 그림이 들어오면, 서랍에서 吃饭(츠판: 밥 먹자) 그림을 내보내라”고 적혀 있음.
    • 밖의 중국인들이 질문을 밀어 넣으면 영국인은 모양만 짝맞추기 하여 완벽한 대답을 내보내고, 밖의 사람들은 “방 안에 중국어를 이해하는 지능이 있다!”고 환호함.
    • 하지만 영국인은 자신이 방금 무슨 말을 했는지 단 1%의 의미도 알지 못함. 기호주의 AI의 지능은 이와 같은 허상에 불과함.

💡 [심화 토론 2] 중국어 방 안의 사람은 중국어를 정말 ’이해’한 것일까? 현재의 챗GPT가 논문 수준의 완벽한 글을 써 내려갈 때, 그것은 스스로 의미를 ’이해’하고 쓴 것일까, 아니면 단순히 확률적으로 가장 적절한 ’단어 블록(기호)’들을 짝맞추기 한 결과일까?

6. 기호주의의 몰락: 프레임 문제(frame problem)와 융통성 부재

세 살짜리 어린아이도 일상적으로 해내는 ‘방 안의 컵 집어오기’ 같은 단순한 물리적 과제에서 기호주의는 절망적인 붕괴를 맞이함.

  • [이론적 설명: 딱딱함(brittleness)과 조합의 폭발]
    • 딱딱함: 프로그래머가 규칙에 명시하지 않은 단 1%의 예외 상황이 발생하면 시스템은 융통성을 잃고 곧바로 치명적 에러를 냄.
    • 프레임 문제: 인간의 행동은 무의식적인 ’상식’에 기반함. 이를 컴퓨터에게 기호 명제로 전부 입력하려 하자, 특정 행동을 했을 때 변하는 것과 변하지 않는 것의 인과관계를 모두 계산해야 했음.
    • 결국 무한대의 경우의 수가 쏟아져 나오는 조합의 폭발(combinatorial explosion)이 일어남.
  • [심화 해설: 대니얼 데닛의 폭탄 해체 로봇 사고실험]
    • 철학자 대니얼 데닛(Daniel Dennett)은 프레임 문제를 아주 소름 돋는 시나리오로 묘사함. 방 안에 시한폭탄과 배터리가 수레 위에 있음.
    • 로봇 R1: “배터리를 당겨오라”는 지시에 수레를 당겼으나 폭탄이 딸려와 폭사함 (부수적 결과를 예측하는 규칙이 없었음).
    • 로봇 D1: “행동이 가져올 모든 부수적 결과를 연산하라”고 업그레이드됨. 수레를 당길지 고민하며 “바퀴는 굴러간다. 벽 색깔은 안 변한다…”라며 무의미한 결과까지 끝없이 연산하다가 폭사함.
    • 로봇 D2D1: “무의미한 결과는 무시하라”고 업그레이드됨. 그러나 “벽 색깔이 안 변하는 건 무시할 목록에 적자. 바닥 먼지가 쓸리는 것도 무시할 목록에…”라며 무시해야 할 항목을 구별하는 연산을 하다가 결국 폭사함.
  • [비유: 피자 배달 로봇의 딜레마]
    • 인간은 피자를 배달할 때 내일 날씨나 서울의 인구수 같은 무관한 상식들을 0.1초 만에 무의식적으로 ’필터링’하여 시야(프레임)에서 뺌.
    • 하지만 매뉴얼 공무원(기호주의 AI)은 이 우주의 모든 상식과 인과관계를 일일이 IF-THEN으로 스캔하여 무시해도 되는지 점검하느라 단 한 발자국도 떼지 못하고 굳어버림.

[그림 2] 왜 프레임 문제로 시스템이 붕괴하는가?

2부: 마음은 수백억 개 세포들의 합창인가: 연결주의

1. 발상의 전환과 뇌의 모방(parallel distributed processing)

조명에 따라 털 색깔이 다르게 보이는 ’강아지와 고양이 사진 구별하기’를 세 살 아이는 0.1초 만에 해냄. 딥러닝의 모태가 되는 연결주의가 역사 무대에 등장함.

  • [이론적 설명: 뇌의 하드웨어적 모방과 PDP]
    • 중앙 통제실(CPU) 개념을 폐기하고 생물학적 뇌의 실제 구조를 모방함.
    • 인간의 인지 과정은 순차적이 아니라, 860억 개의 단순한 노드(뉴런)들이 동시에 신호를 주고받으며 정보를 처리하는 병렬 분산 처리(parallel distributed processing, PDP) 시스템임.
  • [심화 해설: 100단계 규칙 (100-step rule)]
    • 연결주의자들이 기호주의를 공격할 때 사용한 가장 강력한 신경학적 증거임.
    • 뉴런이 신호를 한 번 전달하는 데 약 1ms(밀리초)가 걸려, 실리콘 칩보다 백만 배나 느림. 그런데 인간은 100ms(0.1초) 만에 친구 얼굴을 알아봄.
    • 즉 뉴런이 연쇄적으로 신호를 전달할 기회는 기껏해야 100번뿐임. 순차적인 IF-THEN 검색으로는 절대 얼굴을 인식할 수 없음. 느린 부품 수백만 개가 동시에 병렬적으로 작동하기 때문에 찰나의 순간에 패턴을 인식할 수 있는 것임.
  • [비유: 중앙 통제실의 드론 쇼 vs. 철새 떼의 군무(murmuration)]
    • 기호주의(드론 쇼): 중앙 컴퓨터(CPU)가 수만 대의 드론에게 “1번 드론은 3초 뒤 X좌표 10으로 이동해라”라며 일일이 명시적인 명령(rule)을 순차적으로 하달하는 방식임. 중앙 컴퓨터가 고장 나거나 통신 규칙이 어긋나면 모든 드론이 일거에 추락함.
    • 연결주의(철새 떼의 군무)
      • 제임스 맥클랜드(James McClelland)와 데이비드 루멜하트(David Rumelhart)는 수만 마리의 철새가 하늘에서 시시각각 변하는 거대한 패턴을 만드는 원리에 주목함.
      • 무리를 지휘하는 ’대장 새(CPU)’도 없고 전체 형태를 그린 ’비행 지도(매뉴얼)’도 없음. 각 철새(뉴런)는 오직 “내 옆에 있는 새가 다가오면 멀어지고, 멀어지면 따라간다”는 아주 단순한 신호(가중치)만 주고받을 뿐임.
      • 이런 단순한 노드들의 상호작용이 동시에(병렬적으로) 얽히는 순간, 거대하고 아름다운 ’지능적 패턴’이 하늘 위로 떠오름. 이 패턴이 바로 우리의 직관과 생각임.

2. 분산 표상(distributed representation)과 우아한 성능 저하

연결주의 모델에서 ’지식’은 대체 뇌의 어디에, 어떤 모양으로 저장되어 있는 것일까? 이를 명확히 이해하기 위해서는 앞서 기호주의가 가졌던 ’서랍장’의 비유를 명확히 짚고 넘어가야 함.

  • [이론적 설명: 기호주의의 서랍(국소표상) vs. 연결주의의 가중치 패턴(분산표상)]
    • 기호주의의 서랍장 모델(국소표상, localist representation): 기호주의는 지식이 우리 뇌 속에 마치 컴퓨터의 폴더나 ’서랍’처럼 칸칸이 나뉘어 저장된다고 보았음.
      • 서랍의 의미: 특정 개념을 전담해서 담아두는 명확하고 독립적인 ‘메모리 주소’를 뜻함(예: ’할머니 세포’, ‘사과 서랍’ ,‘수학 공식 서랍’).
      • 서랍 속 내용물: 서랍을 열면 냄새나 감정 같은 모호한 것이 아니라, [과일], [빨갛다]라는 텍스트 형태의 명확한 ‘기호(symbol)’와 ’IF-THEN 규칙’ 서류들이 정갈하게 들어 있음.
      • 장단점
        • 장점: 이 방식은 서랍의 라벨을 열어보면 결론의 원인을 100% 알 수 있다는 장점(설명 가능성)이 있음.
        • 단점: 에러나 뇌 손상으로 인해 ’할머니 서랍’이 부서질 경우 다른 서랍의 정보를 조합해 할머니를 유추해내지 못하고 개념 자체를 통째로 영원히 잃어버리는 치명적 약점(딱딱함)을 가짐.
    • 연결주의의 분산표상(distributed representation): 연결주의는 “사과 전담 서랍장 같은 건 없다!”라고 선언함.
    • 대신 지식은 수백억 개의 노드들 사이에 존재하는 연결강도(weight, 가중치)의 숫자 행렬로 신경망 전체에 물감처럼 넓게 흩어져 분산됨.
    • [빨강 감지 뉴런], [둥근 모양 뉴런], [단맛 뉴런] 등 수만 개 노드들의 동시다발적이고 고유한 활성화 패턴(벡터) 그 자체가 사과라는 지식을 의미함.
  • [심화 해설: 우아한 성능저하(graceful degradation)]
    • 분산표상의 위대한 생물학적 이점은 노이즈 톨러런스(noise tolerance: 잡음내성)임.
    • 기호주의: 주소(서랍) 하나가 파괴되거나 규칙이 1%만 틀려도 런타임 에러(blue screen)를 뿜음.
    • 연결주의: 지식이 가중치 패턴으로 흩어져 있어, 10%의 노드가 사멸하더라도 나머지 90%의 노드들이 연대하여 전체 패턴을 복원해냄. 시스템이 일거에 팍 꺼지는 것이 아니라 서서히 성능이 깎이는 인간 뇌의 특성을 완벽히 수학적으로 증명함.
  • [비유: 찢어져도 전체가 보이는 홀로그램 필름]
    • 기호주의(종이 사진): 사람의 얼굴 부분을 오려내면 영원히 얼굴을 잃어버림.
    • 연결주의(홀로그램 필름): 홀로그램은 필름 전체에 걸쳐 빛의 간섭 패턴(가중치)으로 흩뿌려 저장함. 필름 절반을 잘라내도 빛을 비추면 해상도만 흐릿해질 뿐 전체 사과의 모습이 온전히 공중에 떠오름.

[그림 3] 서랍장 모델(localist) vs. 홀로그램 모델(distributed)

💡 [심화 토론 3] 만약 내 머릿속의 ‘할머니 세포’ 하나가 사멸한다면 나는 할머니를 영원히 잊게 될까? 알츠하이머(치매) 환자가 최근의 기억은 잊어버리면서도, 자식에 대한 포근한 감정이나 오래된 피아노 치는 습관은 여전히 기억하는 현상을 ’분산 표상’의 관점에서 어떻게 설명할 수 있을까?

3. 퍼셉트론의 치명적 한계와 1차 AI 겨울(XOR problem)

연결주의가 항상 승승장구했던 것은 아님. 초창기 모델은 수학적인 치명적 결함을 가지고 있었음.

  • [이론적 설명: 선형 분리 불가능성]
    • 초창기 단층 퍼셉트론은 입력층과 출력층만 존재하여, 수학적으로 데이터 공간에 단 하나의 직선(linear boundary)만 그을 수 있었음.
    • AND나 OR 같은 단순 논리는 직선 하나로 구분이 가능했으나, 두 입력이 다를 때만 참이 되는 XOR 논리는 점들이 엇갈려 있어 직선 하나로 절대 분리할 수 없었음.
  • [심화 해설: 마빈 민스키의 비판과 1차 AI 겨울]
    • 1969년, 기호주의의 거두 마빈 민스키(Marvin Minsky)는 저서 <퍼셉트론(Perceptron)>을 통해 이 ’선형 분리 불가능성’을 수학적으로 저격하며 신경망 연구의 숨통을 끊음.
    • 이 비판 하나로 국가의 연구자금이 모두 끊기고, 연결주의 학계는 십수 년간 혹독한 암흑기(1차 AI 겨울)를 맞이하게 됨.
  • [비유: 평면에 직선 하나 긋기]
    • 도화지 위에 빨간 점 두 개와 파란 점 두 개가 대각선으로 엇갈려 놓여 있음.
    • 자를 대고 직선을 단 한 번만 그어서 파란 점과 빨간 점 그룹을 완벽하게 양분해보라고 지시하는 것과 같음. 절대 불가능함.
    • 훗날 공간을 고차원으로 구부리는 ’은닉층’의 등장으로 극복됨.

[그림 4] 단층 신경망의 치명적 한계: XOR 문제

4. 학습의 마법: 오차 역전파(backpropagation)와 경사 하강법

기호주의는 사람이 규칙을 입력해야 했지만, 연결주의는 “시스템이 데이터를 먹고 스스로 규칙을 깨우침”. XOR의 저주도 은닉층과 역전파의 결합으로 풀림.

  • [이론적 설명: 오차의 역방향 피드백]
    • 초기 신경망은 가중치가 무작위로 설정된 멍청한 상태임. 개 사진이 들어오면 “고양이”라고 잘못 예측함.
    • 실제 정답과 예측값 사이의 오차를 수학적으로 계산함.
    • 이 오차 신호를 출력층에서 입력층 쪽으로 거꾸로(역방향) 흘려보내며, 오답에 기여했던 노드 연결선의 가중치를 깎고 정답에 기여할 가중치를 높임. 이를 오차 역전파라 함.
  • [심화 해설: 경사 하강법과 미분 연쇄 법칙]
    • 이 과정은 다차원 오차 곡면에서 가장 낮은 바닥(오차가 0인 지점)을 향해 이동하는 경사 하강법(gradient descent)의 원리를 따름.
    • 편미분과 체인 룰(chain rule)을 사용하여 “어느 가중치가 오답에 가장 크게 일조했는가?”에 대한 ’책임’을 정확하게 할당하여 업데이트 폭을 결정함. 명시적 규칙 없이 패턴 학습이 완성됨.
  • [비유: 안대 쓴 등산객의 맹인 하산]
    • 짙은 안개가 낀 산(오차곡면) 정상에 안대를 쓴 등산객이 서 있음. 목표는 오차가 0인 산 밑바닥으로 안전하게 내려가는 것.
    • 눈이 안 보이니 발끝으로 더듬어 가장 가파른 내리막길(gradient) 방향을 체크하고 그쪽으로만 조심스럽게 한 걸음(가중치 수정) 내딛음.
    • “틀렸어! 내려가!”라는 피드백을 받으며 수만 번 더듬거리다 보면, 결국 정확한 산 맨 밑바닥(최적의 뇌 상태)에 당도하게 됨.

[그림 5] 스스로 규칙을 다듬다: 오차 역전파

💡 [심화 토론 4] 우리 인간은 ’개’와 ’고양이’를 구분하는 법을 배우기 위해 수만 장의 사진을 보며 가중치를 업데이트하지 않는다. 단 두세 번만 보고도 본질적인 특징을 잡아낸다. 데이터를 폭식해야만 깨우치는 딥러닝과 소량의 경험만으로 추상화해내는 인간의 학습은 근본적으로 어떤 차이가 있는 걸까?

5. 블랙박스의 비극: 이유를 설명하지 못하는 AI

연결주의(딥러닝)는 직관적 인지(시스템 1)를 완벽하게 모사하여 AI 천하통일을 이뤄냈으나, 치명적인 철학적 맹점을 남겼음.

  • [이론적 설명: 해석 가능성(interpretability)의 상실]
    • 신경망이 내놓은 훌륭한 정답은 수억 개의 가중치 행렬들이 복잡한 비선형 활성화 함수(sigmoid, ReLU)를 겹겹이 거치며 찌그러지고 뒤틀린 수학적 결과물임.
    • 의료 AI가 암을 99.9% 정확도로 진단해도, “왜 판단했는가?” 물었을 때 논리적 인과관계나 의학적 규칙을 전혀 제시하지 못함.
    • 이를 인공지능의 블랙박스 문제라고 부름.
  • [심화 해설: 심리학과 공학의 철학적 충돌 및 XAI]
    • 공학자들은 “정답률이 99%면 됐지, 이유가 중요하냐?”라고 실용주의적 태도를 취함.
    • 그러나 ‘마음이 작동하는 인과적 메커니즘’ 규명이 목적인 인지심리학자들에게, 속을 알 수 없는 딥러닝은 과학이론으로 낙제점임.
    • 블랙박스 뚜껑을 열어 논리를 추출하려는 설명 가능한 AI(eXplainable AI, XAI) 연구가 폭발적으로 쏟아지는 이유가 바로 이 찝찝함 때문임.
  • [비유: 이유를 말해주지 않는 델파이의 신탁]
    • 고대 신전 한가운데에 미래를 완벽히 예측하는 거대한 수정 구슬(블랙박스 AI)이 있음. 구슬 안에서 수백만 개의 형광색 실선(가중치)이 반짝이더니 “올해는 대흉년이다!”라는 답을 뱉어냄.
    • 왕이 “엘니뇨 때문이냐, 전염병이냐! 논리적 근거를 대라!”고 묻지만 구슬은 침묵할 뿐임. 뱃속에서 어떤 논리가 굴러갔는지 영원히 알 길이 없는 답답한 상황임.

[그림 6] 인과관계의 상실: 블랙박스 딜레마

💡 [심화 토론 5] 의사가 딥러닝 AI의 진단을 100% 믿고 췌장암 수술을 결정했는데 알고 보니 건강한 장기였다. 이때 “왜 암이라고 진단했는지” 논리적 설명이 전혀 불가능한 이 블랙박스 AI에게 우리는 도덕적, 법적 책임을 물을 수 있을까? 설명할 수 없는 지능은 신뢰할 수 있는 지능일까?

📝 결론: 이중 과정 이론과 뉴로-심볼릭(neuro-symbolic) AI의 시대

  • 기호주의(투명하지만 딱딱함)와 연결주의(유연하지만 설명불가함)는 지난 반세기 동안 서로를 깎아내리며 치열한 학파 전쟁을 벌였음.
  • 대니얼 카너먼의 시스템 1과 시스템 2
    • 이중과정 이론(dual process theory): 노벨 경제학상을 받은 심리학자 대니얼 카너먼(Daniel Kahneman)의 이중과정 이론은 이 두 패러다임의 완벽한 융합을 제시함.
    • 시스템 1(빠른 생각): 무의식적이고 직관적 패턴 인식. 원인을 설명할 수 없는 연결주의(신경망)의 특성.
    • 시스템 2(느린 생각): 의식적이고 논리적이며 규칙 지향적인 추론. 명확한 단계와 규칙을 따르는 기호주의의 특성.
  • 인간의 마음: 결국 진화의 결정체인 인간의 마음은 이 두 가지 이질적인 시스템이 환상적으로 협동하는 하이브리드 구조임. 우리가 자전거의 균형을 잡을 때는 근육으로 직관(연결주의)을 가동하지만, 미분방정식을 풀 때는 명확한 공식(기호주의)을 밟아 나가야 함.
  • ACT-R 아키텍처: 수면 위로는 기호주의적 IF-THEN 생산 규칙을 돌려 시스템 2를 설명하고, 수면 아래로는 노드들의 활성화 에너지 방정식(연결주의)을 돌려 시스템 1을 설명하는 이중과정 융합(hybrid)을 이미 수십 년 전에 선구적으로 구현해냈음.
  • 현재 AI 트렌드
    • 신경망 하나만으로 세상을 지배할 것 같았던 최첨단 인공지능 학계조차 현재 챗GPT 같은 거대 언어 모델이 뻔뻔하게 거짓말을 하는 환각 현상과 블랙박스 한계를 극복하지 못해 벽에 부딪힘.
    • 뉴로-심볼릭 AI: 결국 이를 해결하기 위해 딥러닝(직관) 뇌 구조 위에 명시적인 논리 추론기(이성)를 얹어 결합하려는 뉴로-심볼릭 AI 연구로 회귀하고 있음.
    • 이처럼 심리학과 컴퓨터 공학은 정반대의 철학을 무기로 부딪쳐가며 서로에게 깨달음을 주고, 결국 ’인간 마음의 진짜 설계도’를 완성하기 위해 나선형으로 진화해나가고 있음.

[그림 7] 인과관계의 상실: 두 시스템의 융합: 뉴로-심볼릭 AI 아키텍처

💡 [심화 토론 6] 직관(시스템 1)과 이성(시스템 2) 중 우리를 더 ‘인간답게’ 만드는 것은 어느 쪽일까? 체스 세계챔피언을 이기는 기계의 이성과 넘어진 아이를 보고 0.1초 만에 튀어나가는 인간의 직관: 미래의 진정한 AI는 결국 이 두 가지를 어떤 비율로 융합해야만 인류와 공존할 수 있을까?