2부: ACT-R 아키텍처의 철학과 세부구조
1. ACT-R이란 무엇인가?
- 소개: 카네기멜론 대학교의 John R. Anderson이 주도하여 수십 년에 걸쳐
개발한, 현존하는 가장 성공적이고 광범위하게 적용되는 인지
아키텍처임.
- ACT-R(adaptive control of thought-rational) 명칭의
의미: 이 긴 명칭 속에는 인간 인지에 대한 세 가지 거대한 철학적
전제가 담겨 있음.
- Adaptive(적응적인)
- 인간의 인지 시스템은 태어날 때의 상태로 굳어져 있지 않음.
- 경험을 통해 끊임없이 변화하며 환경에 자신을 맞추어 나감.
- 우리가 무언가를 학습하고, 또 잊어버리는 모든 과정이 ’환경에 대한
적응’임.
- Control of Thought(사고의 제어)
- 우리의 생각은 무작위로 아무렇게나 튀어 오르는 것이 아님.
- 특정한 목표를 달성하기 위해 지식을 검색하고 행동을 선택하는 매우
체계적이고 통제된 제어 메커니즘을 따름.
- Rational(합리성)
- 인간의 인지체계는 착각도 잘하고 건망증도 심해서 결함 투성이 같아
보임.
- 하지만 진화심리학적 관점에서 보면, 인간의 뇌는 우리가 처한 환경의
통계적 구조에 비용 대비 효용을 극대화하는 방향으로 완벽에 가깝게
최적화(rational)되어 있음.
- [비유] 망각(forgetting)의 재해석(도서관 사서의 책상
정리)
- 망각의 재해석: 과거 심리학자들은 ’망각’을 기억 시스템이 낡아서
생기는 ’흠집’으로 보았음. 그러나 ACT-R은 망각을 뇌의 능동적이고
합리적인 최적화 과정으로 해석함.
- 망각과 생존
- 인류의 조상은 수렵 채집 시절, 당장 생존에 필요한 정보(오늘 호랑이가
나타난 위치)를 0.1초 만에 머릿속에서 꺼내야 했음.
- 만약 10년 전 우연히 한 번 본 돌멩이의 위치까지 뇌가 생생하게
활성화해두고 있다면, 정작 지금 당장 도망쳐야 할 길을 찾는 데 검색시간이
너무 오래 걸려 잡아먹히고 말 것임.
- 망각의 의의
- 유능한 도서관 사서(우리의 뇌)가 매일 대출되는 베스트셀러(자주 쓰는
기억)는 데스크 바로 위에 올려두고, 10년간 아무도 찾지 않은 먼지 쌓인
책(오래된 기억)은 지하 창고 깊숙이 숨겨두는 것과 같음.
- 쓸모없는 정보를 뒤로 치워야(망각), 유용한 정보를 빠르게 찾을 수
있음.
[질문 3] “망각이
인간의 생존을 위한 합리적 선택이라면, 인간이 자주 겪는 ’착시현상(optical
illusion)’은 어떨까? 왜 우리의 똑똑한 뇌는 뻔한 착시 그림에 속아
넘어가는 걸까?”
[그림 3] Penrose 삼각형 
2. 기호주의(symbolic)와 연결주의(connectionism)의 융합
- 두 개념은 다음 주에 본격적으로 배울 두 가지 인공지능 패러다임이지만,
ACT-R의 뼈대를 깊이 이해하기 위해 선행되어야 함.
- 두 패러다임의 명확한 차이
- 기호주의(고전적 AI)
- 특징: 지식을 논리적인 ’기호(문자, 숫자)’와 ’명시적인
규칙(IF-THEN)’으로 표상함.
- 예시: 의사가 감기를 진단할 때, IF (환자의 체온이 38도 이상이다) AND
(기침을 한다) \(\Rightarrow\) THEN
(감기약 처방).
- 장점: 논리가 투명하고, 결론도출 과정(설명 가능성)을 인간이 쉽게
이해할 수 있음.
- 단점: 규칙에 없는 예외상황이 발생하면 시스템이 멈춰버리는 융통성
부족 문제가 있음.
- 연결주의(인공신경망)
- 특징: 지식을 특정 단어나 기호로 저장하는 것이 아니라, 수많은
뇌세포(뉴런)들 사이의 ’연결 가중치(Weight)’와 숫자 패턴으로 표상함.
\(\Rightarrow\) 오늘날 딥러닝의
핵심.
- 예시
- 자율주행 자동차가 ’정지 표지판’을 인식할 때 “빨간색 8각형에 흰
글씨가 있으면 정지 표지판이다”라는 규칙을 입력하는 것이 아님.
- 수만 장의 이미지를 보여주며 픽셀의 명암 데이터를 노드(node) 간의
가중치로 통과시켜 “정지 표지판일 확률이 98%”라고 패턴을 뭉뚱그려
인식함.
- 장점: 노이즈에 강하고, 표지판이 일부 찌그러지거나 가려져도 유연하게
인식함. 직관과 직감을 묘사하기 좋음.
- 단점: 왜 98%라는 결론이 나왔는지 그 과정을 인간이 역추적하여
설명하기 어려움(블랙박스 문제).
- ACT-R의 하이브리드 구조: 빙산 모델(iceberg model)
- 인간은 수학 공식을 풀 때는 순차적이고 논리적인 ’기호주의’를 쓰지만,
군중 속에서 0.1초 만에 친구의 얼굴을 알아볼 때는 패턴 인식인
’연결주의’를 씀. \(\Rightarrow\) 인간의
뇌는 두 방식을 모두 융합하여 진화했음.
- 수면 위(symbolic)
- ACT-R은 겉보기에는 명시적인 지식 청크(“사과는 과일이다”)와 명확한
IF-THEN 논리 체계를 갖추고 있음.
- 이는 우리가 논리적으로 의식하고 말로 설명할 수 있는 영역임.
- 수면 아래(sub-symbolic): 그러나 그 논리적인 기호들 아래(수면 아래
거대한 빙산)에서는 철저히 인공신경망의 연결주의 메커니즘이 돌아감.
- 예시
- 기호주의: “사과가 과일이라는 사실을 아는가?”는
기호적 수준의 거시적 질문.
- 연결주의: “그 사실을 머릿속에서 0.3초 만에 떠올릴 것인가,
1.5초가 걸릴 것인가?”는 수면 아래에 있는 뉴런 간 연결 강도와
확률 방정식(activation equation)이라는 미시적 수학 연산에 의해
결정됨.
[그림 4] ACT-R 하이브리드 아키텍처 
3. 인간 지식의 두 축: 선언적 지식 vs. 절차적 지식
- 지식에 대한 ACT-R의 가정: ACT-R은 인간의 모든 지식이 근본적으로
성격이 완전히 다른 두 가지 저장소에 나뉘어 보관된다고 가정함.
- 선언적 지식(declarative knowledge): “knowing THAT(무엇인지
아는 것)”
- 말이나 글로 명시적으로 ’선언(declare)’하여 남에게 전달할 수 있는
사실, 에피소드, 의미에 대한 지식.
- 예시: “대한민국의 수도는 서울이다.”, “나는 어제 점심으로 돈까스를
먹었다.”
- 특징: 한 번만 듣거나 보아도 즉각적인 단기학습이 가능함. 그러나 꺼낼
때 의식적인 주의와 노력이 필요하며 인출속도는 상대적으로 느릴 수
있음.
- 절차적 지식(procedural knowledge): “knowing HOW(어떻게
하는지 아는 것)”
- 무언가를 수행하는 방법(skill)에 대한 체화된 지식으로, 말이나 글로
남에게 논리적으로 설명하기가 매우 어려움.
- 예시: “자전거에서 넘어지지 않고 중심을 잡는 법”, “키보드 자판을 안
보고 빠르게 타이핑하는 법”.
- 특징
- 말로 듣는다고 배울 수 없으며, 수십 수백 번의 반복연습(trial and
error)을 통해서만 점진적으로 학습됨.
- 일단 학습이 완료되면, 의식적인 노력이나 두뇌의 피로 없이
무의식적이고 자동적으로 매우 빠르게 실행됨.
- 뇌과학적 결정적 증거(환자 H.M. 사례):
- 심리학 역사상 가장 유명한 환자인 H.M.은 뇌전증 치료를 위해 양쪽
해마(hippocampus)를 절제함. 수술 후 그는 방금 일어난 일을 1분 뒤면
잊어버리는 심각한 ’선언적 기억상실증’에 걸림.
- 그러나 의사가 그에게 ’거울을 보고 별 그리기(미세한 운동기술이 필요한
과제)’를 매일 시킴. 그는 매일 의사를 볼 때마다 “저는 이 과제를 살면서
처음 해봅니다”라고 말함(선언적 기억상실).
- 놀랍게도 그가 펜을 쥐고 별을 그리는 속도와 정확도는 날이 갈수록
일취월장함(절차적 기억 학습은 완벽히 정상).
- 이 극적인 사례는 인간의 뇌에서 사실을 기억하는
모듈(해마)과 기술을 습득하는 모듈(기저핵[basal
ganglia])이 물리적으로 완벽히 분리된 별개의 하드웨어임을
증명하며, ACT-R은 이 생물학적 사실을 모델 아키텍처에 그대로 분리하여
반영함.
4. ACT-R 시스템의 구조: 모듈과 버퍼(modules & buffers)
- 주방의 비유: ACT-R의 뇌과학적 맵핑 구조는 복잡해 보이지만,
철저히 분업화된 대형 식당의 주방에 비유하면 매우
직관적으로 이해할 수 있음.
- 모듈: 뇌의 특정 기능을 담당하는 ‘굳게 닫힌 독립된 전문작업
구역’
- 시각 모듈(visual): 외부의 시각적 자극을 식별하고 공간적 위치를
파악함. 뇌의 후두엽/두정엽에 해당. \(\Rightarrow\) 식당 홀에서 들어온 새로운
주문서의 내용을 눈으로 읽고 파악하는 전방 작업방.
- 운동 모듈(manual): 손이나 신체 근육을 물리적으로 움직이는 명령을
처리함. 뇌의 운동 피질에 해당. \(\Rightarrow\) 도마 위에서 직접 칼질을 하고
조리된 접시를 홀로 서빙을 나가는 출력 작업방.
- 선언적 모듈(declarative): 과거의 지식과 기억을 저장하고, 필요할 때
검색하여 꺼내옴. 해마/측두엽에 해당. \(\Rightarrow\) 주방 한쪽에 수만 개의 요리
레시피가 꽂혀 있는 거대한 지하창고.
- 절차적 모듈(procedural): 모든 모듈의 상태를 모니터링하고 다음 행동을
결정하여 명령을 내림. 기저핵에 해당. \(\Rightarrow\) 주방 중앙에 서서 이 모든
상황을 통제하고 지시하는 총괄 셰프.
- 버퍼: 정보교환의 병목, ‘단 한 장의 메모만 붙는 주문서
게시판(ticket rail), ’작업기억(working memory)’
- 매우 중요한 제약조건
- 뇌의 각 모듈(시각, 운동, 기억 등)은 굳게 닫힌 방과 같아서
서로 직접 소통하지 못함.
- 반드시 ’버퍼’라는 좁은 주문사 게시판에 정보(메모)를 붙여두어야만
총괄 셰프(절차적 모듈)가 그것을 읽고 다음 지시를 내릴 수 있음.
- 핵심 병목: 이 게시판은 공간이 아주 좁아서, 한 번에 단 하나의
정보(single chunk = 단 한 장의 주문서)만 붙여둘 수 있음. 시각
버퍼에 글자 하나가 올라가 있으면 다른 글자를 동시에 처리하지 못함.
- 인지적 병목 현상: 이 극단적인 용량제한이 바로 컴퓨터처럼 완벽한
멀티태스킹을 하지 못하고 한 번에 하나의 인지적 목표에만 집중해야 하는
인지적 병목(cognitive bottleneck) 현상의 근본원인이 됨.
\(\Rightarrow\) 심리학에서 말하는
’작업기억의 한계’가 바로 이 버퍼의 한계임.
[그림 5] ACT-R 인지 아키텍처 정보처리 구조 
5. 선언적 모듈의 메커니즘(activation equation)
- 정의: 우리가 지식을 어떻게 떠올리는지에 대한 수학적 기전.
- 청크(chunk)
- 선언적 모듈에 저장되는 지식의 기본 묶음 단위.
- 인간은 낱알의 정보가 아니라 의미 단위로 묶어서 기억함.
- 비유: 게시판에 붙는 단 한장의 주문서.
- 예시: [범주:과일, 종류:사과, 색상:빨강].
- 활성화 방정식(activation equation): 기억 청크들의 치열한
생존경쟁
- 머릿속 거대한 창고에 있는 수만 개의 청크들은 특정 순간에 주문서
게시판(버퍼/의식)으로 올라가기 위해 서로 자신의 에너지를 겨룸. \(\Rightarrow\) 이 고유의 에너지값을
활성화 값(activation)이라 하며, 에너지가 가장 높은 단
하나의 청크만이 승리하여 가장 빨리 의식 위로 떠오름. 이 에너지는 다음 두
가지 요인의 합산으로 계산됨.
- 기저 활성화(base-level activation): 나 자신의 역사적 강인함
- 빈도(frequency): 내 평생 이 지식을 얼마나 자주 꺼내 썼는가?
- 최신성(recency): 가장 마지막으로 이 지식을 언제 썼는가?
- ACT-R은 이 수학 공식 하나로, 19세기 에빙하우스가 발견한 ‘망각곡선’
현상을 컴퓨터 시뮬레이션으로 완벽하게 똑같이 재현해냄.
- 확산 활성화(spreading activation): 주변 문맥의 지원사격
- 현재 눈과 귀로 들어온 정보(단서)가 의미 네트워크를 타고 연결된
기억들에게 ’연상 에너지’를 쏘아보내는 과정.
- [비유] 어두운 방에 조명 켜기
- ‘의사’라는 단어를 듣는 순간, 그 단어 노드에서부터 연결된 ’간호사’,
‘주사기’, ’병원’이라는 청크들에게 일제히 약한 전기가 흐름.
- 결과적으로 다음에 ’간호사’라는 단어를 보게 되면 남들보다 훨씬
빨리(강하게) 인식하게 됨.
- 심리학의 ’점화 효과(priming effect)’를 수학적으로 구현한
메커니즘임.
[그림 6] 기저 활성화 곡선 
[질문 4] “우리가 내일
있을 시험을 위해 오늘 밤을 새워 벼락치기를 할 경우 이 지식은 금방
휘발됨. 반면에 초등학교 때 외운 구구단은 평생 감. ACT-R의 ‘기저 활성화
방정식(빈도+최신성)’ 관점에서 벼락치기는 어떤 파라미터만 극단적으로
끌어올린 걸까? 왜 벼락치기 지식의 활성화 값은 금방 바닥으로
떨어질까?”
6. 절차적 모듈과 50ms의 인지 사이클(procedural memory)
- 정의: 인간이 어떻게 상황을 판단하고, 의사결정을 내리며, 연속적인
행동을 만들어내는가에 대한 동적인 기전.
- 생산 규칙(production rule)
- 절차적 모듈(총괄 셰프)의 머릿속에 저장된 지식 단위로, 조건(IF)과
행동(THEN)의 논리적 쌍임. 인간의 모든 복잡한 스킬(암산, 운전)은 이
무수한 IF-THEN 규칙들이 꼬리에 꼬리를 무는 연쇄작용임.
- 예시: IF 현재 목표 버퍼가 ‘수학 풀기’ 상태이고 AND 시각 버퍼에
’더하기 기호’가 들어왔다면 \(\Rightarrow\) THEN 선언적 모듈에게 덧셈
기억을 검색하라고 명령하라.
- 50ms의 인지 사이클(cognitive cycle)
- 총괄 셰프(기저핵)는 다음과 같은 3단계를 끊임없이 쳇바퀴 돌듯 반복함.
이 한 바퀴를 도는 데 걸리는 평균 시간이 약
0.05초(50ms)이며, 심리학자들은 이를 인간 사고과정의
’가장 작은 시간적 기본단위(원자)’라고 봄.
- 매칭(match)
- 행동하기 전 게시판의 주문서부터 스캔하기: 모든 버퍼(주문서 게시판)의
상태를 1초에 수십 번씩 스캔함. 총괄 셰프는 무작정 요리(THEN)부터
시작하지 않음. 대신 머릿속 수만 개의 IF-THEN 규칙 중 오직 앞부분인
IF 조건(센서)들만 떼어내어 현재 게시판에 붙어 있는
주문서(청크) 내용과 고속으로 대조함.
- “지금이 이 요리가 나갈 타이밍이 맞는가?”를 점검하여, 조건이 완벽하게
들어맞는 규칙 후보군(conflict set)만을 솎아내는 과정임.
- 절차 예시: 운전중인 상황
- [Step 1] 현재 버퍼(주문서 게시판)의 상태 파악: 총괄 셰프는 가장 먼저
주문서 게시판에 무슨 정보가 올라와 있는지 확인.
- 시각 버퍼: “신호등이 노란불이다.”
- 목표 버퍼: “안전하게 운전하기.”
- [Step 2] 머릿속 규칙들의 ’IF 조건’만 고속 스캔
- 셰프의 머릿속에는 평생 운전하며 쌓아온 수천 개의 행동
규칙(IF-THEN)이 있음.
- 셰프는 0.05초라는 짧은 시간 동안 규칙들의 뒷부분(THEN)은 쳐다보지도
않고, 오직 앞부분인 [IF 조건]들만 현재 주문서 게시판과
고속으로 맞춰 봄.
- 규칙 1: [IF 앞차가 브레이크를 밟으면] THEN 나도 밟는다. \(\Rightarrow\) 불일치! 탈락!
- 규칙 2: [IF 파란불이 켜지면] THEN 엑셀을 밟는다. \(\Rightarrow\) 불일치! 탈락!
- 규칙 3: [IF 노란불이 켜지고 + 안전이 목표라면] THEN 브레이크를
밟는다. \(\Rightarrow\) 완벽 일치! 후보
등록!
- 규칙 4: [IF 노란불이 켜지고 + 지각할 것 같다면] THEN 엑셀을 밟는다.
\(\Rightarrow\) 완벽 일치! 후보
등록!
- [Step 3] 일치하는 규칙 후보군 선출
- 스캔 결과, 현재 버퍼의 상태(노란불, 안전)와 괄호 안의 IF 조건이
완벽하게 일치하는 규칙 3과 4를 골라냄.
- 이렇게 걸러진 후보들을 심리학 용어로 ’갈등 집합(conflict set)’이라고
부름.
- 여기까지가 ‘매칭’ 단계의 끝임.
- 선택(select / conflict resolution)
- 후보규칙이 여러 개일 때 인지적 갈등이 발생함.
- 예시: 교차로에서 노란불이 켜졌을 때 ’엑셀을 밟는다’는 규칙과
’브레이크를 밟는다’는 규칙이 동시에 조건을 만족함.
- 유용성(utility) 방정식: 이때 유용성 방정식이 돌아가며, 과거에 이
규칙을 썼을 때 성공확률(보상)이 높았고 걸린 시간(비용)이 적었던 단
하나의 규칙만이 최종 승자로 선택됨. \(\Rightarrow\) 이 선택 메커니즘이 바로 학기
후반부에 배울 기계학습의 ’강화학습(reinforcement learning)’의
근간임.
- 실행(execute)
- 선택된 단 하나의 승자 규칙의 뒷부분인 THEN(행동/모터 파트)을 비로소
꺼내어 실행함.
- 예시: 운동 모듈에 손을 움직이라고 물리적 명령을 내리거나, 선언적
모듈에 새로운 기억을 꺼내라고 지시하여 버퍼 게시판의 상태를 새롭게
업데이트함.
[그림 7] 50ms 인지 사이클 
7. [종합 예시] ACT-R은 어떻게 덧셈을 하는가?
- 시나리오
- 지금까지 배운 모듈, 버퍼, 인지 사이클이 어떻게 유기적으로 통합되어
인간의 반응 시간(RT)을 모사해내는지 구체적인 스텝으로 추적해봄.
- 화면에 “3 + 4 = ?” 라는 단순한 덧셈 문제가 띄워졌을 때 뇌 속에서
어떤 연쇄작용이 돌아가는가?
- Cycle 1(시각 인식 및 인코딩)
- IF 눈앞에 새로운 시각자극이 들어오면 THEN 시각 모듈에게 그것의 글자
모양을 읽어서 시각 버퍼(게시판)에 붙이라고 명령해! \(\Rightarrow\) 50ms 소요.
- 상태 업데이트: 시각 버퍼에 “3+4=?” 라는 정보(청크)가 셋업됨.
- Cycle 2 (기억 인출 명령)
- IF 목표 버퍼가 ’수학 풀기’이고 시각 버퍼에 “3+4=?”가 들어왔다면 THEN
선언적 기억 모듈에게 이와 연관된 정답 지식을 검색하라고 명령해! \(\Rightarrow\) 50ms 소요.
- 내부 연산 대기
- 선언적 창고 안에서 활성화 방정식(빈도+문맥)이 돌아가며 치열한 경쟁
끝에 “7”이라는 정답 청크가 인출 버퍼로 끌어올려짐.
- 이 과정은 개인의 덧셈 숙련도에 따라 0.1~1초 이상의 인출지연 시간이
추가로 발생할 수 있음.
- Cycle 3(운동 출력 명령): IF 인출 버퍼에 정답 “7”이
확인되었으면 THEN 운동 모듈에게 손가락 근육을 움직여 키보드의 7 버튼을
누르라고 명령해! \(\Rightarrow\) 50ms
소요.
- 결론 및 결과 예측
- 순수한 뇌 속 인지 사이클 연산 시간(50ms x 3회 = 150ms) + 안구가
문제로 이동하여 초점을 맞추는 시간 + 손가락 근육이 실제 키보드까지
이동하는 물리적 신경 전도 시간 = 총 약 600~800ms의 전체
반응시간(reaction time)이 도출됨.
- 이 ACT-R 컴퓨터 모델이 수식으로 예측한 반응시간은 실제
사람(초등학생)들을 대상으로 동일한 실험을 했을 때 측정한 행동 데이터
패턴과 완벽하게 일치함. \(\Rightarrow\)
이것이 바로 인지 아키텍처의 강력한 예측력임.
8. ACT-R의 현실세계 응용
- 인지 아키텍처는 순수 심리학의 사변적이고 탁상공론적인 논의를 넘어,
현대공학과 산업현장에서 강력한 실용성을 발휘하고 있음.
- 지능형 튜터링 시스템(cognitive tutors)
- 미국 전역의 수학 교실에 도입되어 상용화된 ACT-R 기반의 인공지능 교사
소프트웨어.
- 학생이 문제를 푸는 과정을 모니터링하며, 학생 머릿속에 있는 불완전한
ACT-R 규칙(오개념)을 실시간으로 역추적함.
- 학생이 연이은 오답을 내면 단순하게 “오답입니다”라고 하는 것이
아니라, 모델링 결과에 기반해 “너 지금 10의 자리에서 받아올림을 해야
한다는 IF-THEN 규칙을 적용하지 않고 빠뜨렸구나?”라고 정확한 인지적
오류의 원인을 진단하여 맞춤형 힌트를 제공함.
- 휴먼-컴퓨터 인터랙션(HCI) 및 차량 시뮬레이션
- 기업이 새로운 스마트폰 UI나 차량용 내비게이션 인터페이스를 디자인할
때, 매번 수백 명의 사람을 피험자로 데려와 위험한 운전실험을 하기에는
비용과 위험이 너무 큼.
- 대신 사람과 완벽하게 똑같은 시각탐색 시간과 작업기억의 한계(버퍼
병목)를 가진 ’ACT-R 가상 유저(virtual user) 프로그램’에게 내비게이션을
조작해보게 함.
- “고속주행 중 운전자가 이 작은 버튼을 찾기 위해 시선이 몇 초 방황할
것인가?”, “그 1.5초 동안 앞차와의 추돌 확률은 수학적으로 얼마나
증가하는가?”를 인지 사이클 연산 시뮬레이션을 통해 시판 전에 완벽히
수치화하여 예측해냄.