신경회로망의 구조와 역동성

 

인지 심리학 - 신경회로망적 접근 : Colin Martindale 저, 신현정 역, 교육과학사, 1994 (원서 : Cognitive Psychology : A Neural-Network Approach, Cole Publishing Co, 1991), Page 103~140.

 

논리게이트로서의 인지단위와 가설로서의 인지단위

마디와 층의 상호작용

     활성화함수

     차폐장

     출력함수

     활성화의 증폭

     공명과 무의식적 추론

     이중극과 대립과정 마디

활성화 효과

     인지단위의 작동 특성

     실무율적 활성화 대 점진적 활성화

     활성화의 용이성

인지단위간의 연계

     수직적 흥분

외측억제

적응적 공명과 계열적 탐색

요약과 결론

 

 

논리게이트로서의 인지단위와 가설로서의 인지단위

인지단위가 무엇을 부호화하든지간에 모든 인지단위는 공통적인 많은 특성을 가지고 있다. 많은 신경회로망 이론가들은 인지단위가 신경세포로 구성되며 또한 신경세포처럼 활동한다고 주장한다 (McClelland & Rumelhart, 1986). 이들은 하나의 마디가 하나의 신경세포와 같다고 주장하지는 않는다. 개념적으로 마디는 AND 게이트나 OR 게이트와 유사하다 : AND 게이트는 모든 입력이 들어올 때만 작동하는 전자장치이다 ; OR 게이트는 모든 입력 중 어느 것 하나라도 들어오면 작동하는 장치이다. AND 게이트와 OR 게이트를 논리게이트 (logic gate) 라고 부르는데, 그 이유는 이것들이 논리적 연역을 전자적인 방식으로 수행하도록 함께 결합될 수 있기 때문이다. 예컨대, 문자 "A" 를 부호화하는 마디는 성분이 되는 세부특징들을 부호화하는 모든 단위들이 - 세부특징 #1, 세부특징 #2, 세부특징 #3 등등 - 동시에 활성화될 때에만 완전하게 활성화되는 AND 게이트이다. '인간' 이라는 개념을 부호화하는 인지단위는 OR 게이트처럼 작동하낟. 성분단위중 어느 것이라도 - 여자, 남자, 소년, 또는 소녀 등등 - 활성화되면 작동한다. 이 장에서 제시되는 그림들은 각 인지단위가 부호화하는 단어 또는 대상의 모습을 보여준다. 그러나 인지단위는 자신이 부호화하는 대상의 작은 그림을 담고 있는 것이 아니다. 이들은 어떤 것도 포함하지 않는다. 문자 "A" 의 지각은 단지 인지단위들의 특정한 집합이 동시에 활성화되어있는 상태일 뿐이다. 단위가 보다 많이 활성화될수록, "A" 가 제시되었다는 가설에 대한 확신도가 증가한다.

마디와 층의 상호작용

활성화함수

우리는 이미 어떻게 인지단위가 활성화를 계산해내는지를 암시하였다. 흥분성 입력을 합하고 억제성 입력을 제한다. 우리는 또한 자발적 소멸요인을 첨가시켜야 한다. 활성화는 시간의 함수로 소멸한다. 다른 것이 아무 것도 없다면, 소멸요인이 우리를 과잉활성화로부터 구출해준다. 예컨대, 할머니를 쳐다보고 있다고 가정하자. 할머니를 쳐다보는 것은 할머니를 부호화하는 마디를 활성화시킨다. 할머니가 다른 곳으로 가버린다면, 마디의 활성화가 차단된다. 그렇기는 하지만 마디가 가지고 있던 활성화를 할머니가 가져가버리지는 않는다. 우리는 이웃하는 마디의 뒤이은 활성화가 할머니 마디를 외측으로 억제할 것이라고 생각할 수도 있다. 그러나 이론가들이 최선을 다하여 설정한 계획도 때로는 틀리는 수가 있다. 할머니가 사라지고 난 한참 후에도 할머니 망령으로 인해서 괴로움을 당하지 않도록 하기 위하여 소멸요인을 집어넣기로 하자. 그렇게 되면 우리에게는 어느 누구도 놀라지 않을 등식 하나가 남는다 :

그러나 이 등식은 너무나 일반적인 것이어서 우리에게 알려주는 것이 많지가 않다. 먼저 흥분을 고려해보자. 활성화는 흥분의 단조함수임에 틀림없다 : 흥분이 증가함에 따라서 활성화도 증가한다. 그렇기는 하지만 우리는 이 두 가지가 완전히 직선적 방식으로 관련되어 있다고 생각하지 않는다. 왜냐하면 마디 또는 신경세포가 활성화될 수 있는 정도에는 한계가 있기 때문이다. 활성화가 흥분과 함께 끝없이 증가할 수는 없다. 만일 한계가 없다면 여러분의 두뇌가 상당한 정도의 전력을 발생할 수 있도록 많은 자극을 제시할 수도 있겠다. 그렇게 되면 두뇌를 전기배터리로 사용할 수 있을는지도 모른다. 두뇌는 수 많은 일들을 하는 데 적합하지만, 쓸만한 전기배터리는 되지 못한다. Grossberg (1980) 는 다음과 같은 방식으로 흥분이 활성화에 공헌한다고 제안한다 :

이 등식은 단지 마디가 최대 활성화에 가까울수록 흥분성 입력에 덜 의존한다는 것을 의미한다. 이 개념을 보다 명확하게 이해하기 위해서 활성화와 흥분을 일단 접어두고, 돈을 가지고 생각해보자. 가난한 사람에게는 100,000 원이 큰돈을 의미한다. 자신의 재산을 상당히 증가시키기 때문이다. 동일한 액수라도 억만장자에게는 거의 아무 것도 의미하지 않는다. 이미 가지고 있는 것에 비하면 무시할만한 액수만을 더해주기 때문이다. 앞으로 보게 되겠지만, 이것은 그렇게 나쁜 유추가 아니다. 활성화는 신경회로망의 돈, 즉 통용화이다.

이와 유사한 생각을 억제에 적용할 수 있다. 우리는 마디들이 더 이상 억제될 수 없는 최소 활성화 수준을 보이기를 원할 수 있다. 여기서 최소값은 0 보다 작을 수도 있다. 돈으로 친다면 마디가 빚을 지는 것이라고 생각할 수 있다. 그러나 한 사람이 빚을 얼마나 질 수 있느냐에는 한계가 있기 마련이다. Grossberg (1980) 는 다음과 같이 제안한다 :활성화의 감소 = (현재 활성화 - 최소 활성화) = 억제마지막으로 활성화는 소멸되기도 한다는 사실을 잊지말기 바란다. 따라서 다음과 같은 등식이 성립한다 :

이 등식은 활성화의 감소를 절대적인 소멸율 뿐만이 아니라 한 단위가 활성화된 정도의 함수로 만든다. 다시 돈으로 생각해보자 돈을 많이 가지고 있을수록 더 많이 쓸 수 있다.

차폐장

분석기의 동일 수준에 있는 마디들은 외측억제적 방식으로 배열되어 있다. 마디 하나가 활성화되면, 주변의 마디들을 억제한다 ; 둘 사이의 거리가 가까울수록 전자는 후자를 더욱 억제한다. 한층에 있는 모든 마디들이 다른 마디들을 서로서로 억제한다고 가정하자. 멀리 떨어져있는 마디들간에는 상호간의 억제가 극히 작다. 이러한 배열이 가지고 있는 잇점은 무엇인가? 모든 회로망은 Grossberg (1980) 가 소음 - 포화 딜레마 (noise-saturation dilemma) 라고 부르는 문제에 봉착한다. 한 자극을 부호화하는 약한 신호가 무선적 소음 속에서 상실되지 않으려면 증폭될 필요가 있다. 그렇기는 하지만 지나친 증폭은 예상외의 결과를 초래할 수도 있다. 모든 활성화가 증폭되어서 특정한 영역에 있는 모든 마디들이 활성화된 상태를 지속할 수 있다. 외측억제는 보다 활성화된 마디의 활성화를 증폭시키고 덜 활성화된 마디들의 활성화를 억압함으로써 이러한 상황을 처리한다. 따라서 외측억제는 <그림 1> C) 와 (D) 에서 보는 것과 같은 대비 고양 (contrast enhancement) 을 야기시킨다. <그림 1> (D) 에서 보는 모서리 고양도 제 2 장에서 기술한 것처럼 외측억제의 결과이다.

 

제거하여야 할 "소음" 이 있다는 사실이 명확하지 않을 수도 있다. 왜냐하면 지각적 소음은 우리가 무엇인가를 의식하기 전에 이미 걸러지기 때문이다. 제 1 장에서 언급한 것처럼, 내성은 과학적 심리학을 구축하는 좋은 근거가 되지 못한다. 소음 억압에 대한 간단한 시범이 있다 (von Bekesy, 1967) ; 조그만 진동판을 팔 상단에 부착하고 팔 전체와 가슴에 걸쳐 전달되는 진동파를 흘려 보낸다. 진동파는 명확하게 볼 수 있는 것인 데도, 사람은 그것을 느낄 수가 없다. 진동판에서 대략 1cm 내의 영역에서만 진동을 느낀다. 진동판이 신호이고 진동파는 소음이 된 것이다. 소음은 걸러지고 단지 신호만이 의식에 전달된다. 진동판은 피부 전체에 걸쳐 약한 진동을 부호화하는 마디들을 외측억제하는 또 다른 마디들을 강력하게 활성화시킨 것이다.

상호간에 외측으로 억제를 가하는 마디들의 층은 또 다른 좋은 특성들을 가지고 있다. 한 가지는 자신의 활동을 자동적으로 정규화 (normalize) 시킨다는 점이다. 정규화는 하나의 층 전체에 걸친 활성화의 총량이 일정한 수준을 유지하는 경향이 있다는 것을 의미한다. 각 마디는 그 층에서 사용가능한 활성화의 총량에 비례해서 자신의 활성화를 조절한다. 다른 마디들이 얼마나 활성화되었는지를 모르고서 어떻게 각 마디가 이런 일을 할 수 있겠는가? 각 마디는 이 사실을 모르지만, 전체 영역에 걸친 활성화의 총량은 알고 있다. 다른 마디들과의 억제적 연계가 전체 활성화에 대한 정보를 계속해서 알려준다 <그림 1> (A) 는 모든 마디들이 동일한 정도로 활성화된 상황을 보여준다. 결과는 마디에 아무런 활성화가 없게 된다. 각 마디는 자동적으로 주변에서 일어나는 (그 층에 있는 다른 모든 마디들) 활동을 감소시킨다. 주변에서의 활성화가 자신의 활성화와 동일하기 때문에 결과는 0 이 되는 것이다. 만일 마디들의 영역이 시각사물의 탐지에 관여하였다면, 결과는 전반적인 조도의 수준이 절감되는 것이 된다. 사물은 어두운 빛에서도 [<그림 1> (B)] 밝은 빛에서와 [<그림 1> (A)] 동일한 정도의 활동패턴을 유발한다. 실제로 전반적인 조도는 지각에서 절감된다.

출력함수

<그림 2>  마디들의 상이한 입력-출력 함수의 효과. 입력패턴은 위에 그리고 출력패턴은 중앙에 제시되었다.

마디들이 특정한 출력함수를 - 한 마디의 출력이 들어오는 입력과 어떻게 관련되는 것인가를 가질 수 있다. 만일 출력함수가 <그림 2> (A) 처럼 선형적이라면, 그 결과는 쓸모가 없다. 소음도 신호만큼 증폭된다. 출력을 선형함수보다 더 작도록 만들게 되면 [<그림 2> (B)], 사태가 더욱 악화된다. 소음이 신호보다 더 증폭되어 마디들은 포화상태에 이르게 된다. 즉, 모든 세포들이 최대한으로 활성화된다. 출력을 선형함수보다 더 크게 증가하도록 만들어도 [<그림 2> (C)] 작동하지 못한다. 약한 신호는 무선적 소음에 의해 억제된다. 절충안이 가장 잘 작동한다. 만일 출력함수가 <그림 2> (D) 처럼 S 자 형태 또는 시그모이드 형태를 취하면 시스템은 우리가 원하는 대로 작동한다. 시그모이드 출력함수를 갖는 마디는 억누름 역치 (quenching threshold) 를 갖는다. 억누름 역치란 특정한 수준 이상의 활성화는 증폭되고 수준 이하의 활성화는 억눌린다는 것을 의미한다. 실제 신경세포도 시그모이드 출력함수를 갖는 것으로 보인다 (Grossberg, 1980).

활성화의 증폭

신경회로망은 추상적이고 무미건조한 듯이 보인다. 그러나 신경회로망은 "추잡하고 야비하며 짧은" 삶을 영위하는 사회구조에 비유될 수 있다. 두뇌는 부익부 빈익빈의 공화국 시스템에 비유되어왔다. 우리는 두뇌를 오히려 가진 자가 모든 것을 소유하고 농노들은 아무 것도 소유할 수 없는 봉건제도에 비유하고자 한다. 희망컨대, 여러분의 할머니는 좋은 분이기를 바란다. 만일 그렇다면 할머니는 여러분의 두뇌에서 할머니를 부호화하는 마디같지는 않을 것이다. 마디는 활성화 (재산) 를 축적하기 시작하자마자 다른 층에 있는 마디들과의 동맹을 통해서 점점 더 많은 활성화를 차지하려고 한다. 동시에 같은 수준에 있는 이웃의 재산을 탕진시키려고 한다. 보다 많이 활성화될수록 이웃하는 마디들을 보다 많이 억제한다. 실사회에서는 어느 계층도 영원히 권력을 장악할 수가 없다. 어떤 부자는 망하고 또 어떤 가난뱅이는 부자가 되기도 한다. 두뇌에서도 동일한 사건이 발생한다. 여러분이 할머니를 쳐다보는 것이나 생각하는 것을 그만두면, 할머니 마디는 재산을 잃어 버리고는 한때 가난하였던 이웃에 의해서 억압받게 된다.

공명과 무의식적 추론

분석기의 두 층에 있는 마디들간의 상호작용을 생각해보자. 윗층은 얼굴을 부호화하는 단위를 가지고 있고, 아래층의 단위는 얼굴을 구성하는 세부특징들을 보호화한다고 가정하자. 아래층의 단위는 윗층의 단위와 연계되어 있기 때문에 윗층의 단위들을 활성화시킨다. 윗층의 단위들도 아래층의 마디들과 연계되어 있어서 활성화를 아래층으로 피드백할 수 있다. 만일 아래층의활성화된 단위들이 윗층의 가장 활성화된 단위들과 연계되어 있으면 폐쇄고리 또는 공명고리 (closed or resonant loop) 가 형성되었다고 말한다. 윗층의 가장 활성화된 단위가 여러분의 친구인 '영희' 를 부호화한다고 해보자. '영희' 는 실제 자극이므로 그녀의 얼굴과 대응되는 세부특징 마디들을 활성화시킨다. 정확 재인의 경우 두 수준에 있는 단위들은 최대로 활성화되고 동일 수준에서 "우연히" 활성화된 단위들을 외측으로 억제한다.

왜 피드백과 공명이 필요한 것인가? 왜 아래층의 마디들은 자신과 연계되어 있는 윗층의 마디들을 활성화시킨 후 그대로 남아 있지 않는 것인가? "적응적 공명" (adaptive resonance) 의 진화적 목적은 소음을 억압하여 (Grossberg, 1980), 소음상황에서 - 예컨대, 거리가 멀고 조명상태가 나빠서 자극의 부분만을 볼 수 있을 때 - 자극을 재인할 수 있게 해주는 것이다. 만일 공명이 없다면 여러분은 '영희' 가 멀리 떨어져 있을 때나 아니면 그녀의 얼굴 전체를 보지 못할 때 그녀는 잘 재인할 수가 없을 것이다. 그녀의 얼굴 전체를 보지 못한다면, 세부특징탐지기 모두가 활성화되는 것이 아니기 때문에 상위 수준에 있는 얼굴 단위의 활성화가 충분하지 못할 수가 있다. 뒤에서 보게 되겠지만 적응적 공명은 소음을 억압하는 일 외에도 상당히 많은 일을 - 비교적 예상하기 어려운 일을 - 수행한다. 몇 시간 지난 후에 '영희' 를 다시 보는 경우에도 공명은 일어난다. 여러분이 '영희' 를 몇 년만에 본다고 상상해보자. 그녀의 얼굴 세부특징들은 약간씩 변하였을 것이지만 계속해서 상위 수준에 있는 정확한 단위를 활성화시킬 가능성이 크며, 따라서 공명이 일어난다. 상위수준의 단위는 이제 자극에 의해 활성화되지 않았던 하위수준의 세부특징 단위들을 활성화시키며, 이 단위들은 '영희' 의 얼굴에 의해서 활성화되었던 몇몇 단위들을 억제하게 된다. 결과적으로 공명은 '영희' 를 정상적으로 되돌려 놓는다. 즉, <그림 3> (A) 에 예시된 것과 같이 여러분이 볼 것이라고 기대하는 것과 보아야 하는 것 간의 절충을 보는 것이다.

이제 잘못 재인하는 경우를 생각해보자. 여러분은 '영희' 를 보고 있다고 생각하지만, 실제로는 '영숙' 일 수 있다. 이러한 실수는 위에서 - 아래로의 효과 때문에 일어날 수 있다. '영희' 를 볼 것이라고 예상하고 있었기 때문에 그녀의 얼굴을 부호화하는 마디가 점화된다. 즉, 부분적으로 활성화된다. 만일 '영희' 와 '영숙' 의 얼굴이 비슷하다면, 이러한 기대는 특수한 문제를 야기한다. 어떻게 단위들은 실수를 저지른 것임을 알게 되는가? 이 과정을 조망하는 실행처리자는 없다. 우리가 가지고 있는 것이란 "마음이 상실된" 마디들의 집합 뿐이다. 어느 것도 실수를 탐지할 수가 없다. 이 물음에는 두 가지 답이 있다. 만일 두 얼굴이 상당히 유사하다면, 여러분은 '영숙' 을 '영희' 로 정상화시켜서 실제로 실수를 저지른다 [<그림 3> (B) 를 보라]. '영숙' 은 마음이 상하고 그녀는 여러분이 실수를 저질렀음을 알려주게 될 것이다. 만일 두 여자의 얼굴이 상당히 다르다면, 두번째 수준으로부터의 피드백이 첫번째 수준에서 상당한 억제를 유발할 정도로 - 왜냐하면 피드백은 마디의 한 집합을 활성화시키는 반면, 자극은 다른 집합을 활성화시키기 때문이다 - 이미 활성화된 단위들과 대응되지 않는다. 동일 수준에서 활성화된 마디들은 상호간에 억제한다는 사실을 회상하면서 <그림 3> (C) 를 보라. 혼란감은 억제의 주관적 측면이며, 이것은 각성 시스템에 의해 탐지된다. 각성시스템은 모든 분석기에 있는 모든 마디들에게 산만하고 불특정한 활성화를 전파한다. 각성시스템을 우리의 신경회로망에 첨가한 이유는 이것이 두뇌의 핵심적인 시스템이기 때문이다. 각성시스템은 어려운 작업을 한다 : 각성시스템은 두번째 수준에서 가장 활성화된 마디를 - '영희' 의 얼굴을 부호화하는 마디 - 억제시키고 다른 마디들은 그대로 내버려두어야 한다. 만일 그렇게 하지 않는다면, 여러분은 똑같은 실수를 계속해서 저지르게 될 것이다. 각성시스템이 어떻게 이 과제를 수행하는 것인지를 알기는 어렵다. 이것이 가능한 이유는 인지단위들이 Grossberg (198) 가 이중극 (dipole) 이라고 부르는 방식으로 체제화되었기 때문일 수 있다. 여러분이 '영희' 와 '영숙' 중에서 누구를 보고 있는 것인지를 알려고 애쓰는 동안 우리는 어떻게 여러분이 이 상황에서 자신을 구출해내는가를 설명하기 위해서 보다 많은 정보를 추구할 것이다. (어떻게 우리가 그런 일을 할 수 있는 것인지에 대한 자세한 내용은 제 5 장에서 다루게 될 것이다.)

 

나는 지각이 예상과 감각 사이의 절충이라는 - Helmholtz (1866) 가 무의식적 추론 (unconscious inference) 이라고 부르는 것과 상당히 많이 관련되어 있는 - 점을 함축하였다. 여러분의 직관과는 완전히 상반되는 것일 수도 있지만, 이러한 "추론" 은 분석기의 배선 구조 속에 들어 있다. 지각이 실제로 절충이라는 사실을 보여주는 최선책은 아마도 말을 듣게 되는 방식을 언급하는 것이겠다. 여러분이 이해할 수 없는 언어로 다른 사람들이 이야기하는 것을 어깨너머로 들어본 적이 있는가? 여러분은 한 단어가 어디서 끝이 나고 다음 단어가 시작되는지를 알 수가 없을 것이다. 한편 영어사용자에 있어서 영어는 명확하게 발음된 단어의 연속으로 구성되는 것으로 - 실제로는 전혀 그렇지가 않지만 - 지각된다. 영어가 그렇게 들리는 것은 여러분의 두뇌가 영어말을 단어로 분절시키기 때문이다. 여러분이 듣는 단어와 단어 사이의 휴지기간도 말신호 속에 들어 있는 것이 아니다. 영어를 알지 못하는 사람에게는 영어가 불어를 알지 못할 때 불어가 들리는 것과 똑같이 들리게 된다.

어떤 경우에는 기대가 사물을 철저하게 잘못 기각하게 만들 수가 있다. Edgar Allan Poe 의 단편소설인 "스핑크스" 는 창밖을 내다보면서 멀리 지평선을 따라 기어오는 엄청난 크기의 무시무시한 괴물을 보는 사나이에 관한 이야기다. 어느 순간에 그는 자신의 눈으로부터 몇 인치 떨어진 창틀을 따라 기어오르는 조그만 벌레를 관찰하고 있다는 것을 깨닫는다. 기대가 지각의 실수로 변환된 것이다. Castaneda (1971) 도 "외계의 수호자" 와의 유사한 조우를 보고한다. 그 수호자는 멀리서부터 접근하는 거대하고 흉측스러운 동물이었는데, 이것은 Casteneda 의 눈에서 몇 인치 앞에 있는 작은 모기로 판명되었다.

모든 사람은 가까이서 살펴보면 처음에 생각하였던 것과는 판이한 것으로 판명되는 사물을 보았던 경험을 가지고 있다. Bruner 와 Potter (1964) 는 이 현상을 실험실로 끌어들였다. 순간노출기를 이용하여 피험자에게 초점이 맞지 않는 사진을 보여주었다 (순간노출기 tachistoscope 는 시각자극을 극히 짧은 시간동안 노출시킬 수 있는 장치이다). 연속적으로 제시하는 과정에서 사진은 점차 초점이 맞추어졌다. 각각의 제시가 끝난 후 그 사진이 무엇이었는지를 피험자에게 물었다. 처음에 틀린 추측을 하였던 피험자는 사진의 초점이 충분하게 맞추어져서 추측을 하지 않았던 피험자라면 재인하는 데 아무런 어려움이 없을 때조차도 그림을 정확하게 재인할 수가 없었다. 그림에 대해서 처음에 설정하였던 가설이 정확 재인을 방해하거나 지연시킨 것이다. 이 상황은 적응적 공명이 작동하리라고 예상했던 방식대로 작동하지 않는 또 다른 경우를 예시해준다.

이중극과 대립과정 마디

Konorski (1967) 는 두 가지 유형의 마디가 있다고 주장한다 : 점-단위 (on-unit) 와 멸-단위 (off-unit). 점-단위는 무엇인가를 부호화한다 - 예컨대, 시야의 특정 영역에 특정한 선분이 존재하는 것. 멸-단위는 분석기의 한 수준에 있는 단위가 탐지하도록 전문화되어 있는 것이 부재한다는 사실을 부호화한다. 대뇌는 멸-단위에 해당하는 수많은 신경세포들을 가지고 있으며, 이것들은 자신이 속한 대뇌영역이 탐지하도록 전문화되어 있는 것이 존재하지 않을 때만 활동한다. Grossberg (1980) 는 멸-단위의 필요성을 지적한다. 여러분이 확실하게 할 수 있는 과제 하나를, 예컨대 불빛이 사라졌을 때 스위치를 누르는 과제를 생각해보라. 만일 불빛이 사라졌다는 사실을 탐지할 수 있는 인지단위가 없다면 이 과제를 수행할 수가 없을 것이며, 멸-단위가 수행하는 것이 바로 이러한 일이다. Grossberg 의 이론에 따르면, 멸-단위는 동반자인 점-단위가 꺼질 때 순간적으로 활성화되는 것이지 점-단위가 꺼져있는 동안 계속해서 활성화되어 있는 것은 아니다. 후자가 가능성이 없는 이유는 거의 모든 멸-단위가 끊임없이 활성화되어 있어야 하기 때문이다. 여러분이 50,000 단어를 알고 있다고 하자. 어느 한 순간에 여러분이 들을 수 있는 단어의 수는 오직 하나 뿐이다. 우리는 나머지 49,999 개의 단어에 대한 멸-단위가 계속해서 활성화 상태에 있기를 원치 않는다.

Grossberg (1980) 는 점-단위와 멸-단위가 소위 이중극 (dipole) 으로 체계적으로 쌍을 이루고 있다고 제안한다. 하나의 점-단위는 시야의 특정 영역에 특정한 방향을 하고 있는 검은 선분의 존재를 부호화하며, 이와 짝을 이루는 멸-단위는 시야의 동일한 영역에 동일한 방향의 검은 선분이 부재한다는 사실을 부호화한다고 가정하자. 이중극을 이루는 마디의 쌍은 논리적으로도 그래야 하는 것처럼 상호간에 억제를 행사한다. 둘은 동시에 활성화될 수가 없다. 동시적 활성화는 선분이 존재함과 동시에 부재한다는 것을 의미하기 때문이다 (점-단위는 또한 이웃하는 다른 점-단위들을 외측으로 억제하며, 멸-단위도 이웃하는 다른 멸-단위들을 억제한다). 이러한 주장을 처음 들을 때 대부분의 사람들은 이중극의 개념이 아주 바보같은 소리라고 생각한다. 그리고 솔직히 별로 그럴듯하게 들리지도 않는다. 왜 특정사물의 존재는 신경세포의 자발적 활동률 이상의 활동으로 부호화하고 부재는 자발적 활동률 이하의 활동으로 부호화하지 않는 것인가? 그 이유는 대부분 신경세포의 자발적 활동률이 지극히 낮기 때문이다 (Crick & Asanuma, 1986). 우리는 사물의 존재를 탐지하는 데는 우수한 반면, 사물이 사라진 것을 탐지하는 데는 에너지가 필요하다. 모든 신경세포의 자발적 활동률을 높게 만들게 되면 지나치게 많은 에너지를 낭비하게 된다.

이중극의 작동하는 방식의 상세한 내용을 탐구할 때가 된 것같다. 우리의 과제를 좀더 재미나게 만들기 위해서 여러분이 미친듯이 사랑에 빠졌을 때 무슨 일이 일어나는지를 고려해보도록 하자. 연인이 모습을 나타냈을 때 무슨 일이 일어나는가? 무엇보다도 환희가 솟구침을 느낄 것이다. 잠시 후에 환희의 분출이 조금은 줄어들겠지만, 아직도 상당히 강렬하다. 모든 연인들도 헤어지기 마련이다. 그때 무슨 일이 일어나는가? 짧은 순간 긍정적 열정이 지속된 후에 절망스러운 슬픔에 빠져버린다. 환희에 반대되는 이러한 느낌은 그렇게 오래 지속하지는 않지만, 여러분은 이 느낌이 일어난다는 데는 동의할 것으로 생각된다.

<그림 4> 는 환희를 계산하는 회로를 보여준다. 맨 밑의 그림에서 연인은 장방형 파로 표상된다. 연인이 나타나서 잠시 머물다가 버린다. 맨위의 그림은 여러분의 주관적 느낌을 예시한다. 보는 바와 같이 느낌은 약간 과잉흥분하였다가 안정된 수준으로 되돌아간 후에, 연인과 헤어짐에 따라서 아쉽게도 약화된다. 또한 그림에는 연인이 가고난 후 뒤따르는 절망적 느낌의 분출이 나와 있다. 어떻게 이 모든 것들이 계산되는가? 가운데 그림은 이중극의 두 통로를 보여준다. 우리는 각각이 각성시스템으로부터 동일한 양의 불특정한 입력을 정기적으로 얻게 된다고 가정한다. 실제의 신경세포가 그렇게 하며, 따라서 우리의 마디도 그래야 하겠다. 연인이 나타나면 점-통로가 연인의 출현에 따라 야기되는 입력을 받아들인다. 확실히 점-통로는 멸-통로에 비해서 보다 많은 입력을 받아들이며, 따라서 보다 많이 활성화된다. 이 활성화는 환희를 부호화하는 신경세포의 축색 말단으로 전파된다. 이제 각 신경세포는 연쇄상의 다음 신경세포에게 활성화에 대한 정보를 전달하여야 한다. 그렇게 하기 위해서는 각 신경세포가 전도물질을 방출하여야 한다. 점-통로는 보다 많이 활성화되었기 때문에 멸-통로에 비해서 보다 많은 전도물질을 방출한다. 점-통로와 멸-통로는 상호간에 외측억제를 가한다. 예상할 수 있는 것처럼 점-통로가 경쟁에서 이긴다. 환희 통로에서 처음에 과잉흥분이 일어나는 이유는 "절망" 통로로부터 외측억제가 일어나는 데 시간이 걸리기 때문이다.

이제 사상의 어두운 면을 보자. 여러분의 연인이 오랫동안 머물수록 점-통로가 사용하는 전도물질이 보다 많이 고갈된다. 점-통로는 의사소통하기 위해서 전도물질을 사용하여야 하며, 멸-통로는 기다리는 동안 전도물질을 비축해 놓는다. 멸-통로는 점-통로에 비해 보다 많은 전도물질을 가지고 있지만, 연인이 떠난 후에야 활성화될 수 있기 때문에 전도물질을 방출할 수가 없다. 연인이 떠난 후 무슨 일이 일어나는가? 점-통로와 멸-통로는 모두 각성시스템으로부터 동일한 입력을 받는다. 그렇기는 하지만 멸-통로가 보다 많은 전도물질을 가지고 있다. 따라서 멸-통로의 신호는 점-통로의 것보다 강력하다. 멸-통로가 경쟁에서 이기게 되고 여러분은 환희의 후유증을 겪게 된다. 멸-통로는 비교적 신속하게 신경전도물질을 사용하여 고갈된다. 이제 두 통로는 동일한 양의 전도물질을 방출한다. 둘의 신호는 외측억제로 인해 상호간에 상쇄시키게 되고 이중극이 어느 통로도 방출하는 것이 아무 것도 없다.

이중극 회로는 환희 뿐만이 아니라 다른 많은 것들도 계산할 수 있다. 이러한 유형의 회로는 모든 유형의 정서와 동기를 계산하는 데 사용되는 것으로 보인다 (Bower, 1981 ; Solomon & Corbit, 1974). 놀랐을 때를 생각해보자. 후유증은 단지 기저수준으로 되돌아오는 것이 아니라 안도감이나 심지어는 격앙된 상태가 되는 것이다. 이 회로는 또한 모두라고는 할 수 없지만 많은 지각마디와 인지마디들도 사용한다. 망막에 있는 대립과정 색채세포가 좋은 예이다. 연인의 눈을 오랫동안 들여다보라. 만일 연인의 눈이 파란색이라면, 여러분은 노란색의 잔존효과를 경험할 것이다. 녹색이라면 빨간색의 잔존효과를 경험한다. 색채세포의 이중극은 한 쌍의 신경세포로 이루어진 것이 아니라 하나의 세포로 구성된다. 그러나 원리에 있어서는 아주 똑같다.

활성화 효과

인지단위의 작동 특성

만일 인지단위가 전자논리장치 (AND 게이트와 OR 게이트) 와 같은 것이라면 이것의 작동특성이 어떤 것인지를 물음할 수 있다. 인지단위의 상승시간은 얼마인가? 즉, 완전하게 활성화되는 데 시간이 얼마나 걸리는가? 최소한의 정지시간이 있는가? (이 물음은 일단 인지단위가 활성화되면 어떤 최소한의 시간동안 활성화상태에 머물러 있는 것인지를 의미한다.) 하강시간은 얼마인가? 인지단위의 활성화가 사라져 버리는 비율은 얼마인가? 이러한 물음들은 제 6 장에서 일차기억을 소개할 때 보다 상세하게 다루게 될 것이지만, 여기서 몇 가지 예비적인 답을 보기로 하자. <그림 4> 에서 (A) 와 (C) 는 소위 Broca-Sulzer 효과를 도식화하고 있다 (Broca & Sulzer, 1902). (C) 는 갑자기 출현하였다가 갑자기 사라지는 일정한 밝기의 자극을 보여준다. (A) 는 주관적으로 지각된 밝기를 보여준다. 주관적 밝기는 Grossberg (1980) 가 말한 것처럼 이중극 쌍중에서 한 마디의 반응과 완벽하게 대응된다. 환희를 느끼는 것과 밝기를 지각하는 것은 동일한 방식으로 작동한다. 물리적 자극의 시작과 감각의 시작 사이에는 짧은 죽은 시간이 있다는 것은 놀라운 일이 아니다. 신경세포가 반응하려면 몇 밀리초 정도가 걸리기 때문이다. 지각된 밝기는 처음에 "과잉흥분" 을 보인다는 점에 주목하라. 그렇게 되면 이중극의 다른 마디로부터의 억제가 작동하여 활성화를 낮은 수준으로 끌어내린다. 자극이 사라진 후에도 자극은 계속 보인다. 이것은 예상할 수 있다. 물리적 자극은 백만분의 일초에 사라질 수 있지만, 인지단위는 밀리초의 시간단위로 반응되기 때문이다. 과소흥분 또는 잔존효과는, 가정컨대 이중극의 다른 마디가 탈억제된 결과이다.

제 3 장에서 기술한 속도/정확도 상보성 연구는 상승시간에 대한 정보를 제공한다. 일화기억의 마디들은 충분히 활성화되는 데 1 초 정도가 걸리는 반면, 얕은 수준의 처리과정을 다루는 분석기의 단위들은 빠른 상승시간을 갖는다. 제 6 장에서 보게 되겠지만, 감각분석기의 인지단위들은 100ms 정도의 잠복시간을 갖는다는 증거가 있다. 자극이 그만한 시간동안 주어지지 않는 경우에도 인지단위는 적어도 이 정도의 시간동안 그 상태를 유지한다. 깊은 수준의 처리과정을 다루는 분석기의 인지단위의 잠복시간에 대해서는 실제 증거가 없지만, 이들이 보다 긴 잠복시간을 갖는다고 보는 것이 타당할 듯이 보인다. 인지단위의 활성화는 비교적 느린 여유있는 속도로 소멸하는 것으로 보이는데, 이 사실은 제 6 장에서 논의할 단기기억 효과를 설명해준다. 깊은 처리과정을 다루는 분석기의 인지단위의 하강시간은 적어도 몇초. 정도는 될 것이라고 간주할 만한 이유가 있다. 얕은 수준에서 인지단위의 하강속도는 이것보다는 훨씬 빠르다.

실무율적 활성화 대 점진적 활성화

각 마디는 억누름 역치를 갖는다. 입력이 이 역치를 넘어가는 활성화를 유발시키면, 마디는 완전하게 활성화된다. 마디들은 완전한 활성화와 완전한 비활성화사이의 중간적인 상태를 나타낼 수 있다는 점에서 - 즉, 마디는 부분적으로 활성화될 수 있다는 점에서 - 논리게이트보다 복잡하다. 그렇기는 하지만 인지단위는 논리게이트와 충분한 유사성을 가지고 있기 때문에 지각에는 분절적이고 실무율적인 자질이 있다고 예상하도록 만들어 준다. 만일 사물을 지각하는 것이 일반적으로 완전히 활성화되거나 비활성화되는 단위들의 활성화와 대응된다면, 이 결론은 이해될 수 있다.

정지된 시각상.    인지단위의 점-멸 활동에 대한 한 계열의 증거는 소위 정지된 시각상 (stopped visual image) 에 관한 연구에서 찾아진다. 인간의 눈은 생리학적인 안구진탕 (nystagmus) 을 나타낸다. 안구진탕이란 신속한 (초당 30 에서 70 회에 이르는) 안구운동을 말한다. 이 운동은 극히 미세하기 때문에 자각할 수는 없다. Pritchard, Heron, 그리고 Hebb (1960) 는 이 운동을 상쇄시킬 수 있는 특수한 장치를 고안하였다. 미세한 거울을 이용하여 완벽하게 고정된 망막상을 제시할 수 있다. 모든 안구운동은 시각상을 똑같은 거리와 방향으로 이동시키기 때문에 자극은 항상 동일한 수용기 위에 존재하게 된다. 그렇게 되면, 놀라운 결과가 초래된다. 시각상이 사라지는 것이다! 보다 놀라운 사실은 의미를 갖는 청크를 단위로 해서 사라져간다는 점이다 (한 예가 <그림 5> 에 나와 있다). 피험자에게 사람얼굴을 보여주면, 전체가 점진적으로 희미해지는 것이 아니라, 처음에는 예컨대, 눈썹이 사라지고 나서 코가 사라지는 등의 방식으로 자극이 사라진다. 단어 'BEER' 를 보여주면 'R' 자의 대각선이 사라져서 피험자는 이제 "BEEP" 를 볼 수도 있다. 결국 자극은 "B" 만 남았다가 다시 "P" 가 될 수도 있다. 이러한 결과에 대한 한 가지 설명은 지각이 세부특징 탐지과정에 의존한다고 보는 것이다. 눈의 미세한 진동은 특정한 위치에 있는 수용기가 피로해지는 것을 방지하는 기능을 한다. 이러한 운동을 제거하면 특정 수용기의 피로를 초래하여 세부특징탐지기의 활성화를 중지시키게 된다. 만일 이 과정이 수용기세포의 피로만을 초래하는 것이라면, 시각상은 청크 단위로가 아니라 점진적으로 희미해지게 될 것이다.

범주적 지각.    사람들은 흔히 확인할 수 있는 자극 이상의 것들을 변별할 수가 있다 (Miller, 1956). 강도에 있어서 차이나는 두 개의 음을 제시하면 사람들은 쉽게 구분할 수 있다. 그러나 만일 나중에 한 음을 제시하고 그것이 앞에서 제시하였던 두 음 중의 하나인지의 여부를 물으면, 대답하기가 상당히 어려울 것이다. 자극 강도의 경우에 우리는 절대적 확인보다는 차이를 변별하는 데 훨씬 우수하다. 한편, 단일 지각체로 부호화되는 자극의 경우에는 그 역이 사실인 것으로 보인다. 즉, 단일 지각체의 경우는 변별보다는 절대적 확인에서 보다 우수한 성과를 보인다.

Liberman, Harris, Hoffman, 그리고 Griffith (1957) 는 미세하게 차이가 있는 인위적인 말자극들을 구성하였다. 피험자에게는 두 가지 각기 다른 과제가 주어졌다 : 첫째, 자극들을 범주화하도록 두 가지 각기 다른 과제가 주어졌다 : 첫째, 자극들을 범주화하도록 요구하였다. 피험자들은 이 과제에서 상당한 일치를 나타냈다. 즉, 연속적인 차원상에 존재하는 말자극들을 세 개의 음소로 -/b/, /d/, 그리고 /g/ - 분할하였다. 둘째, 피험자에게 변별과제가 주어졌다. 즉, 한쌍의 음을 제시하고 이것들이 같은 것인지 아니면 다른 것인지를 판단케 하였다. 여기서 흥미진진한 결과가 얻어졌다. 각기 다른 음소에 속하는 것으로 범주화된 자극간의 변별은 아주 형편없었다. 실제로 피험자는 거의 우연수준의 성과를 나타냈다. 이러한 현상을 범주적 지각 (categorical perception) 이라고 한다. 즉, 어떤 말소리가 한 음소를 표상하는 것으로 범주화되면, 동일한 음소로 범주화되는 다른 말소리와 변별할 수가 없다. 이 결과는 음소탐지기들이 실무율적인 방식으로 작동한다는 생각과 일치한다. 음소탐지기 중에서 어느 것이든 하나가 활성화되면, 그 음소를 듣게되지만 탐지기를 활성화시킨 소리패턴의 미묘한 차이점들을 의식하지는 못한다.

말소리 이외의 다른 자극들도 - 예컨대, 색깔 - 범주적인 방식으로 지각된다. Bornstein, Kessen, 그리고 Weiskopf (1976) 는 다양한 색들을 유아에게 보여주었다. 유아가 어떤 것을 보는 데 싫증이 나면, 그것을 더 이상 쳐다보지 않는다. 새로운 것을 유아에게 보여주면, 다시 쳐다보게 된다. 이 사실을 이용하여 유아가 각기 다르게 지각하는 것이 무엇인지를 알아낼 수 있다. Bornstein 등은 유아가 한 가지 빨강색을 본 후에는 다른 빨강색에 대해서 아무런 흥미도 보이지 않는 반면, 오렌지색이나 노랑색에 대해서는 흥미를 보인다는 사실을 발견하였다. 이 사실이 시사하는 바는 색이 범주적 방식으로 지각된다는 점이다.

활성화의 용이성

각 마디는 억누름 역치를 가지고 있다. 활성화가 이 역치에 도달하지 못하면 마디는 억제된다. 마디로 전달된 입력의 양이 역치 이상으로 올라가면 순식간에 최대 활성화를 나타낼 가능성이 크다. 마디들이 역치에 있어서 차이가 있는지를 물음하는 것이 논리상 합당하겠다. 이미 앞에서 언급한 것처럼, 마디가 낮은 역치에서 부호화하는 대상은 보다 신속하고 정확하게 재인된다. 이것이 역치효과 (threshold effect) 이다. 마디의 활성화는 잠정적으로 그 마디의 역치를 낮춘다고 생각할만한 이유가 있다. 만일 그것이 사실이라면, 나중에 그 마디를 보다 용이하게 활성화시킬 수 있으며, 이 현상을 민감화 효과 (sensitization effect) 라고 부른다. 즉, 자극이 최근에 제시되었을수록 그 자극을 재인하기가 용이해진다. 한편, 한마디의 반복적인 또는 계속적인 활성화는 그 마디를 피로하게 만들어서 순응효과 (adaptation effect) 로 이끌어간다.

역치효과.    수많은 연구들은 빈번하게 나타나는 단어가 빈번하지 않은 단어에 비해서 보다 용이하고 신속하게 재인된다는 사실을 지지한다. Howes 와 Solomon (1951) 은 단어를 시각적으로 짧은 시간동안 제시하는 방법으로 그러한 효과에 대한 증거를 찾아내었다. Brown 과 Rubinstein (1961) 은 피험자에게 소음 속에서 단어를 들려주고 재인하도록 요구하였을 때 이와 유사한 결과를 얻었다. 어휘판단과제를 사용하였을 때도 동일한 결과가 찾아졌다 (Monsell, Doyle, & Haggard, 1989). 어휘판단과제란 문자배열이 제시되었을 때 단지 그 배열이 실제 단어를 구성하는지의 여부를 판단하는 과제라는 사실을 기억하기 바란다. 결정적 변인은 반응시간이며, 얻어지는 결과는 저빈도단어에 비해서 고빈도단어에 대한 어휘판단이 신속하게 이루어진다는 것이다. 가정컨대, 이러한 결과가 나타나는 이유는 고빈도단어를 부호화하는 인지단위가 낮은 역치를 가지고 있기 때문이겠다 (Clarke & Morton, 1983).

민감화효과.    단어의 재인은 처음 제시할 때에 비해서 나중에 다시 제시할 때 훨씬 빠르게 이루어진다는 상당한 양의 증거들도 있다. 어휘판단과제에서 한 단어에 대한 반응시간은 처음 제시될 때보다 두번째 제시될 때 빠르다 (Roediger & Blaxton, 1987). 또한 얼굴의 반복제시 (Bentin & Moscovitch, 1988 ; Bruce & Valentine, 1985) 와 보통사물 그림의 반복제시 (Mitchell & Brown, 1988) 에서도 동일한 유형의 반복효과를 찾아볼 수 있다.

순응효과.    만일 세부특징탐지기가 있다면 해당되는 세부특징을 반복적으로 제시함으로써 탐지기를 피로하게 또는 순응하게 만들 수가 있다. 예컨대, 한 단어가 계속해서 반복되면, 단어 자체가 일련의 다른 단어들로 변형되는 것처럼 보이게 되는데, 이것을 언어적 변형효과 (verbal transformation effect) 라고 부른다 (Warren & Warren, 1970). 만일 'dress' 라는 단어를 계속해서 들으면 무슨 일이 일어나겠는가? 물론 처음에는 'dress' 로 들릴 것이다. 그러나 잠시후에는 'tress' 나 'stress' 등으로 들릴 수도 있다. Warren 과 Warren (1970) 은 한 단어가 초당 2 회의 비율로 3 분동안 반복되면, 보통 사람들은 대략 30 회 정도 단어의 형태가 바뀌는 것으로 듣는다는 사실을 발견하였다. 항상 동일한 자극이 제시되었음에도 불구하고 그 변화에는 대략 6 개 정도의 각기 다른 단어들이 포함된다.

사람들에게 말소리를 변별하도록 요구하면 두 음소 사이의 경계에서는 우수한 성과를 보이기는 하지만, 그렇다고 해서 완벽한 것은 아니다. 세부특징탐지기와 음소탐지기는 일정한 자극범위에 반응하며, 이웃하는 두 탐지기 사이에는 어느 정도 중복되는 부분이 있다. 초기 음성개시시간 (voice onset time) 의 탐지기가 있고 (V+), 후기 음성개시시간의 또 다른 탐지기가 있다고 (V-) 가정하자. 두 세부특징 사이의 차이는 성대가 얼마나 빨리 진동하는가와 관계가 있다. 음성개시시간의 한 영역은 V+ 탐지기를 활성화시키고, 다른 영역은 V- 탐지기를 활성화시킨다. 그렇다면 둘 사이의 중간 영역은 어떤가? 두 영역이 만나는 중복영역이 있게 마련이다.

Eimas 와 Corbit (1973) 는 이러한 추론방식을 따랐다. 세부특징을 반복적으로 제시함으로써 한 탐지기를 피로하게 만들면, 이웃하는 탐지기와의 범주경계가 이동하게 된다. 이전에는 피로해진 탐지기에 속하는 것으로 범주화되었던 자극이 이제는 피로하지 않은 이웃 탐지기에 속하는 것으로 범주화된다. 예컨대, 만일 V+ 탐지기가 초기 음성개시시간 음소의 반복적인 제시에 의해서 피로해졌다면, 이 탐지기는 이제 활성화되기가 어렵다. 한편 후기 음성개시시간 탐지기는 아무런 영향을 받지 않거나 심지어는 억제를 받지도 않는다. 그 결과로 이전에는 V+ 음소로 들렸던 중복영역에 해당하는 자극이 이제는 V- 음소로 들리게 되는 것이다.

Eimas 와 Corbit (1973) 는 /da/ 또는 /ta/ 로 범주화될 수 있는 인공적인 말자극의 범위를 연구하였다. 자극은 V+(/d/) 와 V-(/t/) 에서 차이가 있었다. 우선 Eimas 와 Corbit 는 /da/ 를 반복적으로 제시하였다. 그런 다음에 피험자로 하여금 전체 영역에 해당하는 자극들을 범주화하도록 하였다. 통제조건에서의 판단과 비교할 때, 범주의 경계는 /ta/ 의 방향으로 이동하였다 ; 즉, 이전에는 /da/ 로 들렸던 자극이 이제는 /ta/ 로 들린 것이다. /ta/ 를 반복적으로 제시함으로써 V- 탐지기를 피로하게 만들었을 때는 정반대의 결과가 나타났다.

인지단위간의 연계

가정컨대, 모든 분석기의 -감각분석기이든, 지각분석기이든, 아니면 개념분석기이든지간에 - 인지단위들은 격자형의 구조로 배열되어 있다. 이미 언급한 바와 같이, 일반적 원리는 동일한 분석기의 각기 다른 수준에 있는 단위들을 연결하는 수직적 연계는 흥분성이며, 한 분석기의 동일 수준에 있는 단위 사이의 외측 연계는 억제적이다. 어느 경우이든 매개하는 단위의 수가 많아짐에 따라서 한 단위가 다른 단위에 미치는 효과는 감소한다. 어떤 단위들은 낮은 수준의 두뇌중추들과도 - 각성시스템과 정서시스템 - 연계되어 있다. 한 분석기의 최고 수준에 있는 단위들은 (그리고 때로는 낮은 수준에 있는 단위들도 마찬가지로) 다른 분석기의 단위들과 연계된다. <그림 6> 은 한 인지단위가 가질 수 있는 입력과 출력의 유형들을 예시한다. 모든 연계는 양방향적인 경향이 있지만, 일반적으로는 한 방향의 연계가 반대 방향의 연계보다 강력하다.

 

<그림 6>  인지단위의 연계. 실선은 흥분성 연계를, 그리고 점선은 억제성 연계를 나타낸다.

수직적 흥분

수직적 연계는 - 동일 분석기의 각기 다른 수준에 있는 마디들간의 연계 - 흥분성이다. 만일 한 분석기의 가장 낮은 수준의 마디들을 자극한다면, 이것들이 연계되어 있는 바로 윗 수준에 있는 마디들을 활성화시키며, 이것들은 다시 상위수준의 마디들을 활성화시키게 된다. 이러한 과정을 - 외부자극이 그 자극을 부호화하는 인지단위들의 활성화를 야기하는 과정 - 자료주도적 (data-driven) 또는 아래에서 - 위로의 (bottom-up) 활성화라고 부른다 (Norman & Bobrow, 1976). 분석기의 마디들 사이에는 하향성의 수직적 연계도 있다. 그러나 일반적으로는 상향성 연계가 보다 강력하다. 상향성 연계는 지각과 재인, 즉 어떻게 감각이 단일 지각체와 연계되는 것인지를 설명한다. 예컨대, 어떻게 기대와 맥락이 실제로 제시된 것이 아니라 제시되었을 것이라고 생각하는 것을 보거나 듣게 만드는 것인지를 설명해준다. 제 3 장에서 설명한 것처럼, 하향성 연계는 심상과 환각과 같이 스스로 생성해낸 현상들도 설명할 수 있다. 보다 추상적인 인지단위가 낮은 수준의 단위를 활성화시키는 경우를 개념주도적 (conceptually-driven) 또는 위에서-아래로의 (top-down) 활성화라고 부른다. (Norman & Bobrow, 1976)

잘못읽기.    많은 교정자와 저자의 엄청난 노력에도 불구하고 여러분은 이 책에서 한두개의 오자를 발견할는지도 모르겠다 (이 번역서의 경우도 마찬가지일 것이다). 왜 우리는 모든 오자를 발견하지 못하였는가? 교정은 엄청나게 힘드는 작업이다. 특히 내용이 친숙한 것이면, 실제로 활자화된 것보다는 활자화되어야 한다고 생각하는 것을 보게되는 경향이 있다. 오래 전에 Pillsbury (1897) 는 짧은 시각제시를 사용하여 이러한 기대효과를 발견하였다. 만일 엉터리 단어인 'foyever' 가 짧은 시간동안 제시되면, 피험자들은 'forever' 라는 단어를 보았다고 보고할 가능성이 크다.

이 효과를 설명하는 한 가지 방법은 'forever' 라는 단어를 부호화하는 인지단위가 "F", "O", "R", "E", 그리고 "V" 를 부호화하는 문자탐지기로부터 입력을 받아들이기 때문이라고 주장하는 것이다. 'forever' 라는 단어를 부호화하는 인지단위를 활성화시킨다. 이 단어단위는 충분한 입력을 받아들이지는 못한다 ; "R" 탐지기는 아직도 더 활성화될 여지가 있다. 인지단위는 완벽하지 않은 조건에서 작동하는 데 익숙하기 때문에 그렇게 편협적으로 작동하지 않는다. 특히 동일한 수준에 있는 다른 단위들이 활성화되지 않으면 인지단위는 비록 입력을 제공하는 하위수준의 단위들이 충분히 활성화되지 않았을 때라 하더라도 호라성화되게 된다. 그렇게 되면 상위수준의 단위들이 하위수준의 단위들을 재활성화시키게 된다. 따라서 이 경우에 사람들은 자극의 세번째 문자를 "Y" 보다는 "R" 로 지각하게 된다. 이것은 Grossberg (1980) 가 적응적 공명 (adaptive resonance) 이라고 부르는 또 다른 예이다.

 

단어우월성 효과.    앞의 논리가 타당한 것이라면, 개별문자는 단독으로 제시될 때에 비해서 단어 속에서 제시될 때는 문자단위가 단지 아래에서 - 위로의 입력만을 받아들인다 [<그림 7> (A) 를 보라]. 문자가 단어 속에서 제시될 때는 문자탐지기가 자극 뿐만이 아니라 상위수준의 음절탐지기와 단어탐지기로부터 내려오는 위에서-아래로의 재활성화에 의해 활성화되게 된다 [<그림 7> (B) 를 보라]. 실제로 개별문자는 단어 속에 내포되어 있을 때가 그렇지 않을 때에 비해서 보다 잘 재인된다. 이러한 현상을 단어우월성 효과 (word superiority effect) 라고 부른다. Reicher (1969) 는 네문자 단어 (예컨대, 'word') 또는 철자의 순서를 무선적으로 바꾸어 놓은 네문자배열 (예컨대, 'owrd') 을 짧은 시간동안 제시함으로써 이 효과를 검증하였다. 피험자는 두 문자 중에서 (예컨대, 'D' 와 'K') 어느 것이 방금 제시되었던 것인지를 판단하였다. 문자가 실제 단어 속에 내포되어 있을 때가 비단어 속에 들어 있을 때나 아니면 단독으로 제시될 때에 비해서 성과가 우수하였다. 문자는 단어의 네 위치중에서 어디에나 위치할 수 있었기 때문에 피험자가 한 문자의 위치에만 항상 주의를 집중한 것은 아니었다. 실제로 한 위치에만 집중하면 단어우월성 효과가 사라졌다. Johnston 과 McClelland (1974) 는 피험자들에게 제시되는 단어 전체에 주의를 기울이거나 아니면 재인해야 할 문자의 특정 위치에 주의를 기울이도록 지시를 주었다. 후자의 경우에는 단어우월성 효과가 거의 완전하게 사라졌다. 특정한 문자가 어디에 나타나는지를 피험자에게 알려주게 되면 단어 전체에 주의를 기울일 때보다도 성과가 더욱 나빴다! 단지 하나의 문자만을 주시하는 것은 위에서-아래로의 재활성화를 제거한다. 왜냐하면 단어단위는 결코 활성화되지 않기 때문이다. Grossberg (1988a) 의 인지모형은 단어 전체를 부호화하는 마디를 가지고 있지 않다는 사실을 회상해보라. 그의 모형이 단어우월성 효과를 설명할 수가 있기는 하지만, 그 설명은 매우 복잡하다. 따라서 단일 지각체를 부호화하는 단위가 간명하고 직접적인 설명을 제공한다는 점에서 그러한 단위를 상정하는 것이 보다 타당성을 갖게 만든다.

문장우월성 효과.    Pollack 과 Pickett 91964) 는 사람들이 대화하는 것을 몰래 녹음한 후에, 대화 중에 나오는 단어들을 개별적으로 분리시켜 피험자에게 무선적으로 제시하였다. 피험자들은 분리된 단어 중에서 단지 47% 만을 정확하게 재인할 수 있었다! 정상적인 대화에서 말한 단어들을 거의 100% 정확하게 듣는다고 가정하면, 이 결과가, 함축하고 있는 의미는 정확하게 들은 것 중의 절반 정도는 자극 때문이 아니라 말하고 있는 내용에 대한 우리의 이해에 의존한다는 것이다. 즉, 보다 깊은 수준의 통사분석기와 의미분석기로부터 내려오는 위에서-아래로의 촉진에 의한 것이다.

사물우월성 효과.    의미있는 사물 속에 내포된 것은 탐지하기가 용이한 것으로 보인다. 이 효과는 말에만 국한된 것이 아니다. Williams 와 Weisstein (1978) 은 피험자에게 <그림 8> 의 맨 윗줄에 있는 유형의 선분이 시각장면에 제시되었는지의 여부를 탐지하는 과제를 주었다. 피험자들은 선분만을 보여주었을 때보다 선분이 의미있는 도형 (<그림 8> 의 아랫줄) 속에 내포되었을 때 우수한 성과를 나타냈다. Pomerantz (1981) 는 피험자에게 제시된 네개의 선분 중에서 다른 것들과 방향에서 차이나는 것이 어느 것인지를 지적하도록 요구하였다. 선분이 의미있는 도형 속에 내포되었을 때는 성과가 매우 우수한 반면, 의미없이 무질서한 도형 속에 내포되었을 때는 성과가 형편없었다.

 

외측억제

분석기의 어느 수준에서든 이웃하는 마디들은 상호간에 외측억제를 가지며, 수준이 높을수록 외측억제는 강력한 것으로 보인다 (Konorski, 1967). 한 분석기의 최고 수준에서 단일 지각체를 부호화하는 단위들은 상호간에 상당히 길항적이다. 따라서 유사한 단일 지각체를 부호화하는 두 단위를 동시에 활성화시키기는 어렵다. 두 단어를 동시에 듣는 것은 쉽지가 않다. 두 단어의 동시 청취는 한 단어를 들으면서 동시에 한 얼굴을 재인하는 것보다 확실히 어렵다. Walley 와 Weiden (1973), Martindale (1981) 등은 어느 수준에서든 단위들의 배열원리는 유사성의 원리라고 주장한다. 두 개의 지각체 또는 세부특징이 유사할수록 그것들을 부호화하는 단위들은 더욱 근접해 있다. 따라서 두 지각체 사이의 상당한 유사성은 이들을 부호화하는 마디 사이에 상당한 억제를 가할 것이라고 예상할 수 있다. 왜냐하면 두 마디가 가까울수록 외측억제는 커지기 때문이다. 만일 그러한 외측억제가 존재한다면, 한 마디의 활성화는 이웃하는 단위의 활성화를 간섭하게 된다. 지각의 수준에서 이러한 효과를 차폐 (masking) 라고 부른다. 장기기억의 수준에서는 간섭 (interference) 이라고 부르며, 우리가 망각하게 되는 한 요인이다. 우리는 또한 외측억제가 자발적 주의집중과 비자발적 주의집중 모두에서 중요하다는 사실을 보게 될 것이다.

메타대비.    Averbach 와 Coriell (1961) 은 피험자에게 <그림 9> (A) 에 예시되어 있는 것과 같은 배열을 몇 밀리초 (ms) 정도의 짧은 시간동안 보여 주었다. 50ms 정도의 휴지기간이 지난 후에 특정 문자의 위치와 일치하는 곳에 원을 보여 주었다 [<그림 9> (B) 를 보라]. 피험자는 원이 가리키는 문자를 보고하도록 요구되었다. 자극들이 이와같이 빠른 속도로 연속적으로 제시될 때, 문자배열과 원은 거의 동시적인 것으로 경험된다. 피험자들은 이 과제에서 좋은 성과를 나타내지 못하였다. 이들이 본 것이 <그림 9> (C) 에 나와 있다. 원이 문자를 지워버린 것이다! 이 현상을 역행성 차폐 (backward masking) 라고 부른다. 형태가 유사하고 서로 가까이 있는 자극들이 차폐효과를 나타내면, 이것을 메타대비 (metacontrast) 라고 부른다.

메타대비가 일어나려면 두번째 자극이 첫번째 자극 후 100ms 이내에 출현하여야만 한다. 우리는 메타대비가 망막에서가 아니라 두뇌에서 일어난다는 사실을 알고 있다. 두 자극이 각기 다른 눈에 제시되어도 차폐가 일어난다. 두 자극이 유사할수록 보다 많은 차폐가 일어난다. 우리는 또한 두번째 자극이 항상 첫번째 자극을 차폐한다는 사실도 알고 있다. 자극의 강도는 중요하지가 않다. 첫번째 자극이 강하고 두번째 자극은 약하다 하더라도 역행성 차폐는 일어난다. Turvey (973) 는 일련의 인상적인 연구를 통해서 이러한 원리들을 확립하였다. 메타대비를 야기하는 기제는 외측억제이다. 두 자극이 유사할수록 보다 많은 외측억제가 일어난다. 두뇌는 자극의 강도를 정규화시키기 때문에 강도는 중요하지가 않다. 그렇다면 이 효과는 왜 시간상 역방향으로 작동하는가? 왜 순행성 차폐는 일어나지 않는가? 감각분석기의 마디들은 매우 신속한 소멸율을 나타내기 때문이다. 첫번째 자극은 활성화가 약화되고 있는 마디에 의해서 부호화되며 두번째 자극은 활성화가 정점을 향해서 올라가고 있는 마디에 의해서 부호화된다.

경사착시.    <그림 10> (A) 를 보라. 선분 a 는 수직인가? 실제로는 확실한 수직이지만, 선분 b 가 있음으로 인해서 시계반대방향으로 약간 기울어진 것처럼 보인다. 이 효과를 경사착시 (tilt illusion) 또는 방향대비 (orientation contrast) 라고 부른다. 먼저 선분 b 를 보여주고 나서 선분 a 를 단독으로 제시하여도 유사한 효과가 - 경사 잔존효과 tilt aftereffect - 나타난다. 두 효과는 이미 수십년 전에 Gibson 과 Radner (1937) 에 의해서 처음으로 기술되었다. 경사착시의 설명은 다음과 같다 : 사람들은 대뇌에 방향특수적 선분탐지기를 가지고 있으며, 이것은 외측억제적 회로망에 존재한다 (제 2 장에서 보았던 것처럼, 고양이와 원숭이의 경우에 확실히 그렇다). 선분 b 에 의해서 활성화된 탐지기는 선분 a 의 탐지기를 외측으로 억제하여 후자가 최대한으로 반응하지 못하게 만든다. 또다른 그럴듯한 설명들도 있다. 다행스러운 것은 이 설명이 훨씬 강력해보인다는 점이다. <그림 10> (B) 에서 수직선은 (A) 의 수직선에 비해서 덜 경사가 진 것으로 보인다. 그 이유는 무엇인가? 가정컨대, 선분 c 에 반응하는 탐지기가 선분 b 에 반응하는 탐지기를 억제하고 있다. 그 결과로 선분 b 탐지기가 예전처럼 억제할 수가 없기 때문에 선분 a 에 반응하는 탐지기는 탈억제 (disinhibition) 된다. Carpenter 와 Blackmore (1973) 가 경사착시에 대한 탈억제 효과를 처음으로 보여주었다. Magnussen 과 Kurtenbach (1980) 는 이 현상이 경사 잔존효과에서도 일어난다는 사실을 보여주었다. 탈억제 효과는 외측억제 이론으로 쉽게 설명될 수 있으며, 다른 합리적인 설명을 상상하기는 용이하지가 않다.

 

적응적 공명과 계열적 탐색

사람들에게 순간적으로 제시된 시각배열 속에 표적문자가 있었는지를 판단하는 과제를 주었을 때, 배열에 포함된 채우개 (distractor) 항목의 수가 증가할수록 성과가 떨어진다는 사실은 잘 알려져 있다 (Estes & Taylor, 1964). Gardner (1973) 는 이 결과가 표적항목을 발견하기 전에 주사해야 하는 항목의 수에 의한 것이 아니라고 주장하였다. 오히려 항목의 수가 증가함에 따라 보다 많은 채우개 항목들이 표적항목과 혼동되기 쉽기 때문이라는 것이다. 만일 문자탐지가 세부특징탐지기들의 병행처리를 수반한다면, 항목들을 주사할 필요가 없기 때문에 자극의 수는 아무런 관계가 없게 된다. 단지 문자탐지기가 계열처리를 수반할 때에만 항목의 수가 탐지속도를 느리게 만든다. Gardner 는 이 생각을 검증하기 위한 단순실험을 설계하였다. 피험자의 과제는 시각배열에 "F" 와 "T" 중에서 어느 것이 제시되었는지를 판단하는 것이었다. 채우개 항목들은 두 표적항목과 모두 비슷하지 않거나 (예컨대, "O") 아니면 매우 비슷한 것이었다 (예컨대, 인공적 문자인 "≠"). 항목 사이의 거리는 충분히 떨어져 있어서 감각수준의 차폐는 작용할 여지가 없었다. 결과는 명백하다 : 채우개 항목들이 표적항목과 혼동될 가능성이 없을 때는 성과가 자극배열 크기의 영향을 전혀 받지 않았다. "F" 를 재인하는 데 있어서 많은 "O" 가 있을 경우에도 단지 하나의 "O" 가 있을 때보다 시간이 더 걸리지 않았다. 한편 채우개 항목들이 표적항목과 유사할 때는 배열의 크기가 증가할수록 성과가 저하되었다. 한가지 설명은 채우개 항목의 세부특징들을 부호화하는 인지단위가 표적항목의 세부특징들을 부호화하는 인지단위를 외측으로 억제하였다고 보는 것이다. 채우개가 많을수록 억제도 많게 된다.

위의 결과는 이러한 방식으로 설명될 수도 있지만, Shiffrin 과 Schneider (1977) 는 다른 해석방안을 제안한다. 이들은 유사한 채우개들의 존재에 의한 간섭이 의사결정 단계에서 일어나는 것으로 간주한다. 이들의 주장에 따르면 각 시행의 끝부분에서 여러 개의 인지단위들이 - 표적항목의 단위와 채우개의 항목들이 - 활성화된다. 이 단위들의 활성화가 자동화된 병행처리적 방식으로 일어난다는 점에서는 이들도 동의한다. 이들이 동의하지 않는 것은 그후에 일어나는 사건이다. 이들의 주장에 따르면 "F" 와 "T" 중에서 어느 것이 제시되었는지를 결정하기 위한 탐색이 있게 된다. 활성화된 단위들이 상호간에 혼동되기 쉬우면, 탐색하는 데 시간이 오래걸린다. 이와 유사한 주장들이 단어 전체를 재인하는 경우에서도 제안되었으며, 단어재인에 관한 여러 가지 "확증" 모형들이 제안되었다 (Forster, 1987 ; Paap, Newsome, McDonald, & Schvaneveldt, 1982 ; Posner & Snyder, 1975). 이러한 모든 모형의 기본 생각은 예비적인 세부특징 분석이 각기 다른 단어들을 부호화하는 수많은 마디들을 활성화시킨다는 것이다. 특히 자극이 희미하거나 매우 짧은 시간동안 제시될  때 더욱 그렇다. 그렇게 되면 활성화된 마디 중에서 어느 것이 자극과 가장 일치하는 것인지를 찾아내기 위하여, 활성화된 단위들의 집합이 주의집중의 기제에 의해서 어떤 방법으로든 탐색된다.

한 문자를 재인할 때 그와 유사한 채우개들이 존재하면 시간이 오래 걸리며, 특정 상황에서는 다른 상황에서보다 단어를 재인하는 데 시간이 오래 걸린다. 탐색모형의 문제는 탐색이 어떻게 수행되는지를 설명하지 못한다는 데 있다. 어떻게 주의가 한 마디에서 다른 마디로 돌려지게 되는가? Grossberg 와 Stone (1986) 은 이 사건을 설명하는 기제를 제안한다. 외측억제가 부분적인 답을 제공하며 (보다 활성화된 마디가 덜 활성화된 마디를 억제한다), 적응적 공명이 나머지 부분을 제공한다. 단어를 부호화하는 수준에 있는 마디들이 세부특징을 부호화하는 수준에 있는 마디들과 공명한다. 결과적으로 두 수준은 실제 자극으로 타협하게 된다. 자극이 보다 희미하거나 갈등적일수록 타협안에 도달하는 데 시간이 오래 걸린다. 일반적인 의미에서의 탐색은 수반되지 않는다. 주의집중의 재지향은 반응을 하게 만드는 원인이라기 보다는 결과이며, 상징 수준 이론이 제기하는 현상을 - 이 경우에는 탐색 - 신경회로망 이론이 어떻게 구현할 수 있는지를 보여주는 예라 할 수 있다. 이렇게 함으로써 새로운 가능성을 제안할 수 있다. 여기서 가능성이란 주의집중의 재지향이 탐색의 원인이 아니라 결과라는 가능성을 말한다.

단어의 "이웃크기" 란 그 단어의 한 문자를 변경함으로써 만들어질 수 있는 다른 단어의 수를 지칭한다. 예컨대, 'dame' 은 커다란 이웃크기를 가지고 있다 ; 한 문자를 변경하여서 'fame', 'dome' 등을 만들 수 있다. 'mesh' 는 상당히 작은 이웃크기를 갖는다. 확증이론들은 커다란 이웃크기를 갖는 단어를 재인하는 데 보다 많은 시간이 걸린다고 예언하는 데, Andrews (1989) 는 그 이유가 탐색하여야 할 항목들이 많기 때문이라는 점을 지적한다. 한편 연결주의 이론은 이웃크기가 단어를 재인하는 데 걸리는 시간을 단축시킨다고 예언한다. 왜냐하면 단어수준과 문자수준 사이에 반향이 있기 때문이다. 즉, 이미 활성화되어 있는 모든 틀린 단어의 마디들은 활성화를 문자수준의 마디들에게 되돌려준다. 문자수준의 마디들은 다시 단어수준으로 활성화를 되돌려 보내는 방식으로 계속적인 반향이 있게 된다. 모든 활성화된 단어마디들은 보다 활성화되게 되지만, 정확한 단어가 가장 이득을 취하게 된다. 활성화되어 있는 네개의 모든 문자마디로부터 입력을 받아들이는 유일한 마디가 되기 때문이다. Andrews 는 어휘판단과제를 사용하여 여러 가지 실험을 하였으며, 어느 예언이 타당한 것인지를 찾아내기 위하여 단어를 정확하게 명명하는 데 걸리는 시간을 측정하였다. 고빈도단어에 있어서는 이웃크기가 별 영향을 미치지 않는다. 반면에 저빈도단어에 대한 결과는 명백하다 : 커다란 이웃크기를 가지고 있는 단어를 부호화하는 마디는 보다 신속하게 활성화된다. 이 결과는 연결주의적 예언과 일치하며 확증모형의 예언과는 일치하지 않는다.

요약과 결론

한 분석기의 각 수준에 있는 마디들은 상호간에 외측억제를 가함으로써 그 수준에서 활성화의 총량을 정규화시킨다. 외측억제는 또한 대비고양을 유발한다 : 신호를 부호화하는 마디는 보다 활성화되고 소음을 부호화하는 마디는 억제된다. 각 수준에 있는 마디들은 다른 수준의 마디들과 공명관계를 갖는다. 두 수준에 있는 마디들이 상호간에 일치하면 공명이 이들의 활성화를 증폭시키며 소음을 더욱 억압시킨다. 반면에 일치하지 않으면 각성시스템은 "원위치" 신호를 내보내게 된다.

마디들의 작동특성은 여러 가지 예언을 가능하게 만든다. 지각에는 실무율적인 자질이 있어야 한다. 망막의 정지된 시각상에 관한 실험은 이러한 생각을 지지한다. 음소나 색깔과 같은 다양한 자극들의 범주적 지각에 관한 증거들도 마찬가지로 이 생각을 지지한다. 마디들 사이의 연계는 다른 예언을 이끌어낸다. 수직적 연계는 흥분성으로써 여러 가지 위에서-아래로의 효과를 야기한다. 한 지각체의 구성성분들은 홀로 제시될 때에 비해서 사물속에 내포되어있을 때에 지각하기가 쉽다. 이 효과는 단어 속에 있는 문자의 지각, 문장 속에 있는 단어의 지각, 그리고 형태 속에 있는 선분의 지각에서도 마찬가지로 나타난다. 수직적 흥분성 연계는 지각을 촉진하는 반면, 외측 억제성 연계는 지각을 간섭할 수 있다. 그러한 간섭의 증거는 역행성 차폐와 같은 현상에서 찾아볼 수 있다. 지각이 어느 정도는 확실하게 밝혀져 있지 않다고 하더라도 우리가 기술한 과정과 유사한 방식으로 일어난다는 데에 모든 사람들이 동의한다. 어떤 이론가들은 지각이 일어난 후에 무엇을 지각한 것인지를 결정하기 위한 항목들의 탐색이 뒤따른다고 주장한다. 여기서 우리 주장의 요체는 그러한 의사결정 단계를 상정할 필요가 없다는 점이다. 의사결정은 신경모듈이 배선화된 방식에 의한 자동적 효과일 수 있다.