지 각

 

인지 심리학과 그 응용 : John R. Anderson 저서, 이영애 옮김, 이화여자대학교출판부, 2000  (원서 :  Cognitive Psychology and Its Implication (4th ed), 1995), Page 51~86

 

1. 시각 정보 처리

     (1) 초기 시각 정보 처리

     (2) 시각 세포에서의 정보의 부호화

     (3) 깊이와 표면 지각

     (4) 물체 중심의 지각

2. 시각 패턴 재인

     (1) 형판 맞추기 모형

     (2) 세부 특징 분석

     (3) 물체 재인

3. 말 재인

     (1) 말의 세부 특징 분석

     (2) 범주 지각

4. 맥락과 패턴 재인

     (1) 문장 맥락의 효과

     (2) 맥락과 말

     (3) 맥락과 세부 특징 조합을 위한 마사로의 FLMP 모형

     (4) 낱자 지각을 위한 PDP 모형

5. 결 론

6. 일러두기와 읽을 거리         

 

이 장에서는 "사람들이 사물을 어떻게 재인하는가?" 라는 매우 기본적인 질문을 가지고 인간의 인지를 살펴보겠다. 특히 시지각에서 연구되어 온 문제들에 초점을 두겠지만, 언어 지각과 함께 다른 유형의 패턴 재인도 살펴보겠다. 지각은 눈과 귀에 도달하는 정보를 단순히 등록하는 것 이상을 포함한다. 주요 문제는 그 정보에 어떤 종류의 해석을 부여하는 가이다.예를 들면, 우발적 일산화 탄소 중독 때문에 뇌 손상을 당한 군인을 보자. 그는 느낌, 냄새, 또는 소리로 물체를 재인할 수는 있었지만, 원가 사각형을 구분할 수 없었고 얼굴이나 글자를 재인할 수 없었다. (Benson & Greenberg, 1969). 한편, 그는 빛의 강도 색체를 구분할 수 있었으며 물체가 이동하는 방향을 식별할 수 있었다. 이처럼, 그의 체계는 시각 정보를 등록할 수 있었지만, 그의 뇌 손상은 시각 정보를 지각 경험으로 통합시키는 능력을 잃게 하였다. 이 사례는 지각이 단순히 감각 정보를 등록하는 것 이상을 보여 준다.

이 환자는 시각 불능증 (visual agnosia) 으로 관찰된 여러 사례 중 하나이다. 시각 불능증은 지적 결여도 아니고 기본 감각 능력의 결여도 아니면서 시각 대상을 재인하지 못하는 증상이다. 일반적으로, 지각 불능증 (apperceptive agnosia) 과 연합 불능증 (associative agnosia) 은 구분된다. (개관은 Farah, 1990 참조). 위에 기술된 환자는 지각 불능증의 예이다. 그런 환자들은 원이나 삼각형과 같은 간단한 형태를 재인할 수 없거나 보여진 형태를 그리지 못한다. 한편, 연합 불능증 환자들은 간단한 형태는 재인할 수 있고 복잡한 형태의 그림도 성공적으로 베껴 그릴 수 있다. 그러나, 그런 물체들을 재인하지는 못한다. 그림 2.1은 원래 모양의 닻과 래트클리프와 뉴컴 (Ratcliff & Newcomb, 1982) 이 연구했던 환자가 그린 닻을 보여 준다. 비교적 정확하게 그릴 수 있는 능력은 있으나, 이 환자는 그것을 닻으로 재인하지 못하고 우산이라고 불렀다. 지각 불능증 환자는 비교적 초기 과정에 문제가 있는 반면, 한편 연합 불능증 환자들은 초기 과정은 온전하지만 정보 처리 후기에 발생하는 패턴 재인에 어려움이 있는 것으로 생각된다. 이 장은 재인 이전에 시각 정보가 어떻게 처리되는지 먼저 논의한 후 패턴 재인 과정으로 넘어가고자 한다.
 

    시지각은 시각 장면으로부터 형태와 대상들이 추출되는 초기 단계 그리고 형태와 대상들이 재인되는 후기 단계로 나뉜다.

1. 시각 정보 처리

(1) 초기 시각 정보 처리

초기 시각 정보 처리의 신경 기초에 관해 많은 것들이 알려져 있다. 그림 2 는 눈의 모형도이다 빛은 수정체와 초자체를 지나 눈의 뒤쪽에 있는 망막에 부딪친다. 망막은 실제로 빛에 반응하는 감광 세포들을 가지고 있다. 빛이 초자체를 지날 때 약간 분산되므로 안구의 반대편에 있는 망막에 생기는 상은 뚜렷하지 않다. 초기 시각 과정의 한 기능은 그 상을 뚜렷하게 만드는 것이다.

빛은 광화학적 과정에 의해 신경 에너지로 바뀐다. 눈에는 두 가지 광수용기가 있는데, 간상체와 원추체가 바로 이들이다. 원추체는 색채시에 관여하며 고도의 해상도 (resolution) 와 예민성 (acuity) 을 보여 준다. 간상체는 적은 양의 빛에도 반응할 수 있지만, 해상도가 낮다, 그 결과, 간상체는 밤에 경험하게 되는 덜 예민한 흑백 시각을 주로 책임진다. 원추체는 중심와 (fovea) 라는 매우 작은 영역에 특히 집중되어 있다. 어떤 물체에 눈을 고정시킬 때, 그 물체가 중심와에 떨어지도록 눈을 이동한다. 이 과정은 물체를 지각할 때 원추체의 해상도를 최대화한다. 중심와는 미세한 세부 탐지에 관여한다. 중심와를 제외한 말단 (periphery) 영역은 움직임을 포함하여 좀더 총체적인 정보 탐지를 맡는다.

수용기 세포는 양극 세포에, 양극 세포는 다시 신경절 세포에 연접되며, 신경절 세포의 축색 돌기는 눈을 떠나 시신경을 형성하며, 이 시신경은 뇌로 간다. 각 눈에서 나온 시신경에는 약 800,000 개의 신경절 세포가 있다. 각 신경절 세포는 망막의 한 작은 영역으로부터의 정보를 약호화한다. 한 신경절 축색 돌기에서 신경 흥분의 양은 보통 망막의 해당영역에 가해진 빛 자극의 양을 약호화 한다.

그림 3 은 눈에서 뇌까지의 신경 통로를 나타낸다. 양 눈에서 나온 시신경은 시신경 교차에서 만나고, 코 쪽의 망막 부위에서 나온 신경은 서로 교차하여 반대편 뇌로 가고, 망막의 바깥 쪽에서 나온 신경들은 눈과 같은 쪽의 뇌로 연결된다. 이것은 두 눈 모두의 우측 정보는 우측 뇌로 연결됨을 뜻한다. 그림 3 에서 보듯이, 수정체는 각 눈의 좌측시야가 각 눈의 우측에 떨어지도록 빛을 모은다. 이처럼 좌측 시야의 정보는 우뇌로 가며, 비슷하게 우시야의 정보는 좌뇌로 간다. 이것은 앞 장에서 이미 논의된 일반적 사실로서, 좌반구는 우측 세상에 관한 정보를 처리하고, 우반구는 좌측 세상의 정보를 처리함을 보여 주는 일례이다.

그림 3  눈에서 뇌까지의 신경 통로. (Keeton. 1980.)

신경절 세포에서 나온 신경 섬유들은 외측 슬상핵 또는 상구에 있는 세포들과 연접한다 (그림 3 참조). 이 두 영역은 뇌에서 피질 바로 밑에 있다. 외측 슬상핵은 세부 지각과 물체 재인에 중요한 신경 통로의 일부이며 한편 상구는 물체들의 공간상 위치를 파악하는 일을 한다, 이 두 신경 구조들은 시각 피질과 연결되어 있다. 피질에도 이와 유사한 영역이 있는데, 측두엽에서는 물체가 무엇인지를 재인하는 책임을 맡은 영역이 있는가 하면 두정엽에는 물체의 위치 정보 처리의 책임을 맡은 영역이 있다.
 

    빛 에너지는 광학 과정에 의해 신경 활동으로 바뀐다. 이 정보는 시각 피질로 향하는 여러 신경 경로를 따라 진행된다.

(2) 시각 세포에서의 정보의 부호화

쿠플러 (Kuffler, 1953) 의 연구는 정보가 신경절 세포들에 의해 어떻게 약호화되는가를 이해하는 데 중요하다. 이 세포들은 눈이 빛을 받지 않아도 일정한 속도로 자발적으로 점화한다. 어떤 신경절 세포들은, 만일 빛이 망막의 작은 부위에 떨어지면, 그 자발적 점화율이 증가한다. 그러나 만일 빛이 이처럼 예민한 중심부가 아닌 그 주변에 제시되면, 자발적 점화율은 떨어진다. 중심부에서 먼 빛은 전혀 반응을 일으키지 않는다. 이 세포들은 점 – 멸 (on-off) 세포로 알려져 있다. 멸 – 점 (off-on) 신경절 세포들도 있는데, 여기서 중심부의 빛은 자발적 점화율을 억압하는 반면 주변부의 빛은 점화율을 증가시킨다. 그림 4 는 이 체포들의 수용장을 나타낸다. 외측 슬상핵에 있는 세포들도 같은 방식을 반응한다.

허벨과 위셀 (Hubel & Wiesel, 1962) 은 고양이의 시각 피질을 연구하면서 피질 세포들이 하위 세포들보다 더 복잡한 방식으로 반응함을 발견하였다. 그림 5 는 피질 세포에서 관찰된 네 가지 패턴을 보여준다, 그림에서 보듯이 이 수용장 모두는 점-멸 세포들과는 달리 타원형이다. a 와 b 는 모서리탐지기 (edge detectors) 들이다. 이들은 선분의 한쪽에서는 양으로 그리고 다른 한쪽에서는 음으로 반응한다. 만일 빛이 선분을 이루면서 경계선에 떨어지면 이 세포들은 최대한 반응한다. c 와 d 는 막대 탐지기 (bar detectors) 들이다. 그들은 중심부의 빛에는 양으로 그리고 주변부의 빛에는 음으로 반응하며, 그 반대도 가능하다. 이처럼, 만일 빛 막대가 중심부를 덮고 있으면, 중심부에 양전기를 가진 막대가 최대한 반응하게 된다.

 

그림 4 신경절 세포들과 외측 슬상핵 세포들 안에 있는 점-멸 및 멸-점 수용장.

 

그림 5 피질 세포들의 반응 패턴.

그림 6 특정 넓이 및 방향 탐지기들을 흥분시키는 패턴

모서리와 막대 탐지기모두는 위치, 방향 및 넓이에 민감하다. 즉, 그들은 시야의 특정 부위에 있는 자극, 특정 방향의 막대와 모서리, 그리고 특정 넓이의 막대와 모서리에만 반응한다. 그러므로, 그림 6 과 같은 줄무늬 패턴은 그 줄들이 특정 탐지기에 맞는 방향과 넓이라면 바로 그 막대 탐지기를 흥분시킨다. 그러나, 각각의 탐지기들이 서로 다른 넓이와 방향으로 조정되어 있으므로, 막대 탐지기의 어떤 하위세트는 그런 패턴에 의해 자극된다.

 

그림 7 은 몇 개의 점 - 멸 및 멸 - 점 세포들이 모여 막대 또는 모서리 탐지기들을 어떻게 이루는지 보여준다. 하나의 점 - 멸 세포만으로는 탐지기를 자극하는 데 충분치 않음을 주목하라. 오히려, 탐지기는 점 - 멸 세포들의 패턴에 반응하므로, 이런 낮은 수준에서조차 신경계가 신경 활성화의 패턴으로 정보를 처리함을 알 수 있다. 이것이 앞 장에서 강조되었던 주제이다.
 

    낮은 수준의 시각처리는 피질에서 모서리와 막대 탐지기를 만드는 점 - 멸 및 멸 – 점 세포들을 포함한다.

(3) 깊이와 표면 지각

시각 체계가 환경에서 모서리와 막대의 존재를 확인한 이후에도, 여전히 엄청난 양의 정보 처리가 수행되어야만 시각 체계는 세상을 지각할 수 있다. 시각 체계가 풀어야 할 문제 중의 하나는 공간에서 모서리와 막대를 찾는 일이다. 근본적인 문제는 망막에 펼쳐진 정보가 원래는 2 차원 (2-D) 이지만, 세상을 표상하기 위해서는 이를 3 차원으로 구성해야 한다는 것이다. 거리를 추론하기 위하여 시각 체계는 몇몇 단서들을 처리할 준비가 되어있다. 이 단서들 중의 하나가 짜임새 변화 (texture gradient)이다. 요소들은 관찰자로부터의 거리가 멀어질수록 그 밀도가 조밀해지는 경향이 있다. 그림 8 에 있는 깁슨 (Gibson, 1950) 의 예를 보자. 평평한 표면인데도 불구하고 짜임새 변화는 거리감을 준다. 깊이에 대한 또 다른 단서는 두 눈이 세상에 대하여 약간 다른 조망을 받아서 생기는 입체시 (stereopsis) 이다. 몇몇 영화와 다른 증거들에서 볼 수 있는 3 차원 안경은 입체시에 근거한 것이다. 그 안경은 단일한 2 - D (영화 스크린과 같은) 에서 오는 빛을 여과해서 서로 다른 빛이 두 눈에 도달하게 한다. 입체시에 의한 3 차원 구조의 지각은 매우 강력하다.

3 차원 구조에 관한 세 번째 강력한 정보원은 운동 시차 (motion parallax) 이다. 머리를 움직이며, 가까이 있는 물체들은 멀리 있는 물체들보다 망막을 지나서 더 빨리 움직인다. 흥미로운 시범은 한눈을 감고 가까이 있는 나무나 관목의 잎들을 보는 것이다. 입체 정보가 거부되었기 때문에, 잎 하나하나의 상대적 위치를 파악하기 어려운, 매우 평평한 상을 본다는 느낌이 든다. 그 다음 머리를 움직여 보라. 갑자기, 나무에 대한 3 차원 구조가 저절로 지각되면서 나뭇잎들과 가지들의 위치를 하나하나 감지할 수 있다.

그림 8  짜임새 변화의 예 (Gibson, 1950.)

깊이 지각에서 짜임새 변화, 입체시 및 운동 시차와 같은 단서의 중요성은 입증하기가 매우 쉽지만, 그와 같은 강력한 입증을 가능하게 하는 정보를 뇌가 실제로 어떻게 처리하는지 이해하기는 매우 어렵다. 계산론적 시각 분야의 몇몇 사람들은 이 일이 어떻게 가능한지를 연구하였다. 예를 들면, 마 (Marr, 1982) 는 이렇게 다양한 정보원이 지각자가 표면을 파악하는 근거인 2½–D 스케치를 만들기 위해 함께 작용한다는 매우 영향력 있는 제안을 했다. 그러나, 그는 이 표상이 세상에 대한 실제 지각과 얼마나 다른지를 알았다. 특히 그러한 표상은 주변에 도대체 어떤 물체들이 널려 있는지 파악하지 못한다. 그는 이러한 정보를 포함하는 물체 중심의 표상을 언급하기 위하여 3–D 스케치라는 말을 썼다.
 

    짜임새 변화, 입체시 및 운동 시차와 같은 단서들은 함께 모여 3차원 공간상에서 표면의 위치를 표상한다.

(4) 물체 중심의 지각

이처럼 세상에 대한 표상을 계산할 때 당면하는 주된 문제는 물체 분절화(object segmentation) 이다. 선분과 막대가 공간의 어디에 있는지 아는 것만으로 충분하지 않다. 어떤 것들이 함께 모여 물체를 이루는지 알 필요가 있다. 그림 9 를 보자. 여러 선분들이 이리저리 뻗어 있으나, 어떤 식으로든 그들을 함께 묶어 한 세트의 물체들을 지각하게 된다.

사람들은 물체들을 어떤 원리 세트에 따라 단위들로 체제화한다. 이 원리들은 체제화에 관한 형태주의 원리들 (gestalt principles of organization)로 불리는데, 이는 처음 제안한 형태주의 심리학자들 (예 : Wertheimer, 1912) 에 따른 것이다. 그림 10 에 있는 몇 가지 예를 보자. A 를 보면 여덟 개의 분리된 선분이 아닌 네 쌍의 선분을 지각하게 된다. 이 그림은 근접한 요소들이 단위로 체제화되는 근접성의 원리를 나타낸다. B 는 유사성의 원리를 나타내며 O 또는 X 로 구성된 가로줄이 교대로 배열된 것처럼 보인다. 즉, 비슷해 보이는 물체들은 한 집단으로 분류되는 경향이 있다. C 는 좋은 연속의 원리를 나타낸다. A 에서 B그리고 C 에서 D 선분보다 더 좋은 연속을 나타낸다. D는 폐쇄와 좋은 형태의 원리를 나타낸다. 이 그림에서 가려진 원이 여러 형태를 취할 수 있음에도 불구하고, 우리는 한 원이 다른 원에 의해 가려졌다고 본다.

이 원리들은 완전히 새로운 자극도 단위로 체제화한다. 팔머 (Palmer, 1977) 는 피험자들이 그림 11 에 있는 그림들을 어떻게 재인하는지 연구하였다. 그는 처음에 a 를 보여 주고 b 부터 e 가 a 의 일부인지를 물었다. A 는 부분적으로 삼각형 (폐쇄) 과 구부러진 글자 n (좋은 연속)으로 체제화된다. 팔머는 분할된 그림들이 형태주의 원리에 의해 예언된 부분들일 때 피험자들의 재인이 매우 빠름을 발견하였다. 즉, b 와 c 는 d 와 e 보다 더 빨리 재인되었다. 이처럼, 재인은 그림을 어떻게 분할하였는지에 좌우됨을 알 수 있다. 재인이 손상되는 경우는 형태주의에 근거한 분할이 실제의 패턴 구조와 모순될 때이다. FoRiNsTaNcEtHiSsEnTeNcEiShArDtOrEaD. 이 문장이 읽기 어려운 이유는 형태주의의 유사성 원리가 근접한 대소문자들을 통합하여 보는 것을 어렵게 하며, 또한 단어 간에 여백이 없어서 근접 단서가 제거되기 때문이다.

분할에 관한 이 같은 생각들은 더 복잡한 삼차원 구조가 어떻게 분할되는지 기술하는데도 유용하다. 호프먼과 리처드 (Hoffman & Richards, 1985) 는 한 물체의 윤곽 표상을 더 작은 물체들로 분할할 때 형태주의와 같은 원리가 어떻게 쓰여지는지를 그림 12 에서 보여준다.

그들은 한 부분이 다른 부분과 결합되는 곳의 외곽선이 보통 요철로 나타남을 관찰한다. 근본적으로, 사람들은 좋은 연속이라는 형태주의 원리를 이용하는데, 요철로 된 선분은 좋은 연속이 아니므로 이 두 부분을 함께 묶지 않는다.

우리는 지금까지 삼차원 공간에서 물체의 위치와 형태를 파악하는 정도까지 시각 정보 처리를 다루었다. 현재의 입장은 시각 처리가 주로 생래적임을 강조한다. 유아들은 물체를 재인할 수 있고 형태를 파악할 수 있으며 이 물체들이 삼차원 공간에서 차지하는 위치를 감지 할 수 있다 (예 : Granrud, 1986, 1987). 이제 학습이 지각에서 분명히 중요한 역할을 하고 있음을 보겠는데, 즉 이 시각적 물체들이 무엇인지 어떻게 재인하는가의 문제이다.
 

    체제화에 관한 형태주의 원리들은 시각 장면들을 물체들로부터 분할하는 데 쓰여진다.

2. 시각 패턴 재인

시각 정보 처리에 관한 논의가 사람들이 시각 세계를 물체들로 체제화한다는 지점까지 왔다. 그러나, 세상을 보는 한 중요한 단계가 더 남아 있는데, 그것은 이 물체들이 무엇인지 파악하는 일이다. 이것이 형태 재인의 과제이다. 이 연구의 많은 부분이 낱자의 정체를 어떻게 재인하는가에 초점을 두고 있다. 예를 들면, A 가 제시되었을 때 어떻게 그것을 A 로 재인하는가이다. 이 주제로 논의를 시작하겠지만 좀 더 일반적인 물체 지각으로 주제를 바꿀 것이다.

(1) 형판 맞추기 모형

패턴을 재인하는 가장 분명한 방법은 형판 맞추기 (template matching) 일 것이다. 지각에서 형판 맞추기 이론은 물체의 망막상이 뇌에 충실히 전달되고 그것을 여러 저장된 패턴과 직접 비교하려는 시도가 이루어진다고 가정한다. 저장된 패턴을 형판이라고 부른다. 기본 생각은 지각 체계가 낱자를 저장된 몇 개의 형판과 대조해 보고 가장 잘 맞는 형판을 보고한다는 것이다. 그림 13 은 형판 맞추기 작업의 다양한 시도를 보여 준다. 각 경우에, A 에 의해 자극된 망막 세포들과 형판 패턴에 명세 된 망막 세포들 간의 일치를 얻기 위한 시도가 이루어진다.

그림 14 성공적 형판 맞추기를 위해 계좌 번호를 특별히 도안한 보통의 은행 수표.

그림 13 에서 a 는 일치가 이루어진 경우로서 A 가 재인된다 b 는 입력 L 과 형판 A 의 불일치를 보여 준다. L 은 그림 c 의 L 형판과 맞는다. 그러나 형판에 의한 재인에는 오류가 생기기 쉽다. D 는 상이 망막의 틀린 부분에 떨어질 때 생기는 불일치를 보여 주며, e 는 상의 크기가 틀릴 때 생기는 문제를 보여 준다. F 는 상의 방향이 틀릴 때의 상황을 보여 주며, g 와 h 는 상이 표준 A 가 아닐 때의 어려움을 보여 준다. 이 모든 문제들을 위하여 특별히 알려진 형판 수정 방법은 없다.

형판 맞추기의 흔한 예는 수표에 인쇄된 계좌 번호를 들 수 있는데, 이 숫자들은 은행 컴퓨터가 사용하는 수표 분류기에 의해 읽혀진다. 그림 14 는 필자의 빈 수표이다. 계좌 번호는 밑에 나와 있다. 이 숫자를 최대한 쉽게 식별하도록 글자들을 만드는 데 상당한 노력이 들었을 것이다. 크기와 위치를 표준화하기 위하여 글자들은 기계로 인쇄되어야 하며, 수표 분류기는 손으로 쓴 숫자들을 재인하지 못하게 되어 있다. 형판 맞추기가 작용하는 데 표준화된 체계가 필요하다는 바로 그 사실은 인간의 형태 재인 모형으로서 형판 맞추기의 신뢰성을 떨어뜨린다. 인간의 형태 재인은 매우 융통성이 있다. 대문자 (LARGE)와 소문자 (small), 잘못된 위치 (place), 이상한 방향 (orientations) 및 유별난 형태 (), 얼룩진 또는 부숴진 글자 (broken), 그리고 위 아래가 바뀐 () 글자들까지도 노력을 기울이면 읽을 수 있다.
 

    형판 맞추기는 패턴과 자극 간의 정확한 일치를 측정하려는 시도를 포함한다.

(2) 세부 특징 분석

형판 맞추기가 제시한 부분적인 어려움 때문에, 심리학자들은 형태 재인이 세부 특징 분석 (feature analysis) 을 통해 이루어진다고 제안하였다. 이 모형에서, 자극들은 세부 특징들의 조합으로 간주된다. 알파벳의 세부 특징들은 평행선, 수직선, 사선 및 곡선으로 구성된다. 대문자 A 는 30 도로 만나는 두 사선 (/ 와 \) 과 수평선 (-) 으로 구성된다고 볼 수 있다. 낱자 A 의 형태는 이 선들과 이들이 어떻게 조합되어야 하는가에 대한 세부 설명으로 구성된다. 이 세부 특징들은 (앞서 논의된) 시각 피질에서의 모서리 및 막대 탐지기들의 출력과 매우 비슷하다.

세부 특징 분석이 어떻게 형판 모형보다 더 나은지 의문이 생길 수 있다. 결국, 세부 특징들이 형판의 축소판이 아니고 무엇이겠는가? 그러나, 세부 특징 모형은 형판 모형보다 많은 장점들을 가지고 있다. 첫째, 세부 특징들은 간단하기 때문에 지각 체계가 형판 모형에서 생긴 어려움을 어떻게 수정하려는 지를 쉽게 파악할 수 있다. 세부 특징 조합 모형의 두 번째 장점은 형태 재인에 가장 결정적인 세부 특징들 간의 관계를 명시할 수 있다는 것이다. 예를 들면, A 의 결정적 요소는 두 선분이 정점에서 30 도로 교차하고 (또는 거의 교차하고) 가로 막대가 이 두 선분을 교차한다는 것이다. 따라서, A.A.A.A.A 의 패턴 모두가 A 로 재인된다. 마지막 장점은 큰 패턴보다 세부 특징을 사용하면 필요한 형판의 수가 감소된다는 것이다. 세부 특징 모형에서는 주어진 패턴에 대하여 형판 대신 세부 특징만 있으면 된다. 그 이유는 동일한 세부 특징들이 여러 패턴에서 나타나기 때문이며, 이것은 상당한 절약을 의미한다.

패턴 재인의 성분이 세부 특징임을 보여 주는 행동 증거가 많이 있다. 예를 들면, 많은 세부 특징을 공유한 글자들은 – C 와 G 처럼- 혼동하기 쉽다는 증거가 있다 (Kinney, Marsetta, & Showman, 1966). 이러한 글자들이 짧은 기간 제시되면, 피험자들은 G 가 제시되었을 때 29 개의 오반응을 냈는데, 그 중 21 개는 C 로, 6 개는 O 로, 1 개는 B 로 그리고 나머지 한 개는 9 로 잘못 분류했다. 다른 오반응은 없었다. 피험자들은 반응으로 G 와 유사한 세부 특징 세트를 가진 항목들을 택하고 있었음이 분명하다. 이 반응 패턴이 세부 특징 모형을 사용할 경우 예상되는 양상이다. 만일 피험자들이 짧은 제시 기긴 동안 소수의 세부 특징만을 추출한다면, 그들은 이 세부 특징들을 공유하는 자극들을 구분할 수 없게 된다.
 

    세부 특징 분석은 한 패턴을 이루는 세부특징들을 먼저 재인한 후 그들의 조합을 나중에 재인하는 분리된 과정을 포함한다.

(3) 물체 재인

세부 특징 분석이 글자 A 와 같은 간단한 물체를 어떻게 재인하는가를 만족스럽게 설명하지만, 소수의 세부 특징으로는 기술할 수 없는 더 복잡한 물체들의 재인을 어떻게 설명할지 의문을 가질 수 있다. 지각 분야에서의 고무적인 발전은 간단한 물체 재인과 동일한 과정이 말 또는 컵과 같은 친숙한 범부의 물체 재인을 뒷받침한다는 증거가 점차 많아진다는 사실이다. 기본 생각은 친숙한 물체는 간단한 성분들의 구성물 (configuration) 로 볼 수 있다는 것이다, 그림 15 는 친숙한 물체들을 간단한 파이프와 같은 성분들의 구성물로 볼 수 있다는 마 (Marr, 1982) 의 제안을 보여준다. 예를 들면, 타조는 수평 방향의 몸통이 두 개의 긴 다리와 긴 목에 붙어 있다.

그림 15 친숙한 물체들을 기본 원통 형태로 분할한 것. (Marr & Nishihara. 1978)

비더만 (Biederman, 1987) 은 성분에 의한 재인론 (recognition-by-components theory) 을 제안하였다. 즉, 간단한 성분들의 총체로서 물체 재인의 세 단계를 제안하였다 :

낱자 지각에서처럼 재인에는 별로 중요하지 않은 기본 세부 특징들과 지온상의 여러 작은 변이들이 많다. 예를 들면, 모서리가 직선인지 곡선인지 (벽돌과 원통의 구분에서) 또는 몇몇 모서리들이 평행인지 아닌지 (원통과 원뿔의 구분에서)를 결정하기만 하면 된다. 그 모서리가 정확하게 얼마나 구부러졌는지는 결정할 필요가 없다. 모서리들만이 지온을 결정하는 데 필요하다. 색깔, 짜임새 및 사소한 세부 내용은 문제가 되지 않는다. 이 것은 기본 지온들의 파악을 가능하게 해 주는 복잡한 물체들에 대한 도식적 선 그림들이 그 물체들에 대한 세밀한 컬러 사진처럼 빨리 재인되어야 한다고 예측한다, 비더만과 주 (Biederman & Ju, 1988) 는 이것이 사실임을 발견하였는데 - 전화와 같은 물체들의 도식적 선 그림들은 재빠르고 정확한 재인에 필요한 모든 정보를 제공한다.

이 이론에서 중요한 가정은 물체 재인이 그 물체의 구성 성분의 재인에 의해 매개된다는 점이다. 비더만 등 (Biederman, Beiring, & Blickle, 1985)은 그림 17 에 있는 물체들로 이 예언을 검증하였다. 어떤 조건에서는 구성 성분 한두 개가 삭제되었는가 하면 어떤 조건에 모든 구성성분들이 있지만 이들의 윤곽선들이 부분적으로 삭제되었다. 연구자들은 이 두 유형의 미완성 그림들을 여러 노출 간격으로 짧게 제시하고, 그 물체가 무엇인지 물었다. 결과는 그림 18 에서 나와 있다. 매우 짧은 제시 (65 또는 100 msec) 에서, 피험자들은 윤곽선이 부분적으로 삭제된 그림보다는 구성 성분이 삭제된 그림을 더 정확하게 재인하였다. 한편 200 msec 이상의 긴 제시에서는 이와 반대되는 결과가 나왔다. 비더만 등은 매우 짧은 제시에서는 피험자들이 윤곽선이 부분적으로 삭제되어 있는 성분들을 확인할 수 없었으므로 물체의 재인이 어려웠다고 생각하였다. 그러나 200 msec 노출에서는 피험자들이 어느 조건에서든 모든 구성 성분들을 재인할 수 있었다. 윤곽선이 부분적으로 삭제된 조건에는 더 많은 구성성분들이 있기 때문에, 그들은 물체의 정체성에 관해 더 많은 정보를 가지고 있었다.
 

    말 또는 컵과 같은 물체들은 한 세트의 간단한 하위 물체들의 구성물로 재인된다.

3. 말 재인

지금까지 시각 패턴의 재인을 살펴보았다. 이에 관한 결론의 일반성을 검증하는 한 방법은 그 결론이 말의 재인에도 확장되는지 검토하는 일이다. 말 처리의 초기 과정을 자세히 논의하지는 않겠지만, 물체 재인에서와 비슷한 문제점이 제기됨은 주목할 만하다. 말의 재인에서 중요한 문제는 재인될 대상의 분절화이다. 말은 인쇄된 글처럼 별개의 단위로 나뉘지 않는다. 말에서는 잘 정의된 틈이 단어 간에 있는 듯하다. 실제로 사용되는 말을 조사해 보면 단어 경계에서 감소되지 않은 소리 에너지를 발견하게 된다. 사실 말 에너지의 중지는 단어 간뿐만 아니라 단어 내에서도 일어나는 듯 하다. 말의 이 같은 특성은 잘 모르는 외국어를 들을 때 더욱 심각하다. 그러한 말은 단어의 경계가 분명치 않은 연속된 소리의 흐름처럼 들린다. 단어 간에 경계가 있다는 착각을 불러일으키는 것은 자신의 언어에 대한 친숙성이다.

한 단어 내에서도, 더 큰 분절화 문제가 있다. 그 중에 음소 (phonemes) 파악이 있다. 음소는 말소리의 기본 어휘로서, 이를 통해 단어가 재인된다. (주석 : 마사로 (Massaro, 출판중) 는 기본 지각 단위는 자음-모음 그리고 모음-자음간의 조합이라는 제안되는 대안을 제시하였다.) 음소는 말로 된 메시지에 차이를 가져올 수 있는 말의 최소 단위로 정의된다. 예를 들면, bat 라는 단어를 보자. 이 단어는 세 음소 [b], [a] 및 [t] 로 분석된다, [b] 가 [p] 로 대치되면, pat 으로, [a] 가 [i] 로 대치 되면 bit 로, [t] 가 [n] 으로 대치되면 ban 으로 된다, 낱자와 음소가 항상 일 대 일로 일치하는 것은 아니다. 예를 들면, one 이라는 단어는 [w], [Ә] 및 [n] 음소들로, school은 [s], [k], [ú] 및 [l]로, 그리고 knight 은 [n], [i] 및 [t]로 구성된다. 영어의 철자법이 어려운 이유는 낱자와 소리가 완전히 일치하지 않기 때문이다.분절 문제는 구어를 구성하는 음소를 파악해야 할 때 생긴다. 말은 연속적이고, 음소는 인쇄된 문자들처럼 분리되지 않기 때문에 어려움이 있다. 이 수준에서 분절화는 한 낱자가 다른 낱자 속으로 흘러 가듯이 글로 쓰여진 (인쇄된 것이 아닌) 메시지를 재인하는 것과 같다. 또한 글로 쓰는 것처럼, 말하는 사람에 따라 동일한 음소가 다르게 발음된다. 말하는 사람들 간의 차이가 매우 뚜렷한 경우도 있는데, 예를 들면, 발음이 강하고 익숙하지 않는 방언을 이해하려 할 때 - 이것은 미국인이 호주인의 말을 이해하려 할 때와 흡사하다. 그러나, 사람들의 말을 조사해 보면 같은 악센트를 가진 사람들 간에서조차 상당한 편차가 있음을 알 수 있다. 예를 들면, 여자와 아이들의 음성은 남자들보다 더 높은 음조를 띤다.

말 지각에서 더 큰 어려움은 공조음 (coarticulation) 이라는 현상 (Liberman, 1970) 과 관련된다. 성대가, 예컨대, bag 에서 b 라는 한 음을 생성하고 있는 동안, 그것은 [a] 에 필요한 형태로 이동하고 있다. 성대는 a 를 말하는 동안, g 생성을 위해 이동하고 있다. 이 효과로 여러 음소가 중복된다. 이것은 음소 분절화에서 추가적 어려움을 뜻하며, 한 음소에 대하여 생성된 실제 소리는 다른 음소의 맥락에 따라 결정됨을 뜻하기도 한다.

말의 지각은 일반적으로 청지각 기제와는 다른 특수 기제로 생각된다. 다음 절에서는 말 지각이 특수한 기제임을 몇몇 방식으로 논의하겠다. 좌측 측두엽 손상으로 말을 알아 듣지 못하게 된 몇몇 환자 (Goldstein, 1974 참조) 의 경우도 여기에 속한다. 그들은 다른 소리를 탐지하고 재인하는 능력처럼 말하기 능력도 온전하다. 따라서, 그들의 결함은 말지각에 한정된다. 때로는 이 환자들이 매우 느린 말은 다소 알아듣는데 (예 : Okada, Hanada, Hattori, & Shoyama, 1963), 이 결과는 그들의 문제가 부분적으로 말의 흐름을 분절하는 데 있음을 시사한다.
 

    말의 재인은 연속된 말의 흐름에서 음소의 분절화와 관련된다.

(1) 말의 세부 특징 분석

세부 특징 분석과 세부 특징 조합 과정들은 시각적 재인에서처럼 말의 지각에 기초가 되는 듯하다. 낱자들과 마찬가지로, 음소들은 몇몇의 세부 특징들로 분석된다. 이 세부 특징들은 음소가 생성되는 방법의 여러 측면을 보여준다. 음소의 세부 특징들 중 자음상 세부 특징, 유성음 여부 및 조음 위치가 있다. (Chomsky & Halle, 1968). 자음상 세부특징 (consonantal feature) 은 음소의 속성이 모음과 대조되는 자음의 특성을 갖는다. 유성음 (voicing)은 성대의 진동에 의해 생기는 음소의 소리이다. 예를 들면, sip 과 zip 을 비교해 보자. Sip 에서 [s] 는 무성음이지만 zip 에서 [z] 은 유성음이다. 이 차이는 이 소리를 낼 때 손가락을 후두에 대면 감지된다. 후두는 유성 자음을 낼 때 진동하게 되어 있다.

발성 장소 (place of articulation) 는 음소가 생성될 때 성대가 닫히거나 수축되는 곳이다. (대부분의 자음이 발화될 때 성대는 어느 지점에서인가 닫힌다) 예를 들면, [p], [m] 및 [w] 는 양순음으로 간주되는데 이들이 생성될 때 양 입술이 닫히기 때문이다. [f] 와 [v] 는 순치음인데 앞니가 아랫 입술을 압박하기 때문이다. [th] 가 thy 와 thigh 에서 처럼 두음소로 표상되는 경우도 있다. 그러나 두 음소 모두가 혀를 치아에 대고 누르기 때문에 치음이다. [t], [d], [s], [z], [n], [l] 및 [r] 음소들은 혀가 위쪽 앞니 바로 뒤에 있는 잇몸의 치조돌기를 누르기 때문에 치경음이라고 부른다. [sh], [ch], [j] 및 [y] 음소들은 혀가 치조돌기 바로 뒤의 입천장을 누르기 때문에 구개음이다. [k] 와 [g] 음소들은 혀가 입천장 뒤의 부드러운 부분을 누르기 때문에 연구개음이다.

[p], [b], [t], 및 [d] 음소들을 보자. 이들 넷 모두가 자음이다. 그러나 이 음소들은 유성음 여부와 조음 위치에 따라 구별된다. 표 1 은 이 네 자음을 두 세부 특징에 따라 분류한 것이다.

표 1  유성음 여부와 발성 장소에 따른 [b], [p], [d] 및 [t] 의 분류

발성 장소

유성음 여부

유성음

무성음

양순음

치경음

[b]

[d]

[p]

[t]

말의 지각에서 이 세부 특징들의 역할을 입증하는 증거들이 많다. 예를 들면, 밀러와 나이슬리 (Miller & Nicely, 1955) 는 피험자들에게 소음을 배경으로 제시된 [b], [d], [p] 및 [t] 를 재인하도록 하였다. 피험자들은 실제로 제시된 소리와는 다른 소리를 들었다고 생각하면서 혼란스러워했다. 실험자들은 피험자들이 어떤 소리를 혼동하는지 알고자 하였다. 피험자들이 단지 하나의 세부 특징만 다른 다음을 가장 혼동할 것이라고 생각되었는데, 이 예언이 입증되었다. 예를 들면, [p] 가 제시 되었을 때, 피험자들은 [d] 보다는 [t] 를 들었다고 생각하는 경우가 더 많았다. [t] 는 [p] 와 발성 장소만 다르지만 [d] 는 발성장소와 유성음 여부 모두에서 다르다. 비슷하게, [b] 를 제시 받은 피험자들이 [t] 보다 [p] 를 더 많이 들었다고 생각하였다.

이 실험은 앞서 보았던 키니 등 (Kinney, Marsetta, & Showman, 1966) 이 낱자 재인에서 발견한 논리를 입증한 것이다. 피험자가 하나의 패턴 (이 경우 음소가 패턴임) 에 내재된 세부 특징 중 어느 한 하위 세트밖에 파악할 수 없으면, 그 피험자의 반응들은 같은 하위 세트의 세부 특징을 공유하는 음소들의 혼동을 나타낼 것이다.
 

    음소들은 발성 장소 및 유성음 여부처럼 그 생성에 관여하는 세부 특징들에 의해 재인된다.

(2) 범주 지각

음소의 세부 특징이란 그 음소가 발성되는 특성을 말한다. 이 발성 세부 특징들을 약호화하는 음향자극 (acoustic stimulus) 의 특성들은 무엇인가? 이 문제는 유성음의 경우 특히 잘 연구되었다. [b] 와 [p] 같은 자음을 발음할 때, 닫혀진 입술이 열리면서 공기가 나오고 성대가 진동하기 (유성음) 시작하는 두 가지 일이 일어난다. 유성 자음 [b] 의 경우, 공기의 방출과 성대의 진동이 거의 동시에 일어난다. 무성 자음[p]의 경우, 공기의 방출은 성대가 진동하기 60 msec 이전에 일어난다. 유성 자음과 무성 자음 간의 구분은 60 msec 간격의 탐지 여부로 이루어진다. 이 시간 간격은 음성 개시 시간 (voice-onset time) 으로 불린다. [p] 와 [b] 간의 차이가 그림 19 에 나와 있다. 비슷한 차이가 [d] 와 [t] 같은 유성음-무성음 쌍에도 있다. 요컨대, 음소 지각을 결정하는 요인은 성대의 열림과 그 진동 간의 시간 지연이다.

리스커와 에이브럼슨 (Lisker & Abramson, 1970) 은 인공자극 (컴퓨터로 만든) 을 사용하여 성대의 열림과 진동 간격이 -150 msec (성대가 열리기 150msec 전에 진동함) 에서 +150 msec (성대가 열리고 150 msec 후에 진동함) 지연되도록 고안된 실험을 하였다. 과제는 어느 소리가 [b] 이고 어느 소리가 [p] 인지 파악하는 것이었다. 그림 20 은 [b] 또는 [p] 로 파악된 백분율이다. 연속선의 대부분에서 피험자들은 100 퍼센트 동의하지만, 약 25 msec 지점에서는 [b] 에서 [p] 로 예리한 변환을 보인다. 음성 개시 시간이 10 msec 일 때의 소리를 거의 [b] 라고 판단하는가 하면, 40 msec일 때는 거의 [p] 로 판단하였다. 범주적 지각 (categotical perception) 이란 분명한 범부에 속한 자극은 지각할 수 있지만, 범주가 희미한 자극은 지각할 수 없음을 뜻한다.

변별 과제를 이용하여 말의 지각이 법주적임을 입증하는 다른 연구들이 있다 (Studdert - Kennedy, 1976 참조). 피험자들은 같은 [b] 또는 같은 [p] 라도 음성개시 시간이 다르면 매우 낮은 변별력을 보인다. 그러나, 음성 개시 시간이 같으면서 하나는 [b]로 다른 하나는 [p] 로 파악되는 지점에서는 두 소리를 모두 잘 변별한다. 피험자들은 소리와 음소 범주만 파악할 수 있을 뿐 그 음소 범부 내에서 음향 (acoustic) 변별은 잘 하지 못한다. 이처럼, 피험자들은 두 소리가 음소 경계의 서로 다른 쪽에 떨어지기만 하면 그들을 변별할 수 있다.

범주적 지각이 정확히 무엇을 뜻하는지에 대하여 적어도 두 가지 견해가 있다. 약한 견해는 우리가 경험하는 자극이 상이한 범주에서 온다고 보는 것이다. 이런 의미에서는 음소의 지각이 범부적임은 논의의 대상이 아니다. 강한 견해는 범부 내에서는 자극들 간의 변별이 어렵다는 것이다. 마사로 (Massaro, 1992) 는 이 견해를 문제삼고 범부 내의 자극들을 변별할 수 있는 여력이 있음을 주장하였다. 그는 범주 내에서 변별의 빈약함은 범부내의 자극들 간에 변별의 여지가 있는데도 불구하고 피험자들이 그 자극들을 같다고 말하는 것을 반영한다고 주장한다.

말의 재인에서 유성음 여부를 세부 특징으로 사용한다는 증거를 보여 주는 다른 연구들이 있다. 아이마스와 코비트 (Eimas & Corbit, 1973) 는 피험자들에게 da 를 반복해서 들려 주었다.  이 소리에는 유성자음 [d] 가 포함된다. 실험자들은 유성 자음이 일정하게 반복되면, 그 유성음 유무에 반응하는 세부 특징 탐지기가 피로해지거나 순응될지 모른다고 생각하였다. 그 다음, 연구자들은 ba 와 pa 처럼 음향적 연속선상에 놓여 있는 일련의 인공음 들을 제시하였다. (앞서 언급한 리스커와 에이브럼슨의 연구처럼). 피험자들은 각각의 인공 자극이 ba 에 가깝게 들리는지 또는 pa 에 가깝게 들리는지를 지적해야 했다 (세부 특징상 ba 와 pa 간의 유일한 차이는 유성음 여부이다.) 아이마스와 코비트는 피험자들이 보통 유성음 ba 로 불렀던 인공 자극 중 어떤 것들을 그들이 이제는 무성음 pa 로 부름을 발견하였다. 이처럼, da 를 반복적으로 제시하면, 유성음을 분별하는 세부 특징탐지기는 피로하게 되고, ba 에서 유성음을 탐지하는 역치가 높아지므로 이전의 ba 자극이 pa 처럼 들린다.
 

    사람들은 음소들이 하나의 연속적 차원에서 다르더라도 이들이 별개의 범부에서 유래한다고 지각하는 경향이 있다.

4. 맥락과 패턴 재인

지금까지 생각해 온 패턴 재인에서 패턴 재인 체계가 쓸 수 있는 유일한 정보는 재인될 물리적 자극 내에 있는 정보이다. 그러나, 반드시 그렇지는 않다. 물체들은 맥락과 함께 존재하며 맥락은 물체의 재인을 돕는 역할을 한다. 그림 21 을 보자. H 와 A 를 나타내는 기화가 같은데도 불구하고 그 기호들을 THE CAT 으로 지각한다. 단어가 제공하는 일반 맥락이 적합한 해석을 부여한다. 맥락 또는 일반 세상 지식이 지각을 인도할 때, 이 과정을 하향처리 top-down processing) 라고 하는데, 높은 수준의 일반 지식이 낮은 수준의 지각 단위들을 해석하는 데 기여하기 때문이다. 지각에서 일반 쟁점은 하향적 영향이 자극으로부터의 상향정보 bottom-up information) 와 어떻게 조합되는가에 있다.

그림 21  맥락의 예, 같은 자극이 맥락에 따라서 H 또는 A 로 지각될 수 있다. Sekfridge,1955 )

하향 효과에 관한 주요 연구 흐름의 하나는 라이커 (Reicher, 1969) 와 휠러 (Wheeler, 1970) 를 비롯하여 여러 연구자들이 수행한 낱자 파악에 관한 일련의 실험들에서 나온다. 피험자들은 낱자 (D와 같은) 또는 단어 (WORD 와 같은) 를 매우 짧은 기간 제시 받았다. 그 후 즉시 피험자들은 한 쌍의 선택지를 받고 그 중에서 그들이 본 것을 보고하라는 지시를 받았다 (처음 제시 시간은 피험자들이 이런 파악 과제에서 많은 오반응을 낼 정도로 매우 짧았다). 만일 피험자들에게 D 가 제시되었으면, 선택지로 D 또는 K 를 제시 받는다. 만일 그들에게 WORD 가 제시되면, 선택지로 WORD 또는 WORK 를 제시 받는다. 두 단어들이 D 또는 K 에서만 차이가 남에 주목하라. 피험자들은 단어 조건에서 약 10 퍼센트 더 정확했다. 즉, 어떤 의미에서는 단어 맥락에서 네 배나 더 많은 낱자들을 처리했음에도 불구하고, 피험자들은 낱자 조건보다는 단어 맥락에서 D 와 K 를 정확히 변별하였다. 이 현상을 단어 우월성 효과 (word superiority effect) 라고 부른다.

러멜하트와 사이폴 (Rumelhart & Siple, 1974), 그리고 톰슨과 마사로 (Thompson & Massaro, 1973) 는 피험자들이 단어 조건에서 왜 더 정확한지를 설명하였다. 피험자들이 처음 세 낱자를 WORD 로 파악할 수 있다고 가정하자. 이제 WOR 로 시작하는 네 낱자 단어가 몇이나 되는지 보면, WORD, WORK, WORM, WORN, WORT 등이 있다. WOR 맥락에서, 그들은 그 자극이 WORD 임에 틀림없음을 알 것이다. 그러나 낱자가 단독으로 제시되면, 피험자들이 그 곡선을 탐지한다 해도 그 낱자가 B, D, C, O 또는 Q 인지 알 수 없는데, 이 낱자 각각이 곡선을 세부 특징으로 가지고 있기 때문이다. 이처럼, WOR 맥락에서는 네 번째 낱자가 D 를 파악하기 위하여 곡선 세부 특징만 탐지하면 되지만, 낱자가 단독으로 제시되면 그 낱자만을 유일하게 파악하기 위하여 더 많은 세부 특징들을 탐지해야 한다. 이 분석은 지각이 고도의 추론 과정임을 보여 준다. 피험자가 WOR 맥락에서 D 를 보기보다는, D 가 네 번째 낱자라는 추론을 더 잘 할 수 있다. 그러나, 피험자는 이 추론을 의식하지 못하고, 오히려 지각 중에 무의식적 추론을 한다. 특히 이 예에서 피험자는 밑부분이 곡선이라는 사실이나 D 와 K 중에 선택이 가능했다는 사실에 의식적으로 접근하지 않음에 주목하라. 오히려 피험자는 지각 체계가 추론한 단어 또는 낱자에만 의식적으로 접근한다.

이 예는 단어와 같은 복잡한 자극들의 용장도 (redundancy) 를 설명한다. 단어는 재인에 요구되는 것 이상의 많은 세부 특징들을 가지고 있다. 따라서, 단지 몇몇 세부 특징만 재인되면, 맥락이 나머지 세부 특징들을 보충하므로, 지각은 성공적으로 진행될 수 있다. 언어에서, 이러한 용장도는 세부 특징 이외에도 여러 수준에서 볼 수 있다. 예를 들면, 용장도는 낱자 수준에도 있다. 단어줄로 된 문장을 읽기 위해 단어줄에 있는 낱자 하나하나를 모두 지각할 필요가 없다. To xllxstxatx, I cxn rxplxce xvexy txirx lextex of xsextexce xitx an yox stxll xan xanxge xo rxad xt – ix wixh sxme xifxicxltx. (이에는 Lindsay & NorMan, 1977 에서 인용).

    단어 맥락은 낱자 재인에 필요한 세부 특징 정보를 보충하는 데 쓰인다.

(1) 문장 맥락의 효과

라이커- 휠러와 비슷한 효과를 털빙 등 (Tulving, Mandler, & Baumal, 1964) 이 문장 수준에서 보여 주었다. 다음은 그들이 사용한 문장의 예이다 :

각 문장은 핵심 단어 (이 경우에는 disorder) 앞에 여덟 – 단어 맥락을 두고 있다. 피험자들에게는 0, 4, 또는 8 개의 맥락 단어를 주고 표적 단어를 매우 짧게 제시하였다. 여러 조건에서 피험자들은 다음과 같은 문장들을 본다 :

이탤릭체는 먼저 제시되는 맥락 단어들이며 보통체 disorder 는 맥락 단어들이 제시된 후 제시되는 핵심 단어이다. 실험자들은 핵심 단어가 제시되는 시간을 0 에서 140 msec 로 변화시켰다. 그들은 상향 정보 (노출 시간에 의해 조절됨) 와 맥락 (단어 수에 의해 조절됨) 의 상호 작용에 관심이 있었다.

그림 22 는 실험 결과를 보여 준다. 단어를 정확하게 파악하는 확률은 맥락의 양과 노출 시간 모두가 늘어날 때 함께 증가한다. 피험자들은 단순히 추측한다고 여겨지는 0msec 노출 조건에서조차 맥락으로부터 이득을 얻고 있음에 주목하라.

이 노출 조건에서 피험자들은 0 맥락보다 8 맥락에서 16 퍼센트 더 우월한 수행을 보인다. 이 맥락 효과는 노출 시간이 길어지면서 더 커지는데, 60 msec 노출에서는 40 퍼센트 이상 그리고 가장 긴 140 msec 에서는 30 퍼센트 이상 더 우월한 수행을 보인다. (이 효과는 60 msec 와 140 msec 사이에서 다소 감소한다. 피험자들이 8 맥락에서 거의 완벽하게 수행하고 있으나 그 이상 노출에서는 거의 이득을 보이지 못하는 반면, 0 맥락에서는 노출 시간이 길어지면 계속 이득을 나타내기 때문이다.) 이 결과는 단어를 좀더 잘 파악하기 위하여 맥락을 사용할 수 있음을 시사한다. 라이커 – 휠러 낱자 파악 패러다임에서처럼, 피험자들은 단어 파악에 필요한 지각 정보의 양을 줄이고 맥락 정보를 사용하고 있다.

털빙 등의 실험은 문장 맥락이 단어 파악에 도움이 됨을 보여 준다. 맥락이 있으면 단어 파악을 위해 단어 자체로부터 적은 정보만 있어도 된다. 사실상, 맥락을 사용하면 앞의 문장 예 (Lindsay & Norman, 1977) 에서 처럼 문장에 없는 단어를 채워 넣을 수 있다. 아마도 여러분은 문장을 읽어 나가면서 생략된 단어를 채워 넣을 수 있었을 것이고, 단어가 생략된 것조차 깨닫지 못했을 것이다.
 

    문장 맥락은 단어 재인에서 세부 특징 정보를 보충하는 데 쓰일 수 있다.

(2) 맥락과 말

말의 지각에서 똑같이 맥락의 역할을 보여 주는 좋은 증거가 있다. 이를 잘 보여 주는 예가 워렌 (Warren, 1970) 의 음소 복원 효과 (phoneme-restoration effect) 이다. 그는 피험자들에게 "The state governors met with their respective legislatures convening in the capital city" 라는 문장을 들려 주면서, legislatures 의 가운데 s 대신 120 msec 의 공백음을 삽입시켰다. 이 공백음을 들은 사람은 20 명 중 단 한 명이었으나, 그 피험자도 그 음의 정확한 위치를 알지 못했다.

이 처음 연구를 더 발전시킨 것이 워렌과 워렌 (Warren & Warren, 1970) 의 실험이다. 그들은 피험자들에게 다음과 같은 문장을 제시했다.

각 문장에서 * 는 말이 아닌 소리로 대체된 음소이다. 위의 네 문장에 대하여, 피험자들은 맥락에 따라 wheel, heel, peel 및 meal 을 들었다고 보고했다. 각 문장에서 주목해야 할 중요한 특징은 문장 내용이 핵심 단어의 위치까지 모두 같다는 것이다. 핵심 단어의 파악은 후속 단어에 따라 결정된다. 이처럼, 단어 파악이 때로는 즉각적이지 않고 후속되는 단어에 의존하기도 한다.
 

    맥락은 말의 재인에서 세부 정보를 보충하는 데 쓰일 수 있다.

(3) 맥락과 얼굴 및 장면 재인

지금까지의 논의는 글이나 말과 같은 언어 재료를 지각할 때 맥락이 어떤 역할을 하는지에 초점을 두었다. 얼굴과 같은 과잉 학습된 패턴을 처리할 때도 언어 자극에서처럼 세부 특징과 맥락 간의 상호 작용이 있다. 팔머 (Palmer, 1975) 의 연구에서 쓰여진 자극이 그림 23 에 있다. 그는 얼굴 맥락에서 코, 눈, 귀, 입술과 같은 각 부분을 재인하는 데 세부 특징 정보가 거의 요구되지 않음을 지적하였다. 한편, 이 부분들이 분리되어 제시되면, 그들을 재인하는 데 상당히 많은 시각적 세부 내용이 필요하다.

맥락은 복잡한 시각 장면의 지각에도 중요하다. 비더만 등 (Biederman, Glass, & Stacy, 1973) 은 신기한 장면에서의 물체 지각을 살펴보았다. 그림 24 는 피험자들에게 제시한 두 종류의 장면이다. a 는 정상적 장면이고, b 는 뒤섞인 장면이다. 장면이 스크린에 짧게 제시된 후, 어떤 물체가 있었던 위치가 화살표로 표시되었다. 피험자들은 화살표 위치에 있었던 물체가 무엇인지 질문 받았다. 예를 들면, 소화전이 있었던 장소에 화살표가 표시되기도 하였다. 피험자들은 뒤섞인 그림보다는 일관된 그림에서 표적 물체를 훨씬 더 정확하게 파악하였다. 글이나 말의 처리처럼, 물체를 더 잘 파악하기 위하여 시각 장면의 맥락을 활용할 수 있다.

    맥락은 얼굴과 장면의 재인에서 세부 특징 정보를 보충하는 데 활용된다.

(3) 맥락과 세부 특징 조합을 위한 마사로의 FLMP 모형

지금까지 여러 가지 상황에서 맥락이 패턴 재인에 주는 효과를 살펴보았지만, 이 효과를 어떻게 개념화할 것인지는 아직 의문이다. 두 대안이 제안되어 왔다. 한 가지 제안은 맥락과 자극은 그 패턴이 실제로 무엇인지에 관해 두 독립적 정보원을 제공한다는 것이다. 마사로 (Massaro, 1979) 의 낱자 재인 실험은 이런 입장을 잘 보여 준다. 그림 25 는 c 와 e 재인에 사용한 재료이다. 네 개의 사각판은 맥락 증가의 양에서 네 가지 가능성을 보여 준다. 즉, e 만이 단어를 만들 수 있거나 c 만이 단어를 만들 수 있거나, 두 글자 모두가 단어를 만들 수 있거나, 또는 어느 글자도 단어를 만들지 못한다. 한 사각판에서 아래로 내려가면서, e 에 대한 증거는 증가하고 c 에 대한 증거는 감소한다. 피험자들에게 이 자극들을 짧게 보여 주고 그 글자를 파악하게 하였다. 그림 26 은 맥락과 자극 정보의 함수이다. 글자 e 에 대한 증거가 많을수록, 피험자가 e 를 말하는 확률은 증가한다. 비슷하게, 맥락이 더 많은 증거를 제공할수록 그 확률은 증가한다.

 

마사로는 이 자료가 맥락으로부터의 증거와 낱자 자극으로부터의 증거의 독립적 조합임을 반영한다고 주장하였다. 그는 낱자는 낱자 c 에 대한 증거 Lc 를 반영하고 맥락은 낱자 c 에 대한 증거 Cc 에 대한 증거 Cc 를 제공한다고 가정한다. 그는 이 증거가 0 에서 1 까지의 척도상에서 '애매한 참값 (fuzzy truth values)' 이라고 부르는 일종의 확률로 표시될 수 있다고 생각한다. 확률의 합은 1 이므로, 낱자 e 에 대하여 낱자로부터의 증거 Le=1 – Lc 이고 맥락으로부터의 증거 Cc=1 – Cc 이다. 이 확률이 주어지면 c 에 대한 전체 확률은,

이다. 그림 26 의 선분들은 그의 이론을 예언한다. 일반적으로 마사로의 이론 (FLMP-fuzzy logical model of perception) 은 패턴 재인에서 맥락과 자극의 조합을 잘 설명한다.

 

위의 등식이 정확히 어떤 의미에서 자극과 맥락 정보를 독립적으로 조합하는지 의문을 가질 수 있다. 이것은 통계 추론에서 베이스 이론 (Bayesian theory) 으로 규명된다. 베이스 이론은 가설 (dl 경우 낱자가 e 라는 가설) 의 증거로 두 정보원이 있고 그 두 증거가 확률적으로 독립되었으면, 그들은 위의 등식으로 조합될 수 있다고 제안한다. 확률적 독립성은 자극의 세부 특징이 제공하는 증거가 맥락에 의존하지 않음을 뜻한다. 이 독립적 가정은, 예컨대, 인쇄된 e 가 그것이 속한 단어에 의존하고 있으면, 위반된다.
 

    마사로의 지각에 대한 FLMP 모형은 지각되는 패턴을 결정하기 위하여 맥락 정보는 자극 정보와 독립적으로 조합된다고 가정한다.

(4) 낱자 지각을 위한 PDP 모형

맥클레랜드와 러멜하트 (McClelland & Rumelhart, 1981) 는 패턴 재인에서 자극과 맥락 정보의 조합을 설명하기 위해 매우 다른 모형을 제안하였다. 그림 27 은 그들이 낱자 재인을 촉진시키는 데 사용한 단어 구조를 모형으로 한 패턴 재인 망조직의 일부이다. 이 모델에서, 수직 막대와 같은 세부 특징들은 낱자를 만드는 데 조합되며 개별 낱자들은 단어들을 만드는 데 조합된다. 이것은 1 장에서 논의된 연결주의 모형과 같다. 이 모형은 흥분 및 억제 활성화 과정에 많이 의존한다. 활성화는 세부 특징들에서 낱자로 그리고 낱자에서 단어들로 그 흥분이 흐른다. 양자 택일의 관계에 있는 낱자들과 단어들은 서로 억제한다. 활성화는 단어에서 낱자로 흐르기도 한다. 이렇게 단어는 낱자의 활성화를 지원하며 그 재인을 돕는다. 예를 들면, 세 번째 위치의 수평 막대는 I 보다는 A 로 해석하도록 돕고 연이어 TPIP 보다는 TPAP 으로 지각하도록 돕는다. TPAP 에 관한 증거가 있는 한 적절한 위치에 있는 T, R, A 및 P 의 개별 낱자와 그들을 만들고 있는 세부 특징들의 지각이 쉬워진다.

이러한 체계에서, 활성화는 한 단어에 쌓이고 다른 단어들의 활성화를 억제하는 경향이 있다. 지배적 단어는 그 구성 낱자들의 활성화를 지원하고, 이 낱자들은 선택의 여지가 있는 다른 낱자들의 활성화를 억압한다. 단어 우월성 효과는 단어가 그 구성 낱자에 주는 지원의 결과이다. 맥클레랜드와 러멜하트의 활성화 모형은 신경 과정을 시뮬레이트하는 여느 모형의 계산처럼 매우 복잡하다. 그러나, 그들은 그 체계 내에서 단어 재인에 관한 여러 결과들을 재산출할 수 있다.

이 모형은 맥락으로부터의 하향 세력이 낱자에 대한 실제 민감성에 영향을 줄 수 있다고 예언한다. 이것은 맥락과 자극 정보가 독립적으로 조합된다고 주장하는 마사로의 FLMP 모형과 상당히 다르다. 마사로 (Massaro, 1981) 는 PDP 모형이 맥락 정보와 모순되는 자극 정보의 효과에 매우 둔하다고 주장했다. 그는 말 지각에 영향을 주는 맥락 효과에 관하여 이 주장을 폈다. 그의 한 실험에서 피험자들은 [t] 또는 [s] 로 시작하는 철자에서 [r]부터 [l] 까지의 연속선상에서 변하는 음소를 들었다. 영어에서는 [r] 만이 [t] 다음에 오고 [l] 만이 [s] 다음에 온다. 앞의 연구에서처럼, 피험자들은 [r] 이 [t] 맥락에서는 더욱 [r] 처럼 들린다고 생각하는 경향을 보이면서, 소리와 맥락의 영향 모두를 보여 주었다. 그림 28 은 다소 모양을 갖춘 결과를 보여 준다. 맥클레랜드와 엘먼 (McClelland & Elman, 1986) 은 흔적 모형 (TRACE mode) 이라고 부른 이 과제의 수행에 PDP 모형을 제안하였다. 그림 28   은 산출된 결과들이 일정한 양식으로 변한 모습을 보여 준다. 자극 정보와 맥락의 효과를 그림에서 확실히 볼 수 있다. 그러나 자료에서 보여 주는 것 이상으로 훨씬 더 강한 맥락 효과를 보여 준다. 흔적 모형은 [s] 맥락에서 [r] 의 증거가 매우 많을 때 [l] 가설을 고집하다가 갑자기 그 가설을 바꾼다. 대조적으로 피험자들은 더 일찍 그러나 좀 더 서서히 변한다. t 맥락에 대한 흔적 곡선은 반대 효과를 보여 준다. 마사로는 "상호 활성화 모형은 최적 모형이 아니라고 생각하며, 그 이유는 처리 체계로 하여금 합리적 수준 이상으로 환경 입력을 왜곡하기 때문 " (massaro, 1981. p. 420) 이라는 결론을 내렸다.

맥클레랜드 (McClelland, 1991) 는 상호 활성화 모형의 이러한 문제는 활성화 값이 다소 변할 수 있다고 가정하면 쉽게 개선될 수 있음을 보여 주었다. 그러면 이 모형은 한 낱자에서 다른 낱자로 지각이 서서히 바뀌는 것을 예언한다. 마사로와 코헨 (Massaro & Cohen, 1991) 은 이렇게 수정된 모형으로는 예언에 여전히 어려움이 있음을 맥클레랜드에게 지적하였다. 마사로의 FLMP 모형은 자극 정보와 맥락이 어떻게 통합되는지를 매우 잘 기술한다. 그러나, 그것은 PDP 모형보다는 높은 수준의 설명이므로 인접한 낱자들의 처리가 상호 지각을 어떻게 결정하는 지와 같은 세부 기술에는 관여하지 않는다. PDP 모형과 같은 연결주의가 그런 효과를 산출할 수 있고, 그림 27 은 이 일이 어떻게 일어나는지를 보여 주지만 그 과정이 그런 망조직에서 정확히 어떻게 일어나는지 이해하기가 매우 어렵다는 결론이 바람직하다.

PDP 모형의 구체적인 장점은 맥락 효과를 명백히 분석한다는 점이다 단어 조건에서 낱자 D 를 재인하기 위한 맥락은 WOR 과 같은 글자 세트이다. 이 글자들은 표적 낱자 D 가 지각되자마자 동시에 처리되어야 한다. 네 번째 D 의 존재는 다른 세 글자의 존재가 D 의 지각에 영향을 주듯이 이 세 글자의 지각에 영향을 줄 것이다. 이 모형에서는 마사로의 FLMP 모형이 했던 것처럼 맥락과 낱자를 분리해서 평가할 수 없다. 이러한 상호 작용 효과가 발생하는 경우 MAVE 와 같은 규칙적 비단어 (nonword) 의 지각에서이다 (McClelland & Johnston, 1977). 낱자 A 의 재인은 CAVE 와 같은 단어 맥락에서 잘 된다. 그 이유는 MAKE 와 SAVE 처럼 MAVE 와 비슷하게 두 번째 A 가 있는 단어들이 많기 때문이다. M_V E 맥락이 A 와 맞지 않지만, MAVE 는 두 번째 위치에 A 가 있는 단어들과 비슷하기 때문에 A 의 지각을 촉진시킨다. 이 예는 실제로 맥락과 자극은 없으며 오히려 서로 지각에 영향을 주는 네 낱자만 있다는 지적을 하게 만든다.
 

    PDP 모형은 신경 계산이 패턴 재인을 결정하기 위하여 자극과 맥락 정보를 어떻게 조합하는지를 보여준다.

5. 결 론

그림 29 는 시각에서 지각 정보 처리의 흐름을 추상적으로 스케치한 것이다. 지각은 외부 환경의 빛 에너지에서 시작한다. 망막에 있는 수용기들은 이 에너지를 신경 정보로 바꾼다. 초기 감각 처리는 정보에 관한 초기 감각을 만드는 데 관심이 있다. 그림 29 는 마 (Marr, 1982) 의 모형이 제안한 세 단계를 보여 준다. 세부 특징들은 마 (D. Marr) 의 원시 스케치 (primal sketch) 산출을 위해 추출된다. 이 세부 특징들은 공간상 표면의 위치를 표상하기 위하여 깊이를 지닌 정보로 조합되는데, 마는 이를 2 ½ - D 스케치라고 불렀다. 체제화의 원리는 요소로 분할하는 데 적용되며, 이것이 3 - D 스케치이다. 마지막으로, 이 물체들의 세부 특징과 일반적 맥락 정보가 조합되어 이 물체들을 재인하게 된다. 이 수준의 출력이 소위 의식되는 지각으로서, 물체와 그것의 환경 내 위치 표상이다. 이 정보는 고급 인지 과정으로의 입력이다. 그림 29 가 지적하는 것 중의 하나는 우리가 지각하는 물체를 의식적으로 알아채기 전에 수많은 정보 처리 과정이 일어나야 한다는 것이다.

6. 일러두기와 읽을 거리

이 장에서 다룬 내용들은 하나의 지각 과목으로 쉽게 확장될 수 있으며, 많은 대학들이 이 과목을 개설한다. 지각 과목은 특히 기본 감각 과정의 연구 결과들을 핵심적으로 다룬다. 이 과정에 관한 생리적 증거가 많으므로, 생리학과 심리학 경험이 직접 연결될 수 있다. 감각과 지각 연구를 넓게 개관한 기본 각론서로는 골드스타인 (Golidstein, 1989), 로크 (Rock, 1984). 그리고 세쿨러와 블레이크 (Sekuler & Blake, 1985) 가 있다. 핀커와 울먼 (PIinker & Ullman, 1989) 은 물체 재인과 관련된 최근 논의를 다룬다. 플라우트와 파라 (Plaut & Farah, 1990) 는 물체 재인을 개관하며, 타르 (Tarr, 출판중) 는 물체 재인에 관한 생리학을 개관한다. 깁슨 (J. Gibson, 1950, 1966, 1979) 은 이 장에서 다룬 것과는 매우 다른 영향력 있는 지각 이론을 발전시켰다. 나이서 (Nisser, 1976) 는 깁슨의 영향을 보여 주는 지각, 주의 및 인지를 개관한다.