正如眼动研究所揭示的结果,熟练阅读者可以非常快速地阅读书面文本(Rayner,1998)。熟练阅读者注视一个单词的平均时间为200~250 ms(Dimigen et al.,2011)。这一段很短的时间代表着一个单词最核心的信息得到加工,且眼睛已开始移到下一个单词的最长时间。这种高速的阅读需要大脑快速的活动,从而保证阅读者能够识别单词。

使用ERP技术进行研究发现,N1成分对文字很敏感。通常,与视觉特征匹配的控制刺激如符号串(symbol string)相比,视觉词汇引起的N1要更大(Bentin et al.,1999;Maurer et al.,2005b)。在这些ERP研究中,研究者请被试注视文字及符号串等刺激,在看到前后呈现的两个刺激是一样的时就按键做出反应。在这种任务条件下,视觉词汇诱发的N1比符号串诱发的N1更大(Brem et al.,2005;Maurer et al.,2005a;Maurer et al.,2005b;Brem et al.,2006;Eberhard-Moscicka et al.,2014)。在成人被试中,这类刺激所诱发的N1成分发生在枕颞部电极,在刺激呈现后的130~230 ms出现,并在150~180 ms时达到高峰(Maurer et al.,2005b;Maurer et al.,2008b;Eberhard-Moscicka et al.,submitted)。在一些研究中,N1成分也被称为N170,因为N1成分的波幅在刺激呈现后的170 ms达到最高。但是,这种形式的命名在发展研究中是有问题的。一项研究选取了101名一年级末期(7.5岁)的儿童,测查了儿童在重复探测任务中的文字粗略调制效应及词汇效应。研究发现,由于成熟的影响,儿童N1峰值的潜伏期是比较长的(图2-1)。N1 的地形图分布不仅包括枕颞部电极所表现出的负波,还包括前部中线电极所表现出的相应的正波(Maurer et al.,2005b)。N1对文字(与符号串相比)的敏感性主要反映了对文字的粗略调制(Maurer et al.,2005b),正如当伪词与符号相比也能观察到同样的N1敏感性一样。同样,真词与伪词所诱发的N1的差异是很小的。而且在内隐阅读任务中,真词与伪词的N1差异是非常不稳定的。进一步说,如果视觉控制刺激与真词的匹配程度非常接近,如用线条或者笔画组成字母或汉字,那么真词与伪词的N1差异就变得很小了(Schendan et al.,1998;Xue et al.,2008)。最近一项研究采用与文字匹配很好的非字符号(false-font)作为控制条件,发现在N1成分的早期就可以探测到非常强的文字调制效应(文字大于非字符号),而在N1成分的后期,非字符号的反应要强于文字(Eberhard-Moscicka et al.,submitted)。与成人不同的是,儿童的文字调制效应非常清晰,看起来并不那么依赖于视觉控制条件的选择(图2-1)。

来自跨文化的不同文字系统的研究表明,文字N1与控制刺激N1之间的差异反映的是阅读经验带来的影响,而不仅仅是不同刺激的属性所导致的。正是如此,与伪字/词相比,中英双语被试对于熟悉的英文词和汉字表现出更强的N1,而英语单语被试只对英文表现出更强的N1,而不熟悉的汉字及伪词刺激的N1则减弱(Wong et al.,2005)。类似地,与母语为英语的单语被试相比,日语—英语的双语被试对于熟悉的日文字母和日文汉字表现出更强的左侧化N1(Maurer et al.,2008b)。这些结果可以用物体及面孔加工领域发展出的视觉专家化的理论框架来解释。

图2-1 儿童在重复探测任务中的文字粗略调制效应及词汇效应

研究也表明,N1成分对面孔及熟悉的物体也有类似的敏感性。与打乱的面孔刺激相比,真实面孔的N1更强(Bentin et al.,1996)。与此类似,研究鸟类的专家在注视鸟类及狗类的图片刺激时,鸟类图片引发的N1会大于狗类图片引发的N1,而研究狗的专家则表现出相反的模式(Tanaka & Curran,2001)。这些效应都被解释为视觉专家化效应,即通过学习,视觉系统会与特定的视觉信息协调起来(Tanaka & Curran,2001)。在这个意义上说,阅读可以看成儿童在学习阅读过程中获得的视觉专家化的一种形式(McCandliss et al.,2003)。

但很重要的一点是,对面孔和物体的典型N1反应是右侧化的,而对于视觉文字的N1反应通常是左侧化的(Rossion et al.,2003;Maurer et al.,2008a)。研究者提出两种假设来解释阅读早期视觉加工的左侧化现象。根据语音匹配假设(phonological mapping hypothesis),视觉词汇加工的左侧化是由在学习过程中来自高水平的、左侧化的、参与语音加工的语言区的自上而下的影响来驱动的(Maurer & McCandliss,2007)。另外一种假设认为,偏侧化的差异可能是对应于文字与面孔刺激视觉属性上表现出的差异(Mercure et al.,2008;Hsiao & Lam,2013)。文字包含大量的高空间频率的视觉信息,这些信息可能偏向于在大脑的左半球得到加工。相反,面孔包含了一些可能偏向于在右半球加工的低空间分辨率信息。目前,视觉词汇N1左侧化的原因仍然是不清楚的,对这一问题的回答可能会与上文提到的正字法加工的模型有关。

由于脑电图技术低空间分辨率的局限,我们还很难知道文字N1敏感性的确切脑定位,但是已有一些证据表明N1成分与VWFA的激活存在着对应关系。这样的结果也得到了MEG研究的证实。脑磁图研究具有像脑电研究一样的高时间分辨率,同时由于其减少了信号远距离源的扭曲,就允许有更可靠的脑定位估计(Banaschewski & Brandeis,2007; Babiloni et al.,2009)。研究已表明,在200ms内对文字粗略调制的 MEG 源同样位于枕颞区的下部(Tarkiainen et al.,1999)。另外一些证据来自于安放颅内电极的神经生理学研究。正常人类被试的脑电只能在头皮表面得到记录,但在患有不能矫治的癫痫病人手术前(这种情况很少有),是可以从其颅内皮层记录到脑电活动的。在这样的病人身上,文字敏感性的神经激活发生在大约200ms时的腹侧枕颞皮层(Allison et al.,1994)。另外一些来自于脑电数据的溯源分析以及脑电与功能成像联合研究的数据也发现了一致的证据。这些研究中对事件相关电位的源估计发现,N1的源位于大脑后部及枕颞区下部(Maurer et al.,2005b;Brem et al.,2006;Brem et al.,2009),这一区域与相同被试fMRI 的激活位置是对应的(Brem et al.,2006;Brem et al.,2009)。