当前位置:首页 > 文献频道 > 临床内科学 > 文献详细

《眼科学》

低通滤波下影响汉字辨认正确率的因素初探

发表时间:2009-10-14  浏览次数:643次

低通滤波下影响汉字辨认正确率的因素初探作者:郭迎暄,王晨晓,贺极苍,陈湘君,吕帆    作者单位:温州医学院附属眼视光学院,浙江 温州 325027    【摘要】  目的 探讨字频、空间频率、笔画数和近视程度对汉字图片辨认正确率的影响。方法 矫正视力或裸眼视力不低于1.0的33位被试者参加本实验,按照近视程度分成高、中、低度近视三组,测量他们在110 cm距离处对3种笔画数(少、中、多)、2种字频(常用字和生僻字)和9个截止空间频率(1.00 cpc、1.25 cpc、1.58 cpc、1.99 cpc、2.51 cpc、3.98 cpc、6.30 cpc、9.98 cpc、无滤波)随机组合的低通滤波下汉字图片辨认的正确率。对每位被试者的测试结果进行最小二乘法拟合,得到汉字临界截止空间频率及最大辨认正确率。结果 少笔画汉字组:常用字和生僻字的临界截止空间频率均值分别为(1.73±0.71)cpc和(2.20±0.68)cpc,最大辨认正确率均值为(99.33±0.09)%和(99.18±0.10)%;中笔画汉字组:常用字和生僻字的临界截止空间频率均值分别为(1.89±0.14)cpc和(2.38±0.25)cpc,最大辨认正确率均值为(98.93±1.04)%和(96.00±2.35)%;多笔画汉字组:常用字和生僻字的临界截止空间频率均值分别为(2.43±0.63)cpc和(6.17±1.41)cpc,最大辨认正确率均值为(97.02±0.35)%和(88.59±1.33)%。相同空间频率和笔画数组,常用字与生僻字的辨认正确率差异显著(P<0.01)。截止空间频率≤2.51 cpc时,汉字辨认正确率差异显著(P<0.01);截止空间频率>2.51 cpc时,汉字辨认正确率差异无显著性(P=0.392)。不同近视程度组汉字辨认正确率差异没有统计学意义(P>0.05)。结论 低通滤波下汉字图片辨认的正确率受到字频、笔画数和空间频率成分的影响,但是不受近视程度影响。     【关键词】  空间频率,低通滤波,字频,辨认模式     Exploration of the factors that affect the correct identification rate of low-pass filtered Chinese characters GUO Yingxuan, WANG Chenxiao, HE Jicang, et al.Hospital of Ophthalmolgy and Optometry, Wenzhou Medical College, Wenzhou China, 325027  [Abstract] Objective To investigate the influence of word frequency, spatial frequency, character strokes and myopia status in identifying Chinese characters. Methods Thirty-three subjects with best corrected or uncorrected habitual visual acuity ≥20/20 in both eyes were enrolled in this study. They were divided into three groups: low myopes, moderate myopes and high myopes. Low-pass filtered Chinese characters contained three stroke categories (sparse strokes, medium strokes and dense strokes, based on the number of strokes in the characters), two word frequencies (common characters and rare characters) and nine low-pass spatial frequencies (1.00 cycle/character, 1.25 cpc, 1.58 cpc, 1.99 cpc, 2.51 cpc, 3.98 cpc, 6.30 cpc, 9.80 cpc and unfiltered). The factors were randomly selected for presentation. Identification of the correct rate was measured at a distance of 110 cm. The correct identification rate of each subject was fitted using the least square method. Results In the sparse-stroke Chinese character group, the means of the critical cut-off spatial frequencies for common characters and rare characters were 1.73 cpc and 2.20 cpc, respectively, and the means for the correct identification rate were 99.33% and 99.18%. In the medium-stroke Chinese character group, the means of the critical cut-off spatial frequencies for common and rare characters were 1.89 cpc and 2.38 cpc, respectively, and the means for the correct identification rate were 98.93% and 96.00%. In the dense-stroke Chinese group, the means of the critical cut-off spatial frequencies for common and rare characters were 2.43 cpc and 6.17 cpc, respectively, and the means for the correct identification rate were 97.02% and 88.59%. For the same stroke and spatial frequency, the means of the correct identification rate of common and rare Chinese characters were significantly different (P=0.001). When cut-off frequency was ≤2.51 cpc, the correct identification rates for different spatial frequencies were significantly different (P=0.001), but when the cut-off frequency was >2.51 cpc, the correct identification rates for different spatial frequencies were not significantly different (P=0.392). Myopia status did not affect the correct identification rate for Chinese characters (P>0.05). Conclusion Word frequency, spatial low-pass filter frequency and stroke density impact the correct identification rate for Chinese characters, but myopia does not have an effect.  [Key words] spatial frequency; low-pass filtered; word frequency; identifying model    汉字辨认的难易程度与其字频、笔画数、对比度、对比极性(白纸黑字和黑纸白字)相关,同时人眼视觉系统对视觉图形信息的处理具有空间频率通道分析特征,这些通道具有带通滤波特性,即每个通道只对空间频率中某一特定空间频率段具有最佳反应[1],故汉字的空间频率成分也是决定视觉信息处理的重要因素。在应用光学中,空间频率是指每毫米所有的光栅数,单位“线/mm”;在视觉研究领域,它是指单位视角内明暗条纹重复出现的周期数,或正弦状浓淡变化的重复次数,汉字空间频率成分的单位可采用周/字(circle per character,cpc)[2]。字频是指一个字的使用频率,也就是使用次数。低通滤波是指把图像看成一种二维信号,对其进行基于二维傅立叶变换的信号滤波,只让低频信号通过的方法。截止空间频率是指汉字图片中低于该频率的空间频率成分全部被保留,高于该频率的空间频率成分全部被去除。临界截止空间频率是指辨认正确率达到拟合后最大值时的最小空间截止频率。本实验通过采用Matlab 6.5软件对汉字进行低通滤波处理,来探讨各因素对汉字图片辨认正确率的影响和视觉系统对汉字的不同处理模式。1 资料和方法  1.1 一般资料 33例被试者学历均在本科及以上,远、近矫正视力≥1.0,无眼部疾病史,无阅读障碍史,其中男性16例,女性17例,年龄19~32岁,平均为(26.5±2.1)岁;所有被试者的屈光状态如下:球镜度数为0~-8.50 D,平均为(-4.92±2.21)D,柱镜度数为0~-1.25 D,平均为(-0.11±0.28)D。按照近视程度将被试者分为低度(屈光度<-3.00 D)、中度(≥-3.00 D and <-6.00 D)、高度近视组(≥-6.00 D),各11例,实验前予以戴镜矫正,远、近矫正视力均达到1.0或以上。  1.2 实验材料 根据字频将汉字分为高字频的常用字和低字频的生僻字,常用字从《现代汉语常用字表(2500字)》中选取[3]。2500个常用汉字的平均笔画数为9.17画,即9画数汉字最多,其次为8画数和10画数汉字。因此将8、9、10画汉字定义为中笔画数组,3、4、5画汉字定义为少笔画数组,13、14、15画汉字定义为多笔画组[2]。生僻字选自2500个常用汉字以外,参照常用汉字的分组原则,也分为少、中、多笔画数组。截止空间频率分别采用1.00、1.25、1.58、1.99、2.51、3.98、6.30、9.98周/字(cpc),前5个增率为0.1对数单位(约1.2589),最后3个增率取0.2对数单位(约1.5848),并制作无滤波汉字图片作对照。图片材料是64点宋体汉字图片,各频率图像的对比度范围为61.4%~87.7%,实际物理大小为1.87 cm的正方形,需要辨认的汉字图片共540张,包含9个截止空间频率,3种笔画数,2种字频,每种截止频率包含10个不同的汉字。同时包括带22 cm×14 cm长方形洞的不透明遮光板,Gif动画制作软件,Matlab 6.5版本应用程序,Photoshop 7.0.1版本应用程序。各空间频率段汉字图像如图1。  1.3 实验装置及条件 19寸LG液晶显示器一台。屏幕分辨率为1280×1024,背景亮度为120 cd/m2,对比度98.4%,桌面照度为149 lux。在测试距离110 cm处,汉字图片高度所对应的视角为1°。  1.4 图片呈现顺序 为避免汉字的启动效应,实验汉字以随机方式显示;为均衡各组之间的相互影响,使用rand( )函数对图片组的呈现顺序做随机化处理,使每组图片随机呈现。每次仅有一张汉字图片呈现在屏幕上,速度由被试者自己控制,每张图片的呈现均在屏幕上的同一位置。  1.5 实验过程 被试者在综合验光仪上用规范化验光程序测得屈光状态及最佳矫正视力,本实验选取最佳矫正视力≥1.0的被试者。实验前,被试者填写《阅读实验被试者备案资料》,阅读《实验指导说明》,观看介绍实验用的图片,熟悉实验流程,并进行实验前的图片辨认练习。正式实验时,在带有遮光板的计算机屏幕上,用Gif动画制作软件呈现出包含一个汉字的图片,被试者在屏幕前110 cm处,以最准确、最快的速度低声读出该汉字,而后自己控制键盘按钮,呈现下一张图片,直到读完该组的10张图片,然后根据随机化处理结果选取包含不同空间频率、笔画数和字频组合的下一组图片,和上一组一样进行诵读。如果遇到有读不出的生僻汉字,可以写出或将偏旁部首读出;如看不清楚则尽量猜测辨认。共有54组需要辨认,每辨认20 min后休息5 min,本实验大约持续1 h。实验结束后,根据公式:辨认正确率=(每组总字数-读错的字数)/总字数×100%,计算辨认正确率。  1.6 统计学方法 所有数据采用SAS 8.0版本的统计软件进行分析,对每位被试者的空间频率和辨认正确率进行最小二乘法拟合处理。各因素对辨认正确率的影响采用多因素方差分析后进行两两检验。2 结果  2.1 临界空间截止频率 将每一位被试者的空间频率和辨认正确率进行最小二乘法拟合,得到截止空间频率——辨认正确率曲线,拟合曲线的交点为达到最大辨认正确率时对应的临界截止空间频率。不同的截止空间频率对应的最大辨认正确率均值结果见图2,其中在3.98、6.30和9.98 cpc时已经达到最大值100%。统计分析,当截止空间频率≤2.51 cpc时,汉字辨认正确率差异有显著统计学意义(P<0.01);截止空间频率>2.51 cpc时,汉字辨认正确率差异无统计学意义(P=0.392)。  2.2 常用字和生僻字之间的差异 对33位被试者的临界截止空间频率及辨认正确率拟合后的均值进行配对t检验,结果见表1。各笔画数组之间临界截止空间频率差异有显著统计学意义(P<0.01),对应的最大辨认正确率差异也有显著统计学意义(P<0.01)。随着汉字笔画数的增加,临界空间频率也随之增大,但是相应的最大辨认正确率却随之变小。  2.3 近视程度对辨认正确率的影响 不同近视程度的被试者对所有汉字图片的辨认结果拟合见表2,统计学分析显示,不同近视程度被试者的临界截止空间频率差异没有统计学意义(P=0.823),汉字辨认正确率的差异也没有统计学意义(P=0.499)。  2.4 笔画数、字频、空间频率和近视程度对辨认正确率的影响 对被试者的辨认正确率进行多因素方差分析,笔画数主效应显著(F=289.399,P<0.01),字频主效应显著(F=355.600,P<0.01),空间频率主效应显著(F=5880.428,P<0.01),近视程度的主效应不显著(F=1.632,P=0.196);笔画数和字频交互作用显著(F=31.882,P<0.01),笔画数和空间频率交互作用显著(F=102.309,P<0.01),字频和空间频率交互作用显著(F=105.485,P<0.01),并且三因素的交互作用也显著(F=25.876,P<0.01),近视程度仅与空间频率交互作用显著(F=2.825,P<0.01),和其他因素交互作用均不显著(P>0.05)。3 讨论  实验结果显示,在低通滤波下,同一截止空间频率的汉字图片,随着笔画数的增加、字频的减少,辨认正确率下降,说明汉字的辨认受到空间频率、笔画数和字频因素的影响,但是当字频和笔画数固定时,超过临界截止空间频率,图片的辨认正确率就不再受空间频率的影响,达到一个平台期。对这三种因素影响汉字辨认的原因分析如下:由于汉字辨认过程中存在着“自上向下”和“自下向上”两种辨认模式,在不同的空间截止频率段由不同的模式起主导作用。“自下向上”辨认模式,即人们接受到物体的刺激,识别刺激,最后辨认物体的过程[4]。“自上向下”辨认模式,是指人们的记忆或者意识的波动刺激,使物体得到人们的辨认[5]。这两种辨认模式一直是大家争论的热点,到底是哪一种在起作用,还是都在起作用?我们的实验发现,相同笔画数组的常用字组和生僻字组的汉字辨认正确率差异在每个截止空间频率的差异均有显著统计学意义(P<0.01),且常用字组的正确率高于生僻字组。因此我们可以认为,在汉字图像辨认的过程中,存在着记忆作用,也就是说存在着“自上向下”的汉字辨认模式。当截止空间频率小于视觉系统辨认物体所需要的阈值时,汉字图像不能够从背景中区分开来,更无法辨认,此时两种辨认模式均不能起主导作用。当截止空间频率刚超过视觉系统辨认物体所需要的阈值时,即使能够将汉字从背景中区分出来,也不一定能正确辨认,这时由“自下向上”的辨认模式起主导作用。当截止空间频率超过视觉系统辨认物体所需要的阈值后,将汉字从背景中提取出,运用意识中存在的汉字信息将汉字正确辨认,该阶段由“自上向下”的辨认模式起主导作用。正是两种辨认模式的存在,造成常用字和生僻字辨认正确率的显著差异。  同时,笔画数也影响汉字辨认的正确率,这里包含一个笔画数频率(stroke frequency)的概念。笔画数频率是指汉字的笔画与高度一半处的水平横线交叉的数目在单位视角内的明暗周期数[6]。相同笔画数的汉字,由于汉字结构和笔画不同造成笔画数频率也有不同。通过实验我们还发现,在空间频率和笔画数的影响相同的情况下,由于字频的不同,常用汉字和生僻汉字组之间的辨认正确率出现了显著性差异。本实验选择的实验对象为青年人,排除年龄对反应速度和认知方面的影响,再按照近视程度对被试者进行分组比较,结果显示各近视程度组的辨认正确率差异没有显著性,也就是说经过屈光矫正的近视患者与正视者相同,并没有在汉字的辨认正确率方面受到影响。  近来关于“视觉通路”的研究已经成为热点。本实验是在低通滤波的基础上,探讨包含9个空间频率段的汉字识别机制,每张汉字图片所包含的空间频率带宽的起点一样,但是带宽宽度不同。高通滤波对应汉字的细节特征,低通滤波对应汉字的轮廓特征。在低通滤波下,不同的截止空间频率对应的带宽不同,不同的带宽对应的汉字轮廓清晰程度也不同,因此使得最小二乘法拟合以后,各截止空间频率的汉字最大辨认正确率不同,临界截止空间频率也不同。Legge等[7]发现辨认单个字符所需要的临界空间频率带宽大约是2周/字,而本实验显示临界空间频率为1.99周/字时,辨认正确率达到了80%以上。有学者认为处理字符辨认和文本阅读视觉信息的是并行的多个空间频率通路[4],但是Pelli等[8-9]的研究发现却与之完全相反,他们认为字符的辨认和文本阅读仅需要单个空间频率通路,而且Majaj等[10]发现文本阅读和单个字符的辨认使用同样的单空间频率通路。为了更好地对人的视觉系统进行研究,需进行带通滤波以及各滤波方式下的单通路和多通路理论的探讨。在汉字文本阅读中,空间频率通路扮演什么样的角色,这些疑问也将成为我们下一步研究的方向。  综上所述,视觉系统最重要的功能是形觉,即不仅能看到物体,而且能分辨其形状,所以空间频率敏感度是汉字辨认的一个至关重要的因素。目前,临床上评价形觉的主要手段是清晰度很高的视力表,但单纯用视力表检查视角大小,只能反映黄斑对包含高空间频率成分图形的分辨能力。然而,某些疾病在用视力表还不能查出视力减退时就已表现出对物体某段空间频率成分识别或接受能力的下降或丧失。例如Ross等认为早期青光眼使包含中、高空间频率成分图形的辨认正确度下降;但还有学者认为先有低空间频率段物体辨认正确度下降,而后再有整个空间频率段均下降等情况[11]——这些都会影响到患者的学习和生活。为了方便、快捷地对这些初期眼部疾病的患者进行筛查,本实验可以提供基础数据以便制作包含不同空间频率成分视标的汉字视力表。随着眼科医疗质量的提高和患者对视功能的更高要求,希望不同空间频率成分汉字视力表能够帮助早期黄斑变性、青光眼等眼部疾病患者,对他们视觉系统的空间频率敏感度变化情况做一个定性或定量分析,提高随访数据的比较,早期发现并早期治疗,制定出更好的诊疗计划,同时也帮助视功能正常者做好眼部疾病的预防。【参考文献】  [1] Schwartz SH. Visual Perception: A Clinical Orientation[M]. 3rd ed. New York: McGraw-Hill,2004:165-192  [2] 王晨晓,陈湘君,贺极苍,等. 将图像傅立叶频谱分析应用于汉字视标选择[J]. 中华眼科杂志,2008,44(7):587-590.  [3] 郭小朝. 汉字特征分析与实验字取样策略[J].人类工效学,1999,5(3):14-18.  [4] Lennie P. Parallel visual pathways[J]. Vision Res,1980,20(7):561-594.  [5] Einh?覿user W, Mundhenk TN, Baldi P, et al. A bottom-up model of spatial attention predicts human error patterns in rapid scene recognition[J]. J Vis,2007,7(10):6,1-13.  [6] Oruc I, Landy MS, Pelli DG. Noise masking reveals channels for second-order letters[J]. Vision Res,2006,46(8-9):1493-1506.  [7] Legge GE, Pelli DG, Rubin GS, et al. Psychophysics of reading-I. Normal vision[J]. Vision Res,1985,25(2):239-252.  [8] Pelli DG, Burns CW, Farell B, et al. Feature detection and letter identification[J]. Vision Res,2006,46(28):4646-4674.  [9] Solomon JA, Pelli DG. The visual filter mediating letter identification[J]. Nature,1994,369(2):395-397.  [10] Majaj NJ, Pelli DG, Kurshan P, et al. The role of spatial frequency channels in letter identification[J]. Vision Res,2002, 42(9):1165-1184.  [11] 毕宏生. 对比敏感度在眼科的临床应用[J].中华眼科杂志,2004,40(9):645-648.

医思倍微信
医思倍移动端
医思倍小程序