(1)运行索引工具,载入语料库或索引抽样所得到的文件(我们在光盘中 TOOLS 文件夹内准备了一个名为 undergo.txt 的 索引行文件,用户可以从该文件所包含的索引行中进行抽样),输入
了 检索项,得到索引(由于只有30 个左右的索引行,这一 操 作十分容易,速度快 。
(2) 确定节点左侧第一个词中哪一个是出现频率最高的。对该词的特点进行分析。在进行这一操作时,可以使用索引工具的排序功能(参见下图),这样便于观察。
(3 ) 确定哪一个词是节点右侧第一个词中出现频率最高的。对该词的特点进行分析。我们可以按照与步骤 (2 ) 相同的方法以右 l 作为第一标准进行排序。排序后可以得到表 3.4 所示结果。
( 4 ) 由索引行观察转到搭配分析,观 察节点左1和右1的搭配词,进一步验证步骤 (2)和步骤(3)中得出的初步结论。由索引方式直接切换到搭配分析方式,以另一种方式来观察 undergo 前后语境的特点。
( 5 ) 对语境和搭配中的跨距进行扩展, 观察节点左 2、右 2、左 3、右 3 等位置上的词, 进一步验证我们已有的初步结论。
( 6) 观察那些例外的索引行,如果发现这些索引行只是我们已有的初步结论的扩展(如名词扩展为名词短语等),则可以考虑将该行归入我们前一步分析的结果中,同时对已有结论作必要的扩充。逐一标记例外的索引行,随时准备对已有的初步结论进行修正,以概括更多的索引行。
(7)将语境分析由对搭配词的分析和搭配词词类的归纳扩展到意义,看看节点词的搭配词在意义上是否有明显的特点。注意其中是否有例外情况。
(8)从索引行文件中重新抽样,得到另外一屏(约30个)左右的索引行,逐一分析,获取更多的例证来支持已有的结论,同时对反例进行统计。
(9) 对所记录的例外情况进行分析,寻找其中的规律,尝试对反例进行归纳。