随着自然语言处理研究的深入和技术的发展,语义越来越凸现出其重要性。作为语言研究的基本素材――语料,对它的标注加工也应当深入到语义层面。在语句中,除了词语,语句本身也存在着语义结构,对语义的表达有着重要的作用。语句的语义类型不同,语义角色的配置和含义也不同。因此,除了要选择相应的词语,还需要选择适当类型的语句语义结构,构成句子,语义才能得到较准确完整的表达。概念层次网络(Hierarchical Networks of Concepts,简称 HNC)理论对此进行了深入的研究,形成了以句类和语义块为核心内容的语句语义类型表述模式。

本规范是在HNC理论研究的基础上,具体规定了语句语义类型标注的符号和内容。本规范的制定和实施将规范语料库语句语义类型的标注。同时,电子文本可以将按本规范标注的内容作为语句语义结构的附加信息,有利于提高电子文本信息的计算机自动化处理程度。

此外,更大的语言单位诸如句群、段落以及篇章也具有自身的语义结构,对语义表达起着重要的作用,因此本规范的进一步扩展是形成这些语言单位的语义标注规范,建立更趋完整的语义标注体系。