HNC词库的词语级别*

刘志文

中国科学院声学研究所 100080

 摘要

本文简单回顾了十几年来HNC词库的沿革过程;通过对45000余个现代汉语词汇的遍历性考察和俯瞰,提出一个准二维结构的级别标注方案;着手改造了HNC知识库中的一个数据项,旨在从总体上对所涉及到的汉语词汇给出一个粗略分类和宏观定位;给出了分类标注的初步结果;这项工作将有助于合理安排HNC知识库的填写,同时希望该数据项对HNC处理器的智能化进程稍有裨益

 

语句格式的表示

刘志文

(中国科学院声学研究所 100080

 

摘要

遵从HNC理论,设计了语句格式的形式表示式,给出了完备的格式代码,为汉语语句分析和真实语料标注提供一个方便的工具。本文仅介绍语句格式的形式表达方式,并不过多涉及句类代码的选取方法及其深层含义。



* 本文得到973项目“G1998030506”的支持