HNC信息词霸
谭露
tanlu@mails.gacas.ac.cn
(中国科学院声学所,北京 100080)
HNC信息词霸是HNC语料库辅助工具之一,它开发后可作为一个独立的软件来帮助HNC研究人员方便快捷地获取HNC信息。HNC信息词霸的信息来源是HNC知识库。它是HNC研究人员和知识库间的桥梁,将HNC研究人员所需要的HNC知识从知识库中即时地提取并合理的呈现。本文将从用户需求和系统功能两方面来描述HNC信息词霸。
1.
HNC信息词霸用户需求
HNC研究人员在进行自然语言处理的研究工作时,常常会通过翻阅资料或查询知识库来获取一些HNC信息。翻阅资料是费时的,查询知识库是繁琐的。如果能够为HNC研究人员提供一种工具,不仅能够减少工作量且获取所需的HNC信息,而且还可以通过方便的链接获得所需的相关信息,那么工作效率将大大提高。比如,在进行语料标注时,通过信息词霸的查询,可以获得词语的句类和相关例句(如果存在的话)。HNC信息词霸正是在此背景下提出的。
2.
HNC信息词霸系统功能
2.1屏幕取词
使用HNC信息词霸的屏幕取词功能可以对屏幕上任意位置的中文或英文词形给出HNC符号和HNC句类代码,对HNC符号或HNC句类代码给出自然语言的解释,即自然语言与HNC释义互译。《HNC信息词霸》全面支持Windows NT ,Internet Explorer 4.0/5.0 和 Acrobat(PDF文档格式)取词。中英文词形的释义将即时显示在屏幕上的浮动窗口中,用户可以随时通过『设置』暂停或恢复屏幕取词功能,安装《HNC信息词霸》以后默认的是取词状态。
屏幕取词具有高智能。可自动处理捕获英文单词的时态,词形变化;并可根据显示内容自动调整窗口大小、文本行数等。
浮动窗口中提供有快捷按钮,分别由“查词典、复制解释、句类链接、固定取词条”组成。可显示透明浮动窗口,可以不阻挡屏幕文字及图像,更加方便您的查询。屏幕取词查询结果是词典查询的一个子集,用户可以通过设置来确定浮动窗口中显示内容。详细查询功能如下表:
|
屏幕取词内容 |
浮动窗口中查询结果 |
备注 |
|
中英文词形 |
1. HNC符号及HNC符号的自然语言解释 2. 句类代码及句类名称 |
有句类代码,在工具栏的句类链接功能激活 |
2.2词典查询
中英文词形、HNC符号及HNC句类代码的查询速度更快、功能更强、信息更全面。支持全面互联网知识库升级。详细查询功能如下表:
|
查询内容 |
查询结果 |
备注 |
|
中英文词形 |
1. HNC符号 2. 句类代码(可能没有) 3. 例句(每一个词形都要有对应的例子,如果一个词形对应多个句类代码,每一个句类代码都要有对应的例句) 4. 相关词形(从HNC符号相似看相关词形) |
1. 英文词形,可自动处理捕获英文单词的时态,词形变化 2. 目前由于缺少英文知识库,所以只实现中文 3. 相关词形的获取需要其他程序 |
|
HNC符号 |
1. HNC符号分解 2. HNC符号的自然语言解释 3. HNC符号的例词和例句 |
|
|
HNC句类代码 |
1. 句类名称及语句表示式 2. 句类的例句 3. 句类知识 |
1. 混合句的命名 2. 句类知识收集 |
作者简介:谭露(1980--),女,湖北宜昌人。现为中科院声学研究所硕士研究生,主要研究方向为自然语言理解、机器翻译。