第五讲
语言处理策略
——句类分析
5.1
HNC理解处理系统的基本框架
| [语法分析] | ──→ |
预处理 |
←──┬── |
基本词库 |
| │ |
││ | |||
| │ |
│ |
││ |
||
| ├── | ──→ |
↓ |
└┼── |
(汉语音节知识库) |
| │ |
语义块感知及句类假设 |
←─┤ |
||
| │ |
↑↓ |
│ |
概念联想脉络知识库 | |
| │ |
句 类 检 验 |
←─┼── |
||
| │ |
↓ |
│ |
||
| └── | ──→ |
(伪词辨识) |
←─┴── |
词语HNC知识库 |
|
│ |
||||
| 语境生成 |
←─┼─→ |
隐知识揭示 | ||
|
│ |
||||
| 短时记忆 |
←─┴─→ |
要点主题分析 |
说明:()表示汉语特有的模块
[] 表示西语特有的模块
句类分析和扩展句类分析
5.2
句类分析“中间切入,先上后下”三步曲
(1)
语义块感知和句类假设
(2)
句类检验
(3)
语义块构成分析
分段,初步层选;lv感知;v排除排队;检验
消解模糊贯穿于句类分析的全过程。
5.3
句类分析示例
在句类分析过程中,句类知识起着全局性的指导作用。
liu jia ling ×
zheng shi xiang shang hai ×zhong ji ren min fa yuan qi su
刘嘉玲
正式
向上海
中级
人民法院
起诉
证实
事项
相商
继任
发源
泣诉
正视
试想
伤害
己任
发愿
耆宿
正是
识相
相
级任
正事
实象
象
政事
食相
想
正史
(31个汉字)
正室
× shan
tou ×
ya li si shi ye gong si.
汕头
雅丽丝
实业
公司
山头
私事
夜工
死尸
四时
巳时
小结:
句类分析是一种自上而下和自下而上相结合的自然语言理解处理模式。
句类分析初步模拟大脑的语言感知过程,在消解模糊方面理论上能达到甚至超过常人的水准。
句类分析可以解决汉语语句分析的传统难题,如分词“瓶颈”、述语动词辨识、单音词辨识及其模糊消解等。