Программированиеи компьютеры /
←предыдущая следующая→
1 2
Р.БЕРТОН СЕМАНТИЧЕСКАЯ ГРАММАТИКА
!!!!!!!! Файл набран в текстовом процессоре LEXICON
СОДЕРЖАНИЕ
1 Введение
а) отличительные особенности семантических грамматик
б) стандартные грамматики и семантические грамматики
2 Преимущества семантических грамматик
а) эффективность
б) удобство
в) учет особенностей речи
г) обработка ошибок ввода
д) самообъяснение
3 Ограничения, накладываемые на семантические грамматики
а) исключение сложных форм
б) необходимость различных видов категорий для различных пред-
метных областей
- 2 -
1 Так называемая "семантическая грамматика" - это грамматика, в
которой категории обозначают как семантические, так и синтаксические
понятия. Впервые она была разработана в начале 1970-х годов при создании
интерфейсов на естественном языке для программы-оболочки SOPHIE и баз
данных LIFER и PLANES. Ее продолжали использовать в различных коммер-
ческих и других приложениях, таких как ROBOT (известный также как IN-
TELLECT), PHRAN, XCALIBUR и CLOUT. Отличительная черта семантической
грамматики - тип кодируемой информации, а не формализм для ее предс-
тавления. В семантических грамматиках использовались различные форма-
лизмы, включая расширенные сети перехода и расширенные грамматики не-
посредственных составляющих. В отличие от систем на естественном языке
в общем, цель семантических грамматик - описать раздел естественного
языка для свободного взаимодействия пользователя с системой. В таком
виде семантическая грамматика - прежде всего инструмент в области ин-
женерии естественного языка (хотя некоторые исследователи предлагают
считать семантические грамматики психологической теорией языкового по-
нимания).
Пониманию семантических грамматик способствуют знания о теориях
естественного языка. Цель этих теорий - объяснить закономерности языка.
Примером может служить трансформационная грамматика. Синтаксическая
часть теории объясняет структурные закономерности языка, например, по-
рядок слов. Эти правила называются грамматикой.
Пример пассивных отношений в английском языке:
1 The boy hit the ball.
2 The ball was hit by the boy.
:=
by
В семантических грамматиках выбор категорий базируется на семантике
знаний о мире и сферах приложения, а также на закономерностях языка. Таким
образом, категории системы SOPHIE, разработанной для ответов на вопросы поль-
зователя об электрических цепях, могут включать measurement, measurable quan-
tity, part наряду со стандартными категориями determiner, preposition. Напри-
мер, правило :=
применимо к следующим предложениям:
The voltage across R9.
The current through the voltage reference capacitor.
The power dissipation of the current-limiting transistor.
- 3 -
S
/
NP VP
¦ /
¦ /
¦ /
Q/PRO V NP
¦ ¦ / /
¦ ¦ DET N PP
¦ ¦ ¦ ¦ /
¦ ¦ ¦ ¦ PREP N
¦ ¦ ¦ ¦ ¦ ¦
What is the voltage across R9
Стандартная структура английского вопроса
QUERY
/
QUESTION MEASUREMENT
INTRO
¦ / /
QUESTION ¦
WORD ¦ DET MEASURABLE PREP PART
¦ ¦ ¦ QUANTITY ¦ ¦
¦ ¦ ¦ ¦ ¦ ¦
What is the voltage across R9
Структура вопроса в семантической грамматике
- 4 -
2 Семантические грамматики обеспечивают решение многих проблем,
возникающих при построении естественно-языковых интерфейсов. Про-
блемы включают в себя:
а) эффективность
б) удобство
в) учет особенностей речи
г) ошибки ввода
д) самообъяснение.
а) Семантические грамматики эффективны, так как они допускают
использование семантических отношений для сокращения количества аль-
тернативных парсингов, которые должны учитываться. Эффективность так-
же повышается за счет того, что семантическая интерпретация (значение)
выражения выводится непосредственно из грамматических правил.
Обычно в семантической грамматике каждому правилу соответствует
расширение, связанное с ним, которое строит общую интерпретацию из ин-
терпретаций составляющих. Например, интерпретацией правила
:= является запрос к базе данных,
который ищет измерение, определенное в интерпретации .
Интерпретация уточняет количество, которое измеряется,
и где оно будет измеряться. Прямая связь семантической интерпретации с
грамматикой дает возможность избежать отдельного процесса семанти-
ческой интерпретации.
б) Создание в обозримом будущем естественно-языкового интерфейса,
понимающего весь язык, нереально. Хороший интерфейс обеспечивает обще-
ние на определенном подъязыке. Наличие такой возможности называется
удобством.
Удобная система принимает незначительные незначительные или
местные варианты вводимой информации. Например, система, которая при-
нимает вопрос "Is something wrong?" и не принимает "Is anything wrong?"
не удобна. Любой подъязык, который не обеспечивает высокого уровня
удобства, хуже, чем отсутствие возможности естественно-языкового обще-
ния вообще, так как пользователю придется постоянно изменять введенную
информацию.
в) Разработку удобных интерфейсов осложняет существование проно-
минальной и анафорической референции и эллипсиса.
Пример эллипсиса (4):
(3) What is the population of Los Angelos?
(4) What about San Diego?
- 5 -
Системы, использующие семантические грамматики, распознают "San
Diego" как значение параметра . Самое последнее употребление
располагается в предыдущем вводе информации, и новое предложение заме-
няется старым. В системах SOPHIE, PLANES, XCALIBUR операция произво-
дится с использованием интерпретационной структуры предыдущих вводов
информации, а в системе PHRAN замена происходит в предыдущей строке,
которая затем подвергается повторному анализу.
Семантические грамматики могут также обрабатывать прономинальную
и анафорическую референцию, как, например, в предложении "What is it
for San Francisco?"
г) Естественно-языковой интерфейс должен обрабатывать предложения
вне его грамматики, т.е. предложения не поддающиеся анализу. Решением
проблемы является частичное понимание предложения, когда или игнориру-
ются непонятные слова ("fuzzy parsing"), или распознаются словосочета-
ния, удовлетворяющие грамматике. С пользователем постоянно поддержи-
вается обратная связь.
д) Относительной сложностью в разработке естественно-языковых ин-
терфейсов является объяснение возможностей системы. Для помощи пользо-
вателю используется информация, содержащаяся в грамматике. Пример диа-
лога в LIFER:
USER: What is the voltage
SYSTEM RESPONSE: Inputs that would complete the rule
are:
across
between and
p>
←предыдущая следующая→
1 2
|
|