Поиск основы сентенции грамматики

Если грамматика является грамматикой простого предшествования, то для поиска основы каждой ее сентенции надо просматривать элементы сентенции слева направо и найти самую левую пару символов xj и xj+1, такую что xj×>xj+1. Окончанием основы сентенции будет xj.Далее просматривать элементы сентенции справа налево, начиная с символа xj до тех пор, пока не будет найдена самая правая пара символов xi-1 и xi, такая что xi-1 xi. Заголовком основы будет символ xi. Таким образом, будет найдена основа сентенции, имеющая вид xi xi+1…xj-1 xj. Схема поиска основы сентенции грамматики представлена на рисунке 3.4.

 

 


x1 x2 xi-1 xi xi+1 xj-1 xj xj+1 xn

<× … <× =× … =× ×>×>

 

Рисунок 3.4 – Схема поиска основы сентенции грамматики

 

На основе отношений предшествования строят матрицу предшествования грамматики. Строки и столбцы матрицы предшествования помечаются символами грамматики. Пустые клетки матрицы указывают на то, что данные символы не связаны отношением предшествования.

ОпределениеПостроение матрицы предшествования основано на двух вспомогательных множествах, определяемых следующим образом:

- L(A) = {X | $ AÞ*Xz}, AÎVN, XÎV, zÎV* - множество крайних левых символов относительно нетерминального символа А;

- R(A) = {X | $ AÞ*zX}, AÎVN, XÎV, zÎV* - множество крайних правых символов относительно нетерминального символа А.

 

ОпределениеОтношения предшествования можно определить с помощью введенных множеств следующим образом:

 

- BiBj (" Bi, Bj Î V), если и только если существует правило A®xBiBjy ÎP, где AÎVN, x, y ÎV*;

- Bi Bj (" Bi, Bj Î V), если и только если существует правило A®xBiDyÎP и Bj Î L(D),где A, D Î VN, x, y Î V*;

- Bi ×> Bj (" Bi, Bj Î V), если и только если существует правило A®xCBjy и Bi Î R(C) или существует правило A®xCDy Î P и Bi Î R(C), BjÎL(D), где A, C, D Î VN, x, y Î V*.

Матрицу предшествования дополняют символами ^н и ^к (начало и конец цепочки). Для них определены следующие отношения предшествования:

- ^н X," X Î V, если X Î L(S);

- ^к ×> X," X Î V, если X Î R(S).

 

3.5.1.1.3 Построение множеств L(A) и R(A)

Шаг 1. Для каждого нетерминального символа А ищем все правила, содержание А в левой части. Во множество L(A) включаем самый левый символ из правой части правил, а во множество R(A) – самый крайний правый символ из правой части, т.е.

" A ÎVN: L0(A) = {X | A®Xy, X Î V, y Î V*},

R0(A) = {X | A®yX, X Î V, y Î V*}.

Шаг 2. Для каждого нетерминального символа А: если множество L(A) содержит нетерминальные символы грамматики А¢,, …, то множество L(A) надо дополнить символами, входящими в соответствующие множества L(А¢), L() и т.д., … и не входящими в L(A). Аналогичную операцию выполнить для множеств R(A), т.е.

" A Î VN: Li(A) = Li-1(ALi-1(B)," B Î (Li-1(A VN),

Ri(A) = Ri-1(ARi-1(B), " B Î (Ri-1(A VN).

Шаг 3.Если на предыдущем шаге хотя бы одно множество L(A) или R(A) для некоторого символа грамматики изменилось, то вернуться к шагу 2, иначе построение закончено. Т.е. если существует AÎVN: Ri(ARi-1(A) или Li(ALi-1(A), то положить i:=i+1 и вернуться к шагу 2, иначе построение закончено и R(A) = Ri(A) и L(A) = Li(A).

 

3.5.1.1.5 Алгоритм «сдвиг - свертка» для грамматик простого предшествования

 

Шаг 1. Поместить в верхушку стека символ ^н, считывающую головку – в начало входной цепочки символов.

Шаг 2. До тех пор, пока не будет обнаружена ошибка, либо успешно завершен алгоритм разбора, сравниваем отношение простого предшествования символа на верхушке стека и очередного символа входной строки. При этом возможны следующие ситуации:

если самый верхний символ стека имеет меньшее или равное предшествование, чем очередной символ входной строки, то производим операцию «сдвиг» (перенос текущего символа из входной цепочки в стек и перемещение считывающей головки на один символ вправо);

- если самый верхний символ стека имеет большее предшествование, чем очередной символ входной строки, то выполняем операцию «свертка». Для этого находим на верхушке стека «основу» сентенции, т.е. все символы, имеющие равное предшествование или один символ на верхушке стека. Символы основы удаляем из стека, выбираем правило вывода грамматики, имеющее правую часть, совпадающую с основой, и помещаем в стек левую часть выбранного правила. Если такого правила вывода найти не удалось, то выдается сообщение об ошибке, и разбор завершен неудачно;

- если не установлено ни одно отношение предшествования между текущим символом входной цепочки и самым верхним символом в стеке, то алгоритм прерывается сообщением об ошибке;

- если в стеке остаются символы ^нS, а во входном буфере только символ ^к, то входная строка прочитана полностью, и алгоритм разбора завершен успешно.

ПримерДана грамматика G({a, (, )}, {S, R}, P, S), с правилами P:

1) S®(R | a; 2) R®Sa). Построить распознаватель для строки (((aa)a)a)^к.

 

Этап 1. Построим множества крайних левых и крайних правых символов L(A) и R(A) относительно всех нетерминальных символов грамматики (таблица 3.7).

 

Таблица 3.7 – Построение множеств L(A) и R(A) для грамматики G

 

Шаг Li(A) Ri(A)
L0(S)={(, a} L0(R)={S} R0(S)={R, a} R0(R)={)}
L1(S)={(, a} L1(R)={S, (, a} R1(S)={R, a, )} R1(R)={)}
L2(S)={(, a} L2(R)={S, (, a} R2(S)={R, a, )} R2(R)={)}
Результат L(S)={(, a} L(R)={S, (, a} R(S)={R, a, )} R(R)={)}

 

Этап 2. На основе построенных множеств и правил вывода грамматики составим матрицу предшествования символов (таблица 3.8).

Поясним заполнение матрицы предшествования. В правиле грамматики S®(R символ (стоит слева от нетерминального символа R. Во множестве L(R) входят символы S, (, a. Ставим знак в клетках матрицы, соответствующих этим символам, в строке для символа (.

В правиле грамматики R®Sa) символ a стоит справа от нетерминального символа S. Во множество R(S) входят символы R, a, ). Ставим знак ×> в клетках матрицы, соответствующих этим символам, в столбце для символа a.

В строке символа ^н ставим знак в клетках символов, входящих во множество L(S), т.е. символов (, a. В столбце символа ^к ставим знак ×> в клетках, входящих во множество R(S), т.е. символов R, a,).

В клетках, соответствующих строке символа S и столбцу символа a, ставим знак , т.к. существует правило R®Sa), в котором эти символы стоят рядом. По тем же соображениям ставим знак в клетках строки а и столбца ), а также строки ( и столбца R.

 

Таблица 3.8 – Матрица предшествования символов грамматики

 

Символы S R a ( ) ^к
S          
R     ×>     ×>
a     ×>   ×>
(    
)     ×>     ×>
^н        

 








Дата добавления: 2016-03-27; просмотров: 1346;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.014 сек.