Строковые команды.
Сейчас мы рассмотрим последний полезный для понимания архитектуры нашего компьютера формат команд память-память (формат SS). До сих пор для работы с переменными в оперативной памяти мы использовали формат команд регистр-память (или память-регистр), при этом один из аргументов находился на регистре центрального процессора. Это не всегда удобно, если мы не предполагаем больше никаких операций с выбранным на регистр операндом, тогда его пересылка из памяти на регистр оказывается лишним действием.[36] Именно для таких случаев и предназначены команды формата память-память. В архитектуре нашего компьютера такие команды относятся к так называемым строковым командам (мы скоро поймём, почему они так называются).
Строковые команды хорошо использовать для обработки элементов массивов. Массивы коротких беззнаковых целых чисел могут трактоваться как строки (цепочки) символов, отсюда и название – строковые или цепочечные команды. При выполнении строковых команда в цикле получается удобный способ обработки массивов, элементами которых являются короткие или длинные целые числа.
Знакомство со строковыми командами начнём с команд пересылки байта (movsb) или слова (movsw) с одного места памяти в другое. Эти команды различаются только битом размера операнда w в коде операции. С битом w мы познакомились при изучении форматов команд регистр-регистр и регистр-память, w=0 для операндов-байтов и w=1 для операндов-слов. Команды movsb и movsw не имеют явных операндов, их оба операнда op1 и op2 формата m8 (для w=0) и m16 (для w=1) заданы неявно (по умолчанию).
Выполнение команд movsb и movsw существенно зависит от так называемого флага направления DF из регистра флагов FLAGS. Для смены значения этого флага можно использовать команды cld (для операции DF:=0), и std (для операции DF:=1). Для более компактного описания правил выполнения команд movsb и movsw введём следующие условные обозначения:
δ = (w+1)*(-1)DF; φ(r16)={ r16 := (r16 + δ)mod 216 }
Как видим, δ может принимать значения ±1 и ±2, а оператор φ меняет величину регистра на значение δ. В этих обозначениях команды movsb и movsw выполняются по правилу:
<es,di> := <ds,si>; φ(di); φ(si)
Таким образом, неявный операнд op1 находится в памяти по адресу, заданному регистровой парой <es,di>, а операнд op2 – по адресу <ds,si>, т.е. операнды находятся в разных сегментах памяти.
Для того чтобы лучше понять логику работы описанных выше команд, рассмотрим задачу пересылки массива целых чисел с одного места оперативной памяти в другое. На языке Паскаль такая задача решается просто, например:
Var A,B: array[1..10000] of integer;
. . .
B := A;
Для языка Турбо-Паскаль, правда, это только частный случай задачи пересылки массива, так как массивы A и B будут располагаться в одном сегменте данных. Более общий случай пересылки массива на Паскале можно реализовать, например для массивов символов, в таком виде:
Const N = 50000;
Type Mas = Array[1..N] of char;
VarA,B: Mas;
. . .
New(A); New(B);
. . .
B := A;
В этом примере динамические переменные (массивы символов, для Ассемблера, как мы знаем, это массивы коротких беззнаковых целых чисел) обязательно будут располагаться в разных сегментах памяти (понять это!). А теперь рассмотрим реализацию похожей задачи пересылки массива из одного места памяти в другое на языке Ассемблер (наши два массива будут не динамическими, а статическими, но так же располагаться в разных сегментах памяти). Сначала опишем два сегмента данных, в которых будут располагаться наши массивы A и B:
N equ 50000
D1 segment
. . .
A db N dup (?)
. . .
D1 ends
D2 segment
. . .
B db N dup (?)
. . .
D2 ends
На начало сегмента D1 установим сегментный регистр ds, а на начало сегмента D2 – сегментный регистр es, тогда фрагмент программы для реализации оператора присваивания B:=A может, например, иметь такой вид:
Code segment
assume cs:Code,ds:D1,es:D2,ss:Stack
Start:mov ax,D1
mov ds,ax
mov ax,D2
mov es,ax
. . .
mov si,offset A
mov di,offset B
mov cx,N
jcxz L1
L: mov al,[si]
mov es:[di],al
inc si
inc di
loop L
L1: . . .
Оценим сложность нашего алгоритма пересылки массива. За единицу измерения примем обмен данными или командами между центральным процессором и оперативной памятью. В нашем случае сложность алгоритма пересылки массива равна 7*N, где N – это длина массива (N чтений элементов массива, N записей в память, 5*N раз считать в цикле команды из памяти в устройство управления).
Как видим, для пересылки целого числа из одного места памяти в другое нам понадобились две команды
mov al,[si]
mov es:[di],al
так как написать одну команду
mov byte ptr[si],es:[di]
нельзя – она требует несуществующего формата команды пересылки movm8,m8 . Здесь, однако, хорошо подходит наша новая команда пересылки короткого целого числа movsb, с её помощью заключённый в рамку фрагмент программы можно записать в виде:
jcxz L1
Cld
L: movsb
loop L
Теперь в нашем цикле пересылки массива осталось всего две команды, следовательно сложность нашего алгоритма снизилась до 4*N операций обмена. Для дальнейшего ускорения выполнения таких циклов в язык машины была включена специальная команда цикла rep, которая называется префиксом повторения. Она похожа на команду loop, но не имеет явного операнда – метки перехода на начало цикла. Эта метка не нужна, так как в теле цикла rep может находиться только одна, непосредственно следующая за ней команда, другими словами, пара команд
rep <строковая команда>
выполняется по схеме
while cx<>0 do begin
dec(cx); <строковая команда>
End;
С использованием этой новой команды цикла заключенный в рамку фрагмент нашей программы пересылки массива можно записать уже совсем кратко в виде:
Cld
Дата добавления: 2015-10-05; просмотров: 772;