Double MPI_Wtick(void);

позволяющая определить время в секундах между двумя последовательными показателями времени аппаратного таймера используемой компьютерной системы.

Рассмотрим пример программы, использующей функцию MPI_Wtime(). Программа выполняет поиск суммы элементов одномерного массива и использует следующий порядок действий:

1. Процесс с рангом 0 запрашивает с клавиатуры размер массива, после чего динамически выделяет память под массив и заполняет его случайными числами.

2. Процесс 0 передает процессу 1 размер массива.

3. Процесс 0 передает процессу 1 первую половину массива.

4. Процесс 0 вычисляет сумму оставшейся половины массива и ждет ответ от процесса 1.

5. Процесс 1 получает от процесса 0 размер массива и динамически выделяет память под половину этого размера.

6. Процесс 1 получает от процесса 0 массив данных.

7. Процесс 1 вычисляет сумму элементов массива, отсылает ее процессу 0 и завершает работу.

8. Процесс 0 принимает от процесса 1 значение суммы первой половины массива, складывает с суммой второй половины массива, выводит результат на экран и завершает работу.

Сначала приведем листинг программы без использования функции MPI_Wtime():

#include "stdafx.h"

#include <stdio.h>

#include <conio.h>

#include <mpi.h>

#include <iostream>

Using namespace std;

int main(int argc, char* argv[])

{

Int proc_rank, proc_count;

MPI_Status Status;

MPI_Init(&argc, &argv);

MPI_Comm_size(MPI_COMM_WORLD, &proc_count);

MPI_Comm_rank(MPI_COMM_WORLD, &proc_rank);

//===================================================================

if ((proc_rank==0) && (proc_count>1)) // Если это "главный" процесс

{ // и процессов минимум два

int n; // Размер массива (изначально неизвестен)

cout << "Input n: ";

cin >> n; // Вводим с клавиатуры размер массива

// Заводим массив на n элементов и заполняем его случайными числами:

int *mas; // Указатель на массив типа int

mas = new int [n]; // Выделяем память под массив (без проверки)

for (int i=0; i<n; i++) // и заполняем случайными числами от 0 до 10

mas[i]=rand()%11;

// Распараллелим поиск суммы ровно на два процесса.

// Даже если доступных процессорных ядер будет больше,

// они не будут использоваться. Ровно два процесса:

// текущий процесс с рангом 0 и процесс с рангом 1.

// Поскольку процесс 1 не знает о размере массива, он

// не может знать, какой объем сообщения ему принимать.

// Поэтому мы сначала передадим процессу 1 число, равное

// размеру массива. Так процесс 1 сможет подготовить

// память под принимаемый массив.

MPI_Send (&n, 1, MPI_INT, 1, 0, MPI_COMM_WORLD);

// Теперь отсылаем первую половину массива процессу 1

MPI_Send (mas, n/2, MPI_INT, 1, 0, MPI_COMM_WORLD);

// Пока процесс 1 обрабатывает первую половину массива,

// делаем пока свою часть работы: ищем сумму элементов

// оставшейся части массива

int S=0;

for (int i=n/2; i<n; i++)

S=S+mas[i];

// Готовимся получать результат работы процесса 1.

// Результатом будет одно число типа int.

int S1; // Место под результат

// Ждем сообщение от процесса 1

MPI_Recv (&S1, 1, MPI_INT, 1, 0, MPI_COMM_WORLD, &Status);

S=S+S1; // Складываем обе суммы

cout << "S = " << S << endl;

delete [] mas; // Освобождаем память, выделенную под массив

} // if - процесс 0

//===================================================================

if (proc_rank==1) // Если это процесс с номером 1

{

int size; // Размер принимаемого массива

int Summa; // Сумма его элементов

// Готовимся принять размер массива

// Ждем сообщение от процесса 0

MPI_Recv (&size, 1, MPI_INT, 0, 0, MPI_COMM_WORLD, &Status);

size=size/2; // Мы получили размер всего массива,

// но принимать будем только половину

// Динамически выделяем память под принимаемый массив

int *ptr = new int [size];

// Готовимся принять массив данных

// Ждем сообщение от процесса 0

MPI_Recv (ptr, size, MPI_INT, 0, 0, MPI_COMM_WORLD, &Status);

// Ищем сумму элементов массива

Summa=0;

for (int i=0; i<size; i++)

Summa+=ptr[i];

// Отсылаем ответ процессу 0

MPI_Send (&Summa, 1, MPI_INT, 0, 0, MPI_COMM_WORLD);

delete [] ptr; // Освобождаем память

} // if - процесс 1

//===================================================================

MPI_Finalize();

// закрываем MPI-библиотеку

Return 0;

}

Пример результата работы программы:

Input n: 1000

S = 5175

Рассмотренная программа полностью работоспособна и решает поставленную задачу. Однако данный код не позволяет отследить и проанализировать процессы, вызванные распараллеливанием программы. Во многих случаях, особенно на этапе отладки программы, в ее листинг полезно добавлять команды вывода сведений о выполняемых этапах работы и промежуточных результатах. Ниже приводится пример этой же программы с добавленными командами вывода информационных сообщений.

#include "stdafx.h"

#include <stdio.h>

#include <conio.h>

#include <mpi.h>

#include <iostream>

using namespace std;

int main(int argc, char* argv[])

{

int proc_rank, proc_count;

MPI_Status Status;

MPI_Init(&argc, &argv);

MPI_Comm_size(MPI_COMM_WORLD, &proc_count);

MPI_Comm_rank(MPI_COMM_WORLD, &proc_rank);

double t0, t1, t2, t3, t4; // Переменные для измерения времени

t0=MPI_Wtime(); // Запоминаем начальный момент времени

//===================================================================

if ((proc_rank==0) && (proc_count>1)) // Если это "главный" процесс

{ // и процессов минимум два

int n; // Размер массива (изначально неизвестен)

cout << "Input n: ";

cin >> n; // Вводим с клавиатуры размер массива

t1 = MPI_Wtime(); // Запоминаем момент времени до начала работы

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): started.\n";

// Заводим массив на n элементов и заполняем его случайными числами:

int *mas; // Указатель на массив типа int

mas = new int [n]; // Выделяем память под массив (без проверки)

for (int i=0; i<n; i++) // и заполняем случайными числами от 0 до 10

mas[i]=rand()%11;

// Распараллелим поиск суммы ровно на два процесса.

// Даже если доступных процессорных ядер будет больше,

// они не будут использоваться. Ровно два процесса:

// текущий процесс с рангом 0 и процесс с рангом 1.

// Поскольку процесс 1 не знает о размере массива, он

// не может знать, какой объем сообщения ему принимать.

// Поэтому мы сначала передадим процессу 1 число, равное

// размеру массива. Так процесс 1 сможет подготовить

// память под принимаемый массив.

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): sanding size...\n";

MPI_Send (&n, 1, MPI_INT, 1, 0, MPI_COMM_WORLD);

cout <<"Process 0 ("<< MPI_Wtime()-t0 << "): size=" << n << " sended.\n";

// Теперь отсылаем первую половину массива процессу 1

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): sanding array...\n";

MPI_Send (mas, n/2, MPI_INT, 1, 0, MPI_COMM_WORLD);

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): array sended.\n";

// Пока процесс 1 обрабатывает первую половину массива,

// делаем пока свою часть работы: ищем сумму элементов

// оставшейся части массива

int S=0;

for (int i=n/2; i<n; i++)

S=S+mas[i];

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): local summa calculated, S=" << S << ".\n";

// Готовимся получать результат работы процесса 1.

// Результатом будет одно число типа int.

int S1; // Место под результат

// Ждем сообщение от процесса 1

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): waiting answer from process 1...\n";

MPI_Recv (&S1, 1, MPI_INT, 1, 0, MPI_COMM_WORLD, &Status);

cout <<"Process 0 ("<< MPI_Wtime()-t0 << "): answer received, S1=" << S1 << ".\n";

S=S+S1; // Складываем обе суммы

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): S = " << S << endl;

delete [] mas; // Освобождаем память, выделенную под массив

cout << "Process 0 ("<< MPI_Wtime()-t0 << "): finished.\n";

t2 = MPI_Wtime(); // Запоминаем момент времени по окончании работы

cout <<"Process 0 ("<<MPI_Wtime()-t0<<"): total time = "<<(t2-t1)<<" seconds.\n";

} // if - процесс 0

//===================================================================

if (proc_rank==1) // Если это процесс с номером 1

{

int size; // Размер принимаемого массива

int Summa; // Сумма его элементов

t3 = MPI_Wtime(); // Запоминаем момент времени до начала работы

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): started.\n";

// Готовимся принять размер массива

// Ждем сообщение от процесса 0

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): waiting size...\n";

MPI_Recv (&size, 1, MPI_INT, 0, 0, MPI_COMM_WORLD, &Status);

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): size=" << size << " received.\n";

size=size/2; // Мы получили размер всего массива,

// но принимать будем только половину

// Динамически выделяем память под принимаемый массив

int *ptr = new int [size];

// Готовимся принять массив данных

// Ждем сообщение от процесса 0

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): waiting array...\n";

MPI_Recv (ptr, size, MPI_INT, 0, 0, MPI_COMM_WORLD, &Status);

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): array received.\n";

// Ищем сумму элементов массива

Summa=0;

for (int i=0; i<size; i++)

Summa+=ptr[i];

cout << " Process 1 ("<<MPI_Wtime()-t0<<"): local summa calculated:"<<Summa<<endl;

// Отсылаем ответ процессу 0

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): sanding Summa...\n";

MPI_Send (&Summa, 1, MPI_INT, 0, 0, MPI_COMM_WORLD);

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): summa sended.\n";

delete [] ptr; // Освобождаем память

cout << " Process 1 ("<< MPI_Wtime()-t0 << "): finished.\n";

t4 = MPI_Wtime(); // Запоминаем момент времени по окончании работы

cout<<" Process 1 ("<< MPI_Wtime()-t0 << "): total time = "<<(t4-t3)<<" sec.\n";

} // if - процесс 1

//===================================================================

MPI_Finalize();

// закрываем MPI-библиотеку

return 0;

}

В начале программы объявляются переменные t0-t4 типа double. Переменная t0 служит для момента времени запуска процесса, переменные t1 и t2 – для хранения начального и конечного времени работы процесса 0, t3 и t4 – процесса 1. В каждом из операторов cout происходит печать значения MPI_Wtime()-t0, которое равно количеству секунд, прошедших от момента t0.

Ниже приведен пример результатов работы программы. Для удобства дальнейшего пояснения каждая строка была вручную пронумерована.

1 Input n: 100000000

2 Process 0 (4.36572): started.

3 Process 0 (6.53677): sanding size...

4 Process 0 (6.53681): size=100000000 sended.

5 Process 0 (6.53682): sanding array...

6 Process 0 (6.65851): array sended.

7 Process 0 (6.77024): local summa calculated, S=250004717.

8 Process 0 (6.77027): waiting answer from process 1...

9 Process 0 (6.7703): answer received, S1=249962239.

10 Process 0 (6.77031): S = 499966956

11 Process 1 (3.01869e-007): started.

12 Process 1 (8.78439e-005): waiting size...

13 Process 1 (6.53681): size=100000000 received.

14 Process 1 (6.60401): waiting array...

15 Process 1 (6.65853): array received.

16 Process 1 (6.77026): local summa calculated:249962239

17 Process 0 (6.86812): finished.

18 Process 0 (6.86815): total time = 2.50244 seconds.

19 Process 1 (6.77029): sanding Summa...

20 Process 1 (6.7703): summa sended.

21 Process 1 (6.82206): finished.

22 Process 1 (6.82216): total time = 6.82216 sec.

Дадим пояснение некоторых моментов в работе программы.

1. В строке 2 указано время старта процесса 0 (4.36 сек.), в строке 11 – время старта процесса 1 (почти ноль). Дело в том, что время старта процесса 0 отсчитывается в программе с момента после ввода значения n с клавиатуры. Очевидно, что в данном примере, ввод с клавиатуры занял 4.36 секунды. Время старта процесса 1 отсчитывается сразу с момента запуска процесса 1, то есть почти сразу после момента времени t0. Но процесс1, запустившись, пока ничего не делает и ждет получения сообщения от процесса 0 (строка 12). Таким образом, 4.36 секунды – это время, потраченное на ввод с клавиатуры, и его не следует относить ко времени обработки массива данных.

2. Между моментами, отмеченными в строках 3 и 4, происходит отправка процессом 0 процессу 1 значения n. Как можно видеть, отправка одного значения типа int занимает десятитысячную долю секунды. Следует, однако, понимать, что в строке 4 указан момент времени, когда сообщение было отправлено процессом 0. Это не значит, что в этот же момент оно было получено процессом 1. Это значит, что в данный момент система MPI приняла сообщение от процесса 0. В реальной жизни этот момент соответствует ситуации, когда с телефона было отправлено SMS-сообщение, или когда бумажное письмо было опущено в почтовый ящик. Сколько времени будет осуществляться доставка сообщения – неизвестно. В худшем случае оно вообще не будет доставлено. Тем не менее, процессу 0 было сообщено, что сообщение ушло, о чем он проинформировал нас в строке 4.

К слову говоря, строка 13 соответствует моменту времени, когда значение n было получено процессом 1. Очевидно, что этот момент совпадает с моментом отправки сообщения процессом 0 (строка 4). Поскольку пример программы запускался на двух ядрах одного процессора, передача сообщения произошла почти мгновенно. Однако в общем случае передача сообщения может занимать достаточно большое время.

3. Строки 5 и 6 соответствуют началу и концу отправки процессом 0 сообщения, содержащего половину массива (50 млн. чисел типа int). Момент вывода строки 15 соответствует моменту приема данного сообщения процессом 1. Разница между временем в строке 15 и временем в строке 5 говорит о том, что процесс передачи и приема этого сообщения занял 0.12 секунды.

4. Все строки, выдаваемые программой на экран, следуют не в хронологическом порядке. Студентам предлагается самостоятельно расставить их в порядке возникновения соответствующих событий. Подсказка: первой будет идти строка 11, затем 12, затем 2, затем 3 и т.д.

Также необходимо обратить внимание на следующее. Как известно, переменные t0-t4, объявляемые в функции main(), создаются внутри каждого процесса. Процесс 0 имеет свои переменные t0-t4, процесс 1 – свои. После создания переменных каждый процесс выполняет команду

t0=MPI_Wtime();

занося в переменную t0 текущий момент времени.

Программист, использующий MPI, должен понимать, что два процесса не могут быть запущены в абсолютно один и тот же момент времени. Моменты запуска каждого из процессов ВСЕГДА различаются. Если процессы запускаются на одном компьютере, то их запуском руководит операционная система, которая сначала запустит один процесс, а потом (пусть даже сразу, без лишних задержек) – второй. Но это будут разные моменты времени. Если в программу после команды t0=MPI_Wtime() добавить строки

<1011 12 13 14 15 16 >

Дата добавления: 2016-02-02; просмотров: 1059;