MPI коллективный обмен сообщениями I

Вычислительный центр им. А.А. Дородницына РАН

Раздел виртуального курса
Параллельное программирование в интерфейсе MPI

MPI коллективный обмен сообщениями I

Содержание

Введение
Функции MPI по коллективной коммуникации

2.1 Характеристики
2.2 Функция барьерной синхронизации
2.3 Функции перемещения данных

2.3.1 Broadcast (широкое распространение "один-всем")
2.3.2 Gather (сборка "каждый-одному") и Scatter (размещение "один-каждому")
2.3.3 Gatherv (гибкая сборка "переменный каждый-одному") и
Scatterv (гибкое размещение "переменный один-каждому")
2.3.4 Allgather (всеобщая сборка "все-каждому")
2.3.5 Alltoall (всеобщий обмен "каждый-каждому")

2.4 Функции глобальных вычислений

Проблемы эффективности работы
3.1 Пример: Широкое распространение по 8 процессам
3.2 Пример: Размещение по 8 процессам

1. Введение

Коллективная коммуникация вовлекает все процессы в коммуникаторе. (Коммуникаторы были введены в модуле по основам MPI программирования .) Цель коллективной коммуникации состоит в том, чтобы управлять "общим" куском или набором информации. Функции коллективной коммуникации были построены при использовании функций попарной коммуникации. Вы можете строить ваши собственные функции коллективной коммуникации, но это повлечет много утомительной работы и не будет столь же эффективно.

Хотя другие библиотеки передачи сообщений предоставляют некоторые вызовы коллективных коммуникаций, ни одна из них не обеспечивает набор функций коллективной коммуникации столь же полный и надёжный в эксплуатации, как предоставленные библиотекой MPI. В этой лекции мы вводим эти функции в трех категориях: синхронизация, перемещение данных и глобальные вычисления.

2. Функции MPI по коллективной коммуникации

Барьерная синхронизация
Широкое распространение от одного члена всем другим членам (Broadcast)
Сборка данных из массива, размазанного по процессам, в один массив (Gather)
Размещение (рассеивание) данных от одного члена всем членам
Обмен данных "все ко всем"
Глобальное приведение (наример, нахождение суммы, минимума "общих" элементов данных)
Просмотр (сканирование) по всем членам коммуникатора

2.1 Характеристики

Функции MPI для коллективной коммуникации отличаются по разным признакам от функций MPI для попарной коммуникации, котрые были введены в модуле MPI попарный обмен сообщениями I. Вот - особенности (характеристики) функций коллективной коммуникации MPI :

Включают скоординированную коммуникацию в пределах группы процессов, идентифицированных коммуникатором MPI
Заменяют более сложную последовательность запросов попарных вызовов
Все функции блокированы пока они локально не завершены
Коммуникации могут или могут не быть синхронизированы (в зависимости от реализации)
В некоторых случаях корневой процесс порождает или получает все данные
Количество отправленных данных должно точно соответствовать количеству данных, указанных получателем
Много изменений к базовым категориям
Нет нужды в тегах сообщений

Коллективные коммуникации MPI можно разбить на три подмножества: синхронизация, перемещение данных и глобальные вычисления, которые охвачены в следующих трех параграфах.

2.2 Функция барьерной синхронизации

В параллельных приложениях в окружении с распределенной памятью, явная или неявная синхронизация иногда требуется. Подобно другим библиотекам передачи сообщений, MPI обеспечивает функциональный запрос, MPI_Barrier, чтобы синхронизировать все процессы в пределах коммуникатора. Барьер - это просто примитив синхронизации. Узел, вызывающий его, будет блокирован, пока все узлы в пределах группы не вызвали его. Синтаксис MPI_Barrier и для C дан ниже:

C

MPI_Barrier (MPI_Comm comm)

где:

MPI_Comm является предопределенной структурой MPI для коммуникаторов, а

comm - некий коммуникатор.

2.3 Функции перемещения данных

MPI обеспечивает три типа коллективных функций для перемещения данных. Это широкое распространение "один-всем" (broadcast), сборка "каждый-одному" (gather) и размещение "один-каждому" (scatter) Есть также функции всеобщей сборки "все-каждому" (allgather) и всеобщего обмена "каждый-каждому" (alltoall). Функции сборки (gather), разброса (scatter), всеобщей сборки (allgather) и всеобщего обмена (alltoall) имеют переменные версии данных. Для их переменных версий данных, каждый процесс может отправить и/или получить различное число элементов. Вот список всех функций коллективного перемещения данных MPI:

broadcast
gather, gatherv
scatter, scatterv
allgather, allgatherv
alltoall, alltoallv

Теперь давайте посмотрим на функциональные возможности и синтаксис этих функций.

2.3.1 Broadcast (широкое распространение "один-всем")

Во многих случаях, один процесс должен отправить (широко распространить) некоторые данные (скаляр или вектор) ко всем процессам в группе. Для выполнения этой задачи в MPI есть примитив передачи MPI_Bcast. Синтаксис MPI_Bcast задан следующим образом:

C

int MPI_Bcast (void* buffer, int count, MPI_Datatype datatype, int root, MPI_Comm comm)

где:

buffer - стартовый адрес буфера,

count - целое число, указывающее число элементов данных в буфере,

datatype - определенная константа MPI, указывающая тип элементов данных в буфере,

root является целым числом, указывающим ранг корневого процесса широкого распространения, и

comm является коммуникаторм..

Функция MPI_Bcast нужно вызвать каждым узлом группы, определяя те же самые comm и root. Сообщение отправляется из корневого процесса ко всем процессам в группе, включая корневой процесс.

Пример:

Пример "hello, world" использован в более ранних модулях.
Можно применить широкое распространение "один-всем" (broadcast) вместо множественных отправок и получений

char message[20];
int rank, root = 0;
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
if (rank == root) {: strcpy(message, "Hello, world!");
}
MPI_Bcast(message, 14, MPI_CHAR, root, & MPI_COMM_WORLD);
printf( "Message from process = %d : %.14s\n", rank,message);

2.3.2 Gather (сборка "каждый-одному") и Scatter (размещение "один-каждому")

Если массив размазан (рассеян) по всем процессам в группе, и каждый процесс хочет собрать каждую часть массива в заданный массив в порядке рангов процессов, используют Gather. С другой стороны, если Вы хотите распределить данные на n равных долей, когда i-ю долю отправляют i-му процессу в группе, которая имеет n процессов, используют Scatter. MPI обеспечивает два варианта операций gather/scatter: один вариант, в котором числа элементов данных, (собранных от узлов)/(отправленных к узлам) могут отличаться; и более эффективный другой вариант для специального случая, когда число на узел одно и то же. Их синтаксис дается ниже:

C

`int MPI_Gather`	`(void* sbuf, int scount, MPI_Datatype stype, void* rbuf, int rcount, MPI_Datatype rtype, int root, MPI_Comm comm )`
`int MPI_Scatter`	`(void* sbuf, int scount, MPI_Datatype stype, void* rbuf, int rcount, MPI_Datatype rtype, int root, MPI_Comm comm)`

где, для функции Gather:

sbuf - стартовый адрес буфера отправителя,

scount - число элементов в буфере отправки,

stype - тип данных элементов буфера отправки,

rbuf - стартовый адрес буфера получателя,

rcount - число элементов для любого единственного получателя,

rtype - тип данных элементов буфера получателя,

root - ранг процесса получателя и

comm - коммуникатор.

Заметим, что rbuf, rcount, rtype важны только для корневого процесса.

и для функции Scatter:

sbuf - адрес буфера отправителя,

scount - число элементов, отправленных каждому процессу,

stype - тип данных элементов буфера отправителя,

rbuf - адрес буфера получателя,

rcount - число элементов в буфере получателя,

rtype - тип данных элементов буфера получателя,

root - ранг процесса отправителя и

comm - коммуникатор.

Заметим, что sbuf, scount, stype важны только для корневого процесса.

В операции сборки (gather), каждый процесс (включяя корневой процесс) отправляет scount элементов типа stype из sbuf к корневому процессу. Корневой процесс получает сообщения и запоминает их в порядке рангов в rbuf. Для размещения-рассеивания (scatter) верно обратное. Корневой процесс отправляет буфер из N кусков данных (N = числу процессов в группе) так, чтобы процесс 1 получил первый элемент, процесс 2 получил второй элемент, и т.д.

Действие Gather & Scatter

Для иллюстрации этих функций ниже приведен график:

Следующий пример для gather (сборки "каждый-одному") добавляет понимание этого рисунка.

Умножение матрицы на вектор для матрицы, распределенной по строкам
Выходной вектор полностью необходим для одного процесса

Типовой Код

Проблема связана со следующим типовым кодом - умножением матрицы A, размера 100x100, на вектор B длины 100. Так как этот пример использует 4 процесса, каждый процесс будет обрабатывать его собственный кусок в 25 рядов A. B - один и тот же для каждой задачи. Вектор C будет иметь 25 элементов, рассчитанных каждым процессом, и сохраненных в cpart. Функция MPI_Gather возьмет cpart от каждой задачи и сохранит результат в ctotal, который и есть полный вектор C.


      double a[100,25],b[100],cpart[25],ctotal[100];
      int root;
      root=0;
	for(i=0;i<25;i++)
      {
         cpart[i]=0;
		for(k=0;k<100;k++)
         {
            cpart[i]=cpart[i]+a[k,i]*b[k];
         }
      }
      MPI_Gather(cpart,25,MPI_REAL,ctotal,25,MPI_REAL,root,MPI_COMM_WORLD);

b: вектор совместного использования всех процессов

c: вектор, обновленный каждым процессом независимо

Ниже даны два фрагмента программы на ФОРТРАНе, чтобы еще более проиллюстрировать использование MPI_Gather и MPI_Scatter.

MPI_GATHER

MPI_SCATTER

Нетрудно представить себе аналогичные фрагменты на С.

2.3.3 Gatherv (гибкая сборка "переменный каждый-одному") и
Scatterv (гибкое размещение "переменный один-каждому")

Функции MPI_Gatherv и MPI_Scatterv - это версии MPI_Gather и MPI_Scatter с переменным размером сообщений. MPI_Gatherv расширяет функциональность MPI_Gather изменяя получаемое число от целого числа до массива целых чисел и предоставив новый аргумент displs (тоже массив). MPI_Gatherv допускает переменное число данных от каждого процесса и допускает немного гибкости по поводу того, куда помещать собранные данные, также в корень. Как двойник MPI_Gatherv, MPI_Scatterv - расширение MPI_Scatter в тех же самых отношениях, как MPI_Gatherv к MPI_Gather. Чуть больше информации по этой темы предоставлено в модуле MPI коллективный обмен сообщениями II.

C

`int MPI_Gatherv`	`(void* sbuf, int scount, MPI_Datatype stype, void* rbuf int rcount, int displs, MPI_Datatype rtype, int root, MPI_Comm comm)`
`int MPI_Scatterv`	`(void* sbuf, int* scount, int* displs, MPI_Datatype stype, void* rbuf, int rcount, MPI_Datatype rtype, int root, MPI_Comm comm)`

Переменные для Gatherv таковы:

sbuf - стартовый адрес буфера отправителя,

scount - число элементов в буфере отправки,

stype - тип данных элементов буфера отправки,

rbuf - стартовый адрес буфера получателя,

rcount - массив, содержащий число элементов, которые будут получены от каждого процесса,

displs - массив, задающий смещение относительно rbuf (стартового адреса буфера получателя), в который помещаются входящие данные от соответствующего процесса,

rtype - тип данных буфера получателя,

root - ранг процесса получателя,

comm - коммуникатор группы.

Заметим, что rbuf, rcount, rtype важны только для корневого процесса.

Переменные для функции Scatterv таковы:

sbuf - адрес буфера отправителя,

scount - массив целых чисел, определяющий число элементов для отправки каждому процессу,

displs - массив, определяющий смещение относительно sbuf, от которого берутся данные отправляемые к соответствующим процессам,

stype - тип данных элементов буфера отправителя,

rbuf - адрес буфера получателя,

rcount - число элементов в буфере получателя,

rtype - тип данных элементов буфера получателя,

root - ранг процесса отправителя и

comm - коммуникатор группы

Заметим, что sbuf, scount, stype важны только для корневого процесса.

С целью иллюстрации использования функций MPI_Gatherv и MPI_Scatterv, дадим ниже два фрагмента программ на ФОРТРАНе:

MPI_Gatherv

MPI_Scatterv

Нетрудно представить себе аналогичные фрагменты на С.

2.3.4 Allgather (всеобщая сборка "все-каждому")

О MPI_Allgather можно думать как об MPI_Gather, где все процессы, а не только корневой, получают результат. Блок j-й буфера получателя - блок данных, отправленный от процесса j. Подобные отношения верны для MPI_Allgatherv и MPI_Gatherv. Синтаксис MPI_Allgather и MPI_Allgatherv подобен MPI_Gather и MPI_Gatherv, соответственно. Однако, аргумент корень отброшен у MPI_Allgather и MPI_Allgatherv.

C

`int MPI_Allgather`	`(void* sbuf, int scount, MPI_Datatype stype, void* rbuf, int rcount, MPI_Datatype rtype, MPI_Comm comm )`
`int MPI_Allgatherv`	`(void* sbuf, int scount, MPI_Datatype stype, void* rbuf, int* rcount, int* displs, MPI_Datatype rtype, MPI_Comm comm)`

Переменные функции Allgather:

sbuf - стартовый адрес буфера отправителя,

scount - число элементов в буфере отправки,

stype - тип данных элементов буфера отправки,

rbuf - стартовый адрес буфера получателя,

rcount - число элементов, полученных от любого процесса,

rtype - тип данных элементов буфера получателя,

comm - коммуникатор группы.
Заметим, что эти аргументы те же самые, что и у MPI_Gather или MPI_Gatherv за исключением того, что исключен аргумент корень.

Пример:

Умноженеи матрицы на вектор для матрицы, распределенной по строкам
Выходной вектор необходим целиком для всех процессов

Типовой Код

       double a[100,25], b[100], cpart[25],

      ctotal[100];for(i=0;i<25;i++)
      {
         cpart[i]=
         0;for(k=0;k<100;k++)
         {
	    cpart[i]=cpart[i]+a[k,i]*b[k];
         }
      }
      MPI_Allgather(cpart,25,MPI_REAL,ctotal,25,MPI_REAL,MPI_COMM_WORLD);

2.3.5 All to All (всеобщий обмен "каждый-каждому")

В приложениях,подобных транспонированию матрицы и быстрому преобразованию Фурье (БПФ) , вызов MPI_Alltoall весьма полезен. Это - расширение к Allgather, в котором каждый процесс отправляет различные данные каждому получателю. Блок j-й от i-го процесса принимается процессом j и сохраняется в i-м блоке. Графическое представление MPI_Alltoall показано ниже:

Синтаксис функции MPI_Alltoall таков:

C

int MPI_Alltoall (void* sbuf, int scount, MPI_Datatype stype, void* rbuf, int rcount, MPI_Datatype rtype, MPI_Comm comm )

Переменный функции Alltoall таковы:

sbuf - стартовый адрес буфера отправителя,

scount - число элементов, отправленных каждому процессу,

stype - тип данных элементов буфера отправки,

rbuf - стартовый адрес буфера получателя,

rcount - число элементов, получаемых от любого процесса,

rtype - тип данных элементов буфера получателя,

comm - коммуникатор группы.

Заметим, чтоте же самые спецификации, что и у Allgather, кроме sbuf, должны содержать scount*NPROC элементов.

2.4 Функции глобальных вычислений

Существует два типа функций глобальных вычислений: приводить (reduce) и сканировать (scan). Функция операции, которую передают к функции глобального вычисления является или предопределенной функцией MPI или функция, предлагаемая пользователем. MPI обеспечивает четыре функции глобальных вычислений. Пользователям дана возможность поставлять свои собственные функции. Вначале этого раздела обсуждается вычисление приведения. Затем обсуждается вычисление сканирования.

MPI_Reduce

Одна из самых полезных коллективных операций - глобальное приведение или операция объединения. Частичный результат в каждом процессе группы объединяется в одном указанном процессе или всех процессах, используя некоторую желаемую функцию. Если есть n процессов в группе данного процесса, и D (i, j) - j-ый элемент данных в процессе i, то элемент данных D_j в корневом процессе, получаемый из оценки функции приведения дается выражением:

D_j = D(0,j)*D(1,j)* ... *D(n-1,j)

где знак * - функция приведения и она всегда предполагается ассоциативной. Все предопределенные функции MPI также предполагаются коммутативными. Можно определить функции, предполагая их ассоциативными, но не коммутативными. Каждый процесс может предоставлять один элемент или последовательность элементов. В обоих случаях операция объединения выполняется поэлементно на каждом элементе последовательности. Есть три версии приведения. Это - MPI_Reduce, MPI_Allreduce, и MPI_Reduce_scatter. Форма этих примитивов приведения перечислена ниже:

C

int MPI_Reduce (void* sbuf, void* rbuf, int count, MPI_Datatype stype, MPI_Op op, int root, MPI_Comm comm)

int MPI_Allreduce (void* sbuf, void* rbuf, int count, MPI_Datatype stype, MPI_Op op, MPI_Comm comm)

int MPI_Reduce_scatter (void* sbuf, void* rbuf, int* rcounts, MPI_Datatype stype, MPI_Op op, MPI_Comm comm)

Различия среди этих трех форм приведения:

MPI_Reduce возвращает результаты на единственный процесс;
MPI_Allreduce возвращает результаты всем процессам данной группы;
MPI_Reduce_scatter размещает (рассеивает) вектор, получаемый из операции приведения по всем процессам.

`sbuf`	- стартовый адрес буфера отправителя,
`rbuf`	- стартовый адрес буфера получателя,
`count`	- число элементов в буфере отправки,
`stype`	- тип данных элементов буфера отправки,
`op`	- операция приведения (которой может быть предопределенная в MPI операция или ваша собственная),
`root`	- ранг процесса получателя,
`comm`	- коммуникатор группы..

Замечания:: * rbuf важен только для корневого процесса,; * аргумент rcounts в функции MPI_Reduce_scatter является массивом

Сканирование

Операция сканирования или префиксного приведения выполняет частичное приведение на распределенных данных. В частности, пусть n будет размером группы процессов, D (k, j) - j-й элемент данных в процессе k после возвращения из сканирования, и d (k, j) - j-й элемент данных в процессе k перед сканированием. Пусть k =0, 1..., n-1. Сканирование возвращает

D(k,j) = d(0,j) * d(1,j) * ... *d(k,j)

где * - функция приведения, которая может быть либо предопределенной функцией MPI или определенной пользователем функцией.

Синтаксис функции сканирования MPI таков:

C

int MPI_Scan (void* sbuf, void* rbuf, int count, MPI_Datatype datatype, MPI_Op op, MPI_Comm comm)

`sbuf`	- стартовый адрес буфера отправителя,
`rbuf`	- стартовый адрес буфера получателя,
`count`	- число элементов во входном буфере,
`datatype`	- тип данных элементов во входном буфере,
`op`	- операция,
`comm`	- коммуникатор группы.

Заметим, что что сегментированный просмотр может быть сделан, создавая подгруппу для каждого сегмента.

Предопределенные операции приведения

Примеры предопределенных операций MPI просуммированы в Таблице 1. MPI также предоставляет механизм для определяемых пользователями операций, используемым в MPI_Allreduce и MPI_Reduce.

**Предопределенные операции приведения MPI**
Название	Значение	C-тип	FORTRAN-тип
MPI_MAX	maximum	integer, float	integer, real, complex
MPI_MIN	minimum	integer, float	integer, real, complex
MPI_SUM	sum	integer, float	integer, real, complex
MPI_PROD	product	integer, float	integer, real, complex
MPI_LAND	logical and	integer	logical
MPI_BAND	bit-wise and	integer, MPI_BYTE	integer, MPI_BYTE
MPI_LOR	logical or	integer	logical
MPI_BOR	bit-wise or	integer, MPI_BYTE	integer, MPI_BYTE
MPI_LXOR	logical xor	integer	logical
MPI_BXOR	bit-wise xor	integer, MPI_BYTE	integer, MPI_BYTE
MPI_MAXLOC	max value and location	combination of int, float, double, and long double	combination of integer, real, complex, double precision
MPI_MINLOC	min value and location	combination of int, float, double, and long double	combination of integer, real, complex, double precision

Пример

Каждый процесс в имитации динамики леса вычисляет максимальную высоту дерева для его региона.
Процесс 0, который записывает выпуск, должен знать глобальный максимум высоты.

  int maxht, globmx;
      .
      .
      .  (вычисления, которые определяют максимальную высоту)
      .
      .
  MPI_Reduce (maxht, globmx, 1, MPI_INTEGER, MPI_MAX, 0, MPI_COMM_WORLD);
  if (taskid == 0) {
      .
      .  (Запись выпуска)
      .
  }

Операции, определяемые пользователем

Пользователь может определить его/её собственную операцию приведения
Применить функцию MPI_Op_create

3. Проблемы эффективности работы

Много скрытых коммуникаций связано с коллективной коммуникацией
Эффективность работы очень зависит от специфической реализации MPI
Поскольку может быть навязана синхронизация, то не всегда лучше использовать коллективную коммуникацию

3.1 Пример: Широкое распространение по 8 процессам

Пример двух способов (простой способ, лучший способ) осуществления широкого распространения (broadcast).

Простой подход: Один процесс широко распространяет тоже самое сообщение по всем другим процессам, по одному в каждый момент времени.

Количество пермещенных данных: (N-1)*p

Более быстрый и остроумный подход: Позвольте другим процессам помочь в размножении сообщения. На первом шаге, процесс 1 отправляет сообщение процессу 2. На втором шаге, оба процесса уже могут участвовать: процесс 1 отправляет сообщение процессу 3, в то время как процесс 2 отправляет процессу 4. Точно так же на третьем шаге, четыре процесса (1, 3, 2, и 4) отправляют сообщение четырем остающимся процессам (5, 6, 7, и 8).

Жирная линия: пересылка данных
Пунктирная линия: проведена по предыдущей передаче

Количество переданных данных: (N-1)*p

₂

Сравните число шагов для этих двух подходов:

Простой подход: N-1
Более быстрый подход: log₂N

Последний масштаб улучшается по мере роста N.

3.2 Пример: Размещение по 8 процессам

Пример двух способов (простой способ, лучший способ) для осуществления размещения.

Простой подход: Один процесс размещает N сообщений по другим процессам, по одному в каждый момент времени.

Количество перданных данных: (N-1)*p

Более быстрый подход: Позвольте другим процессам помочь в размножении сообщения. В первом шаге процесс 1 отправляет половину данных (размер 4*p) процессу 2. На втором шаге, оба процесса уже могут участвовать: процесс 1 отправляет одну половину данных, которые он получил на шаге 1 (размер 2*p) процессу 3, в то время как процесс 2 отправляет одну половину данных, которые он получил на шаге 1 процессу 4. На третьем шаге, четыре процесса (1, 3, 2, и 4) отправляют конечные сообщения (размера p) к оставшимся четырем процессам (5, 6, 7, и 8).

Количество переданных данных: log₂N * N * p/2

₂

Сравните число шагов для этих двух подходов:

Простой подход: N-1
Более быстрый подход: log₂N

Последний масштаб улучшается по мере роста N

Литература

Книга

Using MPI: Portable Parallel Programming with the Message-Passing Interface, by William Gropp, Ewing Lusk, and Anthony Skjellum. Published 10/21/94 by MIT Press, 328 pages.

World Wide Web

Домашняя страница MPI в Argonne National Labs http://www.mcs.anl.gov/mpi
Netlib: MPI
Параллельные вычисления LAM/MPI
Модуль Основы программирования в MPI
Модуль MPI попарные коммуникации I

Выборка программ, доступных на Web, которые иллюстрируют команды, охваченные в этом модуле.

`MPI_Comm`	является предопределенной структурой MPI для коммуникаторов, а
`comm`	- некий коммуникатор.

`buffer`	- стартовый адрес буфера,
`count`	- целое число, указывающее число элементов данных в буфере,
`datatype`	- определенная константа MPI, указывающая тип элементов данных в буфере,
`root`	является целым числом, указывающим ранг корневого процесса широкого распространения, и
`comm`	является коммуникаторм..

`sbuf`	- стартовый адрес буфера отправителя,
`scount`	- число элементов в буфере отправки,
`stype`	- тип данных элементов буфера отправки,
`rbuf`	- стартовый адрес буфера получателя,
`rcount`	- число элементов для любого единственного получателя,
`rtype`	- тип данных элементов буфера получателя,
`root`	- ранг процесса получателя и
`comm`	- коммуникатор.

`sbuf`	- адрес буфера отправителя,
`scount`	- число элементов, отправленных каждому процессу,
`stype`	- тип данных элементов буфера отправителя,
`rbuf`	- адрес буфера получателя,
`rcount`	- число элементов в буфере получателя,
`rtype`	- тип данных элементов буфера получателя,
`root`	- ранг процесса отправителя и
`comm`	- коммуникатор.

Вычислительный центр им. А.А. Дородницына РАН

Раздел виртуального курса Параллельное программирование в интерфейсе MPI