Приведем данные, позволяющие сравнить производительность разработанной реализации алгоритма разбиения графов с известным пакетом ParMETIS. Заметим, что результаты по быстродействию, приведенные в последней работе, соответствуют параллельной реализации на суперкомпьютере BlueGene [8] с числом параллельных процессов до 1024, тогда как измерение времени для представленная в настоящем отчете программа ORD14ADJ производилось для одного вычислительного ядра настольного ПК (процессор AMD 2.2 GHz, память 2 Gbytes). Для тестирования была использована структура разреженности симметричной матрицы «audikw_1», входящей в коллекцию разреженных матриц университета Флориды [9]. Соответствующий неориентированный граф имеет n=943695 узлов и 38354076 дуг, причем число дуг, связанных с узлом, находится в пределах от 21 до 345. Число пробных разбиений в ORD14ADJ берется равным NIT=1.
Таблица 1. Сравнение результатов ORD14ADJ и ParMETIS на структуре «audikw_1»
Число блоков NBL=p |
Метод разбиения |
EdgeCut |
Балансировка |
Время счета |
16 |
ParMETIS ORD14ADJ |
1357326 2370564 |
0.960 |
10.4 |
32 |
ParMETIS ORD14ADJ |
2027681 3404502 |
0.950 |
10.9 |
64 |
ParMETIS ORD14ADJ |
2965230 4503672 |
0.950 |
3.13 |
128 |
ParMETIS ORD14ADJ |
4162268 5960709 |
0.950 |
3.38
|
256 |
ParMETIS ORD14ADJ |
5710116 7712100 |
0.950 |
1.40 |
512 |
ParMETIS ORD14ADJ |
7524868 9746582 |
0.950 |
1.57 |
1024 |
ParMETIS ORD14ADJ |
9745613 12207705 |
0.960 |
1.15 |
2048 |
ParMETIS ORD14ADJ |
12534227 14959654 |
0.930 |
2.36
|