赞
踩
OpenMP是一种用于共享内存并行系统的多线程程序设计方案,支持的编程语言包括C、C++和Fortran。OpenMP提供了对并行算法的高层抽象描述,特别适合在多核CPU机器上的并行程序设计。编译器根据程序中添加的pragma指令,自动将程序并行处理,使用OpenMP降低了并行编程的难度和复杂度。当编译器不支持OpenMP时,程序会退化成普通(串行)程序。程序中已有的OpenMP指令不会影响程序的正常编译运行。
OpenMP通过编译指导命令来并行化,什么是编译指导命令?简单来说就是我们平常写的#开头的语句,通过程序中插入的这些编译指导命令,计算机就会完成并行计算的工作。在C/C++程序中,OpenMP的所有的编译指导命令都是以#pragma omp开始的,后面跟具体的功能指导命令,命令形式如下:
#pragma omp 指令 子句,子句,子句……
指令可以单独出现,子句必须出现在指令之后。现在如果看不懂也没关系,下面将开始用具体的例子来说明。
OpenMP采用fork-join的执行模式。开始的时候只存在一个主线程,当需要进行并行计算的时候,派生出若干个分支线程来执行并行任务。当并行代码执行完成之后,分支线程会合,并把控制流程交给单独的主线程。
一个典型的fork-join执行模型的示意图如下:
OpenMP编程模型以线程为基础,通过编译制导指令制导并行化,有三种编程要素可以实现并行化控制,他们分别是编译制导、API函数集和环境变量。
编译制导指令以#pragma omp 开始,后边跟具体的功能指令,格式如:#pragma omp 指令[子句[,子句] …]。常用的功能指令如下:
相应的OpenMP子句为:
除上述编译制导指令之外,OpenMP还提供了一组API函数用于控制并发线程的某些行为,下面是一些常用的OpenMP API函数以及说明:
OpenMP中定义一些环境变量,可以通过这些环境变量控制OpenMP程序的行为,常用的环境变量:
前文讲到了openMP的语句方式,现在先来解锁一个最为简单也最为频繁的指令 parallel
#include<omp.h>
#include<iostream>
using namespace std;
int main()
{
#pragma omp parallel
{
cout << "Hello, world!" << endl;
}
}
执行结果:
parallel制导命令表示接下来由花括号括起来的区域将创建多个线程并行执行。可以用num_threads子句来控制线程的个数,如下:
#include<omp.h>
#include<iostream>
using namespace std;
int main()
{
#pragma omp parallel num_threads(5)
{
cout << "Hello, world!" << endl;
}
}
还可以用一个函数:
#include<omp.h>
#include<iostream>
using namespace std;
int main()
{
omp_set_num_threads(2);
#pragma omp parallel
{
cout << "Hello, world!" << endl;
}
}
好了,现在你已经懂了如何让特定的程序区域并行起来,接下来将解锁一个常用的制导命令 for,直接将你的for循环体提升n倍!在并行域里面用以下命令,在这条语句之后的一个for循环语句中每一个要循环的任务将被分配给不同的线程去执行。
例如:
#include<omp.h>
#include<iostream>
using namespace std;
int main()
{
omp_set_num_threads(2);
#pragma omp parallel
{
#pragma omp for
for(int i=0;i<4;i++)
cout << omp_get_thread_num() << endl;
}
}
执行结果:
也可以直接把for写在parallel后面
注意,关于for循环有几个大坑需要注意,在这篇博客当中有提到:https://blog.csdn.net/qq_34488063/article/details/53177078
所以,用for循环最好采用for(int i=0;i<N;i++)
这种形式就好了,别整太麻烦。
上面的两个制导命令parallel和for已经能够对科学计算程序性能有了足够大的改善,相信大家已经很好地掌握了制导命令的使用方式,接下是关于for循环的调度模式的一些内容。
在以上的任务中,各个线程自动分配到要执行的任务标号,没有对任务做一些进一步的调度,接下来介绍的字句将会对for循环任务的调度做更细致一些的规定。
用schedule子句进行for循环任务调度的管理
schedule子句形式
type参数有四种:1.static, 2.dynamic, 3.guided, 4.runtime
size参数是整形数据:表示循环迭代次数划分的单位。
1.static参数
静态调度,不用size参数时分配给每个程序的都是n/t次连续迭代,n为迭代次数,t为并行的线程数目。
#include<omp.h>
#include<iostream>
using namespace std;
int main()
{
omp_set_num_threads(2);
#pragma omp parallel for schedule(static)
for(int i=0;i<8;i++)
cout << omp_get_thread_num() << endl;
}
运行结果
使用size参数,表示每次分配给线程size次的连续迭代。
2.dynamic参数
动态调度模式是先到先得的方式进行任务分配,不用size参数的时候,先把任务干完的线程先取下一个任务,以此类推,而不是一开始就分配固定的任务数。使用size参数的时候,分配的任务以size为单位,一次性分配size个。虽然很智能,在任务难度不均衡的时候适合用dynamic,否则会引起过多的任务动态申请的开销。
3.guided参数
刚开始每个线程会分配到比较大的迭代块,后来分配到的迭代块逐渐递减,没有指定size就会降到1,否则降到size。
4.runtime
基本不会用到,需要了解的可以自行了解。
用sections把不同的区域交给不同的线程去执行
用法:
#include<omp.h> #include<iostream> using namespace std; int main() { omp_set_num_threads(3); #pragma omp parallel sections { #pragma omp section { cout <<omp_get_thread_num(); } #pragma omp section { cout << omp_get_thread_num(); } #pragma omp section { cout << omp_get_thread_num(); } } }
可以看出这时候三个线程分为三部分并发执行每一个section区域。
single制导指令所包含的代码段只有一个线程执行,别的线程跳过该代码,如果没有nowait子句,那么其他线程将会在single制导指令结束的隐式同步点等待。有nowait子句其他线程将跳过等待往下执行。
int main()
{
omp_set_num_threads(4);
#pragma omp parallel
{
#pragma omp single
{
cout << "single thread=" << omp_get_thread_num()<<endl;
}
cout << omp_get_thread_num() << endl;
}
}
执行结果
可以看出,在隐式同步点已经同步。这个代码和运行结果可能不太明显,大家懂这个意思就好了。single由一个线程进行执行,然后其它线程等它执行完然后汇合一起往下执行。
添加上nowait子句就不会在隐式点同步了。
想要了解更详细的内容可以关注:https://github.com/lovelyyoshino/Chinese_Notes/blob/main/Automatic%20driving/OpenMP_simple_Program.pdf
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。