当前位置:   article > 正文

OpenMP 中多 GPU、多stack和多 C-Slice 的显式扩展_openmp stack

openmp stack

测试

######################################################################

设备探索

*****************

在运行应用程序之前,建议运行 ``sycl-ls`` 命令来找出该平台上可用的设备,特别是当运行是为了性能测量时。 这可确保运行不会采用后备路径。

OpenMP 中多 GPU、多stack和多 C-Slice 的显式扩展

上下文

**********

OpenMP 上下文是隐式的。 runtime创建并管理上下文,但添加了一个用于查询 OpenMP 上下文的 Intel 扩展( ``omp_target_get_context()`` )以支持 ``interop`` 。

USM(Unified Shared Memory)

*******************************

添加了三个新的 OpenMP API 作为 USM 内存分配的Intel扩展。 还添加了对 USM 的 ``omp_target_alloc`` API 支持。 请参阅 :ref:`openmp_usm_allocation-chinese` 部分了解详细信息。

与子子设备关联的上下文

***************************************

创建其中包含单个子子设备的上下文,并将队列附加到该子子设备(compute slice)。 在该方案中,执行/可见性仅限于子子设备,并期望在compute slice(C-slice)级别提供细粒度的划分和控制。 看一个代码示例:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/1008268
推荐阅读
相关标签
  

闽ICP备14008679号