cupy.cuda.nvtx.RangePushC#

cupy.cuda.nvtx.RangePushC(message, uint32_t color=0)#

开始一个嵌套范围。

范围用于描述应用程序执行期间跨越一段时间的事件。这在使用 Nsight Systems 进行性能分析时特别有用,可以帮助将用户指定的范围与 CuPy 的内部 CUDA 核函数联系起来。范围的持续时间由相应的 RangePushC()RangePop() 调用对定义,这些调用可以嵌套。

from cupy.cuda.nvtx import RangePushC, RangePop

RangePush("Nested Powers of A")
for i in range(N):
    RangePushC("Iter {}: Double A".format(i))
    A = 2*A
    RangePop()
RangePop()
参数:
  • message (str) – 范围的名称。

  • color (uint32) – 范围的 ARGB 颜色。