cupy.cuda.nvtx.RangePush#

cupy.cuda.nvtx.RangePush(message, int id_color=-1)#

开始一个嵌套范围。

范围用于描述应用程序执行期间跨越时间段的事件。这在使用 Nsight Systems 进行性能分析时特别有用,可以帮助将用户指定的范围与 CuPy 的内部 CUDA 内核关联起来。范围的持续时间由相应的 RangePush()RangePop() 调用对定义,这些调用可以嵌套。

from cupy.cuda.nvtx import RangePush, RangePop

RangePush("Nested Powers of A")
for i in range(N):
    RangePush("Iter {}: Double A".format(i))
    A = 2*A
    RangePop()
RangePop()
参数:
  • message (str) – 范围的名称。

  • id_color (int) – 范围颜色的 ID。