cupy.cuda.nvtx.RangePush#
- cupy.cuda.nvtx.RangePush(message, int id_color=-1)#
开始一个嵌套范围。
范围用于描述应用程序执行期间跨越时间段的事件。这在使用 Nsight Systems 进行性能分析时特别有用,可以帮助将用户指定的范围与 CuPy 的内部 CUDA 内核关联起来。范围的持续时间由相应的
RangePush()
和RangePop()
调用对定义,这些调用可以嵌套。from cupy.cuda.nvtx import RangePush, RangePop RangePush("Nested Powers of A") for i in range(N): RangePush("Iter {}: Double A".format(i)) A = 2*A RangePop() RangePop()