cupyx.profiler._time._PerfCaseResult#

class cupyx.profiler._time._PerfCaseResult(name, ts, devices)[source]#

一个包含由 benchmark() 记录的计时结果的内部对象。通过将此类的实例转换为字符串，可以获得简单的统计信息。

警告

此 API 目前是实验性的，未来版本中可能会发生变化。

方法

属性

cpu_times#

一个形状为 (n_repeat,) 的 numpy.ndarray，以秒为单位存储在 CPU 上花费的时间。

这些值是每次重复步骤之间主机端性能计数器（time.perf_counter()）的差值。

gpu_times#

一个形状为 (len(devices), n_repeat) 的 numpy.ndarray，以秒为单位存储在 GPU 上花费的时间。

这些值是使用 cudaEventElapsedTime 测量得到的，事件记录在每次重复步骤之前/之后。