cupyx.profiler._time._PerfCaseResult#

class cupyx.profiler._time._PerfCaseResult(name, ts, devices)[source]#

一个包含由 benchmark() 记录的计时结果的内部对象。通过将此类的实例转换为字符串,可以获得简单的统计信息。

警告

此 API 目前是实验性的,未来版本中可能会发生变化。

方法

to_str(show_gpu=False)[source]#
__eq__(value, /)#

返回 self==value。

__ne__(value, /)#

返回 self!=value。

__lt__(value, /)#

返回 self<value。

__le__(value, /)#

返回 self<=value。

__gt__(value, /)#

返回 self>value。

__ge__(value, /)#

返回 self>=value。

属性

cpu_times#

一个形状为 (n_repeat,)numpy.ndarray,以秒为单位存储在 CPU 上花费的时间。

这些值是每次重复步骤之间主机端性能计数器(time.perf_counter())的差值。

gpu_times#

一个形状为 (len(devices), n_repeat)numpy.ndarray,以秒为单位存储在 GPU 上花费的时间。

这些值是使用 cudaEventElapsedTime 测量得到的,事件记录在每次重复步骤之前/之后。