cupyx.profiler._time._PerfCaseResult#
- class cupyx.profiler._time._PerfCaseResult(name, ts, devices)[source]#
一个包含由
benchmark()
记录的计时结果的内部对象。通过将此类的实例转换为字符串,可以获得简单的统计信息。警告
此 API 目前是实验性的,未来版本中可能会发生变化。
方法
- __eq__(value, /)#
返回 self==value。
- __ne__(value, /)#
返回 self!=value。
- __lt__(value, /)#
返回 self<value。
- __le__(value, /)#
返回 self<=value。
- __gt__(value, /)#
返回 self>value。
- __ge__(value, /)#
返回 self>=value。
属性
- cpu_times#
一个形状为
(n_repeat,)
的numpy.ndarray
,以秒为单位存储在 CPU 上花费的时间。这些值是每次重复步骤之间主机端性能计数器(
time.perf_counter()
)的差值。
- gpu_times#
一个形状为
(len(devices), n_repeat)
的numpy.ndarray
,以秒为单位存储在 GPU 上花费的时间。这些值是使用
cudaEventElapsedTime
测量得到的,事件记录在每次重复步骤之前/之后。