CuPy 特有函数#

CuPy 特有函数位于 cupyx 命名空间下。

cupyx.rsqrt

返回倒数平方根。

cupyx.scatter_add(a, slices, value)

将给定值添加到数组的指定元素。

cupyx.scatter_max(a, slices, value)

将由索引指定的元素的最大值存储到数组中。

cupyx.scatter_min(a, slices, value)

将由索引指定的元素的最小值存储到数组中。

cupyx.empty_pinned(shape[, dtype, order])

返回具有给定形状和 dtype 的新的未初始化 NumPy 数组。

cupyx.empty_like_pinned(a[, dtype, order, ...])

返回具有与给定数组相同形状和 dtype 的新的未初始化 NumPy 数组。

cupyx.zeros_pinned(shape[, dtype, order])

返回具有给定形状和 dtype 的新的零初始化 NumPy 数组。

cupyx.zeros_like_pinned(a[, dtype, order, ...])

返回具有与给定数组相同形状和 dtype 的新的零初始化 NumPy 数组。

非 SciPy 兼容 Signal API#

cupyx.signal 下的函数是 Nvidia cuSignal 团队慷慨移植的非 SciPy 兼容信号 API。

cupyx.signal.channelize_poly(x, h, n_chans)

将信号多相通道化为 n 个通道

cupyx.signal.convolve1d3o(in1, in2[, mode, ...])

使用三阶滤波器对一维数组进行卷积。

cupyx.signal.pulse_compression(x, template)

脉冲压缩用于通过对发射脉冲(模板)与接收信号 (x) 进行匹配滤波来提高距离分辨率和 SNR。

cupyx.signal.pulse_doppler(x[, window, nfft])

脉冲多普勒处理产生一个距离/多普勒数据矩阵,该矩阵表示与杂波分离的移动目标数据。

cupyx.signal.cfar_alpha(pfa, N)

计算与给定误报概率和参考单元数 N 对应的 alpha 值。

cupyx.signal.ca_cfar(array, guard_cells, ...)

计算给定数组的单元平均恒定误报率 (CA CFAR) 检测器阈值并返回。

cupyx.signal.freq_shift(x, freq, fs)

在 fs 采样率下按 freq 偏移信号频率

性能分析工具#

cupyx.profiler.benchmark(func[, args, ...])

用于测量 CPU 和 GPU 耗时的计时工具。

cupyx.profiler.time_range([message, ...])

使用 NVTX/rocTX 通过范围标记函数调用。

cupyx.profiler.profile()

在 with 语句期间启用 CUDA 性能分析。

DLPack 工具#

以下是用于从 DLPack 张量或任何支持 DLPack 数据交换协议的对象创建 cupy.ndarray 的辅助函数。更多详细信息请参见 DLPack

cupy.from_dlpack(array, *[, device, copy])

符合 DLPack 数据交换协议的数组对象之间的零拷贝转换。

自动内核参数优化 (cupyx.optimizing)#

cupyx.optimizing.optimize(*[, key, path, ...])

优化内核启动参数的上下文管理器。