编写op,blas-gpu使用问题
Created by: littletomatodonkey
我参考mul_op.cc的写法,想写自己的op,我看blas.sh中的关于MatMul运算的cpu和gpu写法是统一的(blas有一个DeviceContext
的模板),因此想基于此调用gpu的GEMM和SCAL等函数,但是提示undefined reference to void paddle::operators::math::Blas<paddle::platform::CUDADeviceContext>::SCAL<float>(int, float, float*) const'
,想问下cuda版本的SCAL等函数在实现新op中是怎么使用的呢?