TypechoJoeTheme

半醉残影

统计

MKLDNN参数优化

2018-08-28
/
0 评论
/
872 阅读
/
正在检测是否收录...
08/28

MKL使用以下环境变量来调整性能:

KMP_BLOCKTIME - 设置线程在睡眠之前完成并行区域执行后应该等待的时间(以毫秒为单位)。

KMP_AFFINITY - 启用运行时库将线程绑定到物理处理单元。

KMP_SETTINGS - 在程序执行期间启用(true)或禁用(false)打印OpenMP *运行时库环境变量。

OMP_NUM_THREADS - 指定要使用的线程数。

有关KMP变量的更多详细信息在Intel网站上,以及gnu.org上的OMP变量

尽管调整环境变量会有很大的收益,这在下面讨论,但简单的建议是将其设置为inter_op_parallelism_threads等于物理CPU的数量并设置以下环境变量:

KMP_BLOCKTIME=0

KMP_AFFINITY=granularity=fine,verbose,compact,1,0
深度学习机器学习
朗读
赞(0)
赞赏
感谢您的支持,我会继续努力哒!

三合一收款

下面三种方式都支持哦

微信
QQ
支付宝
打开支付宝/微信/QQ扫一扫,即可进行扫码打赏哦
版权属于:

半醉残影

本文链接:

https://blog.dengyb.com/archives/23/(转载时请注明本文出处及文章链接)

评论 (0)