那棵树看起来生气了
MKLDNN参数优化
08/28
MKL使用以下环境变量来调整性能:
KMP_BLOCKTIME - 设置线程在睡眠之前完成并行区域执行后应该等待的时间(以毫秒为单位)。
KMP_AFFINITY - 启用运行时库将线程绑定到物理处理单元。
KMP_SETTINGS - 在程序执行期间启用(true)或禁用(false)打印OpenMP *运行时库环境变量。
OMP_NUM_THREADS - 指定要使用的线程数。
有关KMP变量的更多详细信息在Intel网站上,以及gnu.org上的OMP变量
尽管调整环境变量会有很大的收益,这在下面讨论,但简单的建议是将其设置为inter_op_parallelism_threads等于物理CPU的数量并设置以下环境变量:
KMP_BLOCKTIME=0
KMP_AFFINITY=granularity=fine,verbose,compact,1,0
三合一收款
下面三种方式都支持哦