2021-06-04 数据科学中常见的9种距离度量方法 数据科学中常见的9种距离度量方法 来源:机器之心 点击查看前言在数据挖掘中,我们经常需要计算样本之间的相似度,通常的做法是计算样本之间的距离。在本文中,数据科学家 Maarten Grootendorst 向我们介绍了9种距离度量方法,其中包括欧氏距离、余弦相似度等。正文许多算法,无论是监督学习还是无监督学习,都会使用距离度量。这些度量,如欧几里得距离或者余弦相似性,经常在 k-NN、 UMAP、HDBSCAN 等算法中使用。了解距离度量这个领域可能比你想的更重要,以 k-NN 为例,它常被用于监督学习中。但是,如果你的数据是高维的,欧几里德距离还能用吗?又或者如果你的数据是由地理空间信息组成的,也许半正矢距离是很好的选择。我们究竟如何选择最适合的距离度量?数据科学家 Maarten Grootendorst 向读者介绍了 9 种距离度量方法,并探讨如何以及何时以最佳的方式使用它们。此外 Maarten Grootendorst 还对它们的缺点进行了介绍,以及如何规避不足。1. 欧氏距离(Euclidean Distance)我们从最常见的欧式距离开始,欧式距离可解释为连接两个点的线段的长度。欧式距离公式非常简单... 那棵树看起来生气了 2021-06-04 机器学习,人工智能 487 阅读 0 评论 2021年06月04日 487 阅读 0 评论
2018-08-28 MKLDNN参数优化 MKLDNN参数优化 MKL使用以下环境变量来调整性能:KMP_BLOCKTIME - 设置线程在睡眠之前完成并行区域执行后应该等待的时间(以毫秒为单位)。 KMP_AFFINITY - 启用运行时库将线程绑定到物理处理单元。 KMP_SETTINGS - 在程序执行期间启用(true)或禁用(false)打印OpenMP *运行时库环境变量。 OMP_NUM_THREADS - 指定要使用的线程数。 那棵树看起来生气了 2018-08-28 机器学习 871 阅读 0 评论 2018年08月28日 871 阅读 0 评论
2018-08-27 基于Tensor2Tensor的自然语言翻译 基于Tensor2Tensor的自然语言翻译 Tensor2Tensor前言谷歌研究人员发布了 Tensor2Tensor(T2T),一个用于在 TensorFlow 中训练深度学习模型的开源系统。T2T 能够帮助人们为各种机器学习程序创建最先进的模型,可应用于多个领域,如翻译、语法分析、图像信息描述等,大大提高了研究和开发的速度。T2T 中也包含一个数据集和模型库,其中包括模型(Attention Is All You Need、Depthwise Separable Convolutions for Neural Machine Translation 和 One Model to Learn Them All)。 那棵树看起来生气了 2018-08-27 TensorFlow,机器学习 1,234 阅读 0 评论 2018年08月27日 1,234 阅读 0 评论
2018-05-20 安装Intel Openvino 安装Intel Openvino Install OpenvinoOperating Systems:Ubuntu* 16.04.3 long-term support (LTS), 64-bitCentOS* 7.4, 64-bitYocto Project Poky Jethro v2.0.3, 64-bit (for target only) 那棵树看起来生气了 2018-05-20 机器学习 714 阅读 0 评论 2018年05月20日 714 阅读 0 评论