TypechoJoeTheme

半醉残影

统计
搜索到 4 篇与 机器学习 的结果
2021-06-04

数据科学中常见的9种距离度量方法

数据科学中常见的9种距离度量方法
来源:机器之心 点击查看前言在数据挖掘中,我们经常需要计算样本之间的相似度,通常的做法是计算样本之间的距离。在本文中,数据科学家 Maarten Grootendorst 向我们介绍了9种距离度量方法,其中包括欧氏距离、余弦相似度等。正文许多算法,无论是监督学习还是无监督学习,都会使用距离度量。这些度量,如欧几里得距离或者余弦相似性,经常在 k-NN、 UMAP、HDBSCAN 等算法中使用。了解距离度量这个领域可能比你想的更重要,以 k-NN 为例,它常被用于监督学习中。但是,如果你的数据是高维的,欧几里德距离还能用吗?又或者如果你的数据是由地理空间信息组成的,也许半正矢距离是很好的选择。我们究竟如何选择最适合的距离度量?数据科学家 Maarten Grootendorst 向读者介绍了 9 种距离度量方法,并探讨如何以及何时以最佳的方式使用它们。此外 Maarten Grootendorst 还对它们的缺点进行了介绍,以及如何规避不足。1. 欧氏距离(Euclidean Distance)我们从最常见的欧式距离开始,欧式距离可解释为连接两个点的线段的长度。欧式距离公式非常简单...
那棵树看起来生气了
2021-06-04

机器学习,人工智能

459 阅读
0 评论
2021年06月04日
459 阅读
0 评论
2018-08-28

MKLDNN参数优化

MKLDNN参数优化
MKL使用以下环境变量来调整性能:KMP_BLOCKTIME - 设置线程在睡眠之前完成并行区域执行后应该等待的时间(以毫秒为单位)。 KMP_AFFINITY - 启用运行时库将线程绑定到物理处理单元。 KMP_SETTINGS - 在程序执行期间启用(true)或禁用(false)打印OpenMP *运行时库环境变量。 OMP_NUM_THREADS - 指定要使用的线程数。
那棵树看起来生气了
2018-08-28

机器学习

837 阅读
0 评论
2018年08月28日
837 阅读
0 评论
2018-08-27

基于Tensor2Tensor的自然语言翻译

基于Tensor2Tensor的自然语言翻译
Tensor2Tensor前言谷歌研究人员发布了 Tensor2Tensor(T2T),一个用于在 TensorFlow 中训练深度学习模型的开源系统。T2T 能够帮助人们为各种机器学习程序创建最先进的模型,可应用于多个领域,如翻译、语法分析、图像信息描述等,大大提高了研究和开发的速度。T2T 中也包含一个数据集和模型库,其中包括模型(Attention Is All You Need、Depthwise Separable Convolutions for Neural Machine Translation 和 One Model to Learn Them All)。
那棵树看起来生气了
2018-08-27

TensorFlow,机器学习

1,203 阅读
0 评论
2018年08月27日
1,203 阅读
0 评论