登录
注:本文是《机器学习数学基础》的补充内容,供对函数了解较少或者遗忘较多的读者参考。从初中代数,就已经引入了函数这个概念,其英文单词是function,中文翻译为函数,这个词语是由大清朝数学家李善兰所翻译,他在所著的《代数学》书中解释:“凡此变数中函(包含)彼变数者,则此为彼之函数”(台湾省的有关资料中,常将变量称为“变数”)。函数这个数学名词是莱布尼兹在1694年开始使用的,当时他用这个名词描述与曲线相关的量,如曲线的斜率等。现在,我们将莱布尼兹所说的函数称为函数的导数。此后,很多数学家对函数做
在机器学习中,经常要度量两个对象的相似度,例如k-最近邻算法,即通过度量数据的相似度而进行分类。在无监督学习中,K-Means算法是一种聚类算法,它通过欧几里得距离计算指定的数据点与聚类中心的距离。在推荐系统中,也会用到相似度的计算(当然还有其他方面的度量)。本文中,将介绍业务实践中最常用的几种相似度的度量方法。基于相似性的度量皮尔逊相关系数斯皮尔曼秩相关系数肯德尔秩相关系数余弦相似度雅卡尔相似度基于距离的度量欧几里得距离曼哈顿距离1. 基于相似性的度量1.1 皮尔逊相关系数皮尔逊相关系数度量两