当前位置：首页 > 默认分类 > 正文内容

【算法】机器学习算法之Kmeans算法（K均值算法）

virtualman5年前 (2021-02-06)默认分类4503

Kmeans算法（K均值算法）

KMeans算法是典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。

如何定义两个样本的相似：

两个样本在欧式空间中的距离

引入新概念：

Cluster：表示一个簇
centroid：表示当前簇的中心

算法步骤：

1.随机从数据集中选取k个样本当做centroid
2.对于数据集中的每个点，计算它距离每个centroid的距离，并把它归为距离最近打那个cluster
3.更新新的centroid位置
4.重复2和2，直到centroid的位置不再改变

KMEANS 的优缺点

Pros：

1. 非监督类的算法不需要样本的标注信息

CONS：

1. 不能利用到数据的标注信息，意味着模型的性能不如其他监督学习

2. 对于K的取值，也就是你认为数据集中的样本应该分为几类，这个参数的设置极为敏感！
不同的K值，导致完全不同的分类结果！

3. 对于数据集本身样本的分布也很敏感

和KNN的区别：

KNN：

  1.只关注待测样本的局部分布
  
  2.K：K个最近邻 
  
  3.监督类模型

KMeans：

  1.关注样本的全局分布
  
  2.k：K个簇

本文链接：https://virtualman.top/index.php/post/10.html

【动态规划】基础背包问题

1159. 背包问题一 (Standard IO) 时间限制: 1000 ms 空间限制: 262144 KB 具体限制题目描述有个背包可承受重量N，现有T件物品每件物品重量为...

【疑难杂症】记录一次定位并修复涉及支付、转账的系统性BUG

在某个线上的项目上，突然收到用户反馈，存在转账连续转两次的情况。一开始接到反款后并没有太在意，因为这个项目已经在线上稳定运行了近两年的时间，期间也并没有对订单或者支付系统进行修改。支付的接口也没有发生变化，因此，第一次反馈认为是一次用户的误报。但是，今天下午，有个开发者用户给我再一次反馈了这个BUG...

记录一次如何自己使用国外服务器搭建梯子

机缘巧合之下，租了一台亚马逊的美国服务器，想着这么大的服务器不能就跑一个业务吧，得利用起来，于是，就开始了搭建梯子之旅。第一步：使用root账号登上ssh服务器。第二步：执行一键搭建脚本： bash <(wget -qO- -o- https://git.io/v2ray.sh)...

大佬推荐用的两个git指令：git rebase 和 git commit --amend

git rebase git rebase 命令用于将本地的提交重新应用到另一个基础分支上。它可以帮助你保持线性的项目历史记录，避免大量的合并提交（merge commits）。当你从一个分支拉取最新的更改并希望将你的工作基于这些更改之上时，可以使用 git rebase。使用场景：当...

解决！！！关于微信小程序中无法正常显示uview-plus的up-tabs组件样式的问题

一.问题背景uview-plus3.0是基于uView2.x修改的vue3版本，提供了很多好用的移动端组件。点击访问最近在使用uview-plus的tabs标签组件时，需要对标签的背景颜色等样式进行自定义，查看官方文档发现提供了参数activeStyle、inactiveStyle、itemStyl...

【随笔】关于开发一个既能日常记账，又能拥有资产管理功能的APP的Idea

随便写了，想到哪里写哪里。最近一直在市面找一款记账APP，但是感觉都不满足我的需求。我的想法是，在普通账本程序的基础上，再加上多人管理。资产管理。资产管理一定要把价格接口对接好。我举个例子，比如有虚拟货币资产ETH 1个，那么就应该在统计的时候，按实时市值进行统计。又或者按照当天的市值统计。关于资产...

Virtualman的个人博客

【算法】机器学习算法之Kmeans算法（K均值算法）

Kmeans算法（K均值算法）

如何定义两个样本的相似：

引入新概念：

算法步骤：

KMEANS 的优缺点

Pros：

CONS：

和KNN的区别：

KNN：

KMeans：

相关文章

【动态规划】基础背包问题

【疑难杂症】记录一次定位并修复涉及支付、转账的系统性BUG

记录一次如何自己使用国外服务器搭建梯子

大佬推荐用的两个git指令：git rebase 和 git commit --amend

解决！！！关于微信小程序中无法正常显示uview-plus的up-tabs组件样式的问题

【随笔】关于开发一个既能日常记账，又能拥有资产管理功能的APP的Idea

发表评论

Powered By Z-BlogPHP. Theme by TOYEAN.

Virtualman的个人博客

【算法】机器学习算法之Kmeans算法（K均值算法）

Kmeans算法（K均值算法）

如何定义两个样本的相似：

引入新概念：

算法步骤 ：

KMEANS 的优缺点

Pros：

CONS：

和KNN的区别：

KNN：

KMeans：

相关文章

【动态规划】基础背包问题

【疑难杂症】记录一次定位并修复涉及支付、转账的系统性BUG

记录一次如何自己使用国外服务器搭建梯子

大佬推荐用的两个git指令：git rebase 和 git commit --amend

解决！！！关于微信小程序中无法正常显示uview-plus的up-tabs组件样式的问题

【随笔】关于开发一个既能日常记账，又能拥有资产管理功能的APP的Idea

发表评论取消回复

Powered By Z-BlogPHP. Theme by TOYEAN.

算法步骤：

发表评论