机器学习西瓜书第七章贝叶斯分类器笔记 1、贝叶斯决策理论(Bayesiandecisiontheory)是概率框架下实施决策的基本方法。2、欲使用贝叶斯判定准则来最小化决策风险,首先要获得后验概率P。3、极大似然估计(MaximumLikelihoodEstimation,简称MLE)是根据数据采样来估计概率分布参数的经典算法。 2020-02-25 充电学习 #西瓜书
机器学习西瓜书第六章支持向量机笔记 1、支持向量(support vector):就是距离超平面最近的几个训练样本点使得满足某方程式的成立。个人理解就是超平面一侧的点(距离最近)与超平面另外一侧的点(距离最近)其绝对值是相等的。而这个方程式有两个关键量:w=(w1,w2..)法向量、b位移项。2、二次规划(Quadratic Programming,简称QP)是一类典型的优化问题,包括凸二次优化和非凸二次优化。在此类问题中,目标函数 2020-02-24 充电学习 #西瓜书
DBSCAN基于密度的聚类算法 DBSCAN(DensityBasedSpatialClusteringofApplicationswithNoise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。 2018-12-27 充电学习 #DBSCAN #密度聚类算法
HierarchicalClustering分层集群 主要分为两大类agglomerative(自底向上)和divisive(自顶向下)。首先说前者,自底向上,一开始,每个数据点各自为一个类别,然后每一次迭代选取距离最近的两个类别,把他们合并,直到最后只剩下一个类别为止,至此一棵树构造完成。 2018-12-27 技术 #分层集群
python的set python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. 2018-12-27 技术 #set操作