一、系统承载吞度量 1、吞吐量TPS(Transactions Per Second): 吞吐量是指系统在单位时间内处理请求的数量;每秒传输的事...
PageRank算法是图的链接分享的代表性算法,属于图数据上的无监督学习方法。PageRank可以定义在任意有向图上,后来被应用到社会影响力分析...
潜在狄利克雷分配LDA,作为基于贝叶斯学习的话题模型,是潜在语义分析、概率潜在语义分析的扩展。在文本数据挖掘、图像处理、生物信息处理等领域被广泛...
蒙特卡罗法也称统计模拟方法,是通过从概率模型的随机抽样进行近似数值计算的方法。马尔可夫链蒙特卡罗法是以马尔可夫链为概率模型的蒙特卡罗法。 马尔可...
概率潜在语义分析PLSA,是一种利用概率生成模型对文本集合进行话题分析的无监督学习方法。最大特点: 用隐变量表示话题 整个模型表示文本生成话题,...
潜在语义分析LSA:是一种无监督学习,主要用于文本的话题分析。特点:通过矩阵分解发现文本与单词直接的基于话题的语义关系。 文本信息处理中,传统的...
主成分分析PCA,利用正交变换把由线性相关变量表示的观测数据转换为少数几个由线性无关变量表示的数据,线性无关的变量称为主成分。主成分的个数通常小...
一、奇异值分解的定义与性质 1、定义与定理 奇异值分解 注意:奇异值分解不要求矩阵A是方阵,事实上矩阵的奇异值分解可以看作是方阵的对角化的推广 ...
一、聚类的基本概念 1、相似度或距离 聚类的核心概念是相似度或距离。有多种相似度或距离的定义。因为相似度直接影响聚类的结果,所以其选择是聚类的根...
文集作者