主成分分析应用毕业论文(毕业设计:二维主成分分析在人脸中的应用研究)

1.毕业设计:二维主成分分析在人脸中的应用研究

ponent

你的邮箱发不进去,请换一个,这里发部分供你参考Principal component analysisPrincipal component analysis (PCA) is a mathematical procedure that uses an orthogonal transformation to convert a set of observations of possibly correlated variables into a set of values of uncorrelated variables called principal components. The number of principal components is less than or equal to the number of original variables. This transformation is defined in such a way that the first principal component has as high a variance as possible (that is, accounts for as much of the variability in the data as possible), and each succeeding component in turn has the highest variance possible under the constraint that it be orthogonal to (uncorrelated with) the preceding components. Principal components are guaranteed to be independent only if the data set is jointly normally distributed. PCA is sensitive to the relative scaling of the original variables. Depending on the field of application, it is also named the discrete Karhunen–Loève transform (KLT), the Hotelling transform or proper orthogonal decomposition (POD).PCA was invented in 1901 by Karl Pearson.[1] Now it is mostly used as a tool in exploratory data analysis and for making predictive models. PCA can be done by eigenvalue decomposition of a data covariance matrix or singular value decomposition of a data matrix, usually after mean centering the data for each attribute. The results of a PCA are usually discussed in terms of component scores (the transformed variable values corresponding to a particular case in the data) and loadings (the weight by which each standarized original variable should be multiplied to get the component score) (Shaw, 2003).PCA is the simplest of the true eigenvector-based multivariate analyses. Often, its operation can be thought of as revealing the internal structure of the data in a way which best explains the variance in the data. If a multivariate dataset is visualised as a set of coordinates in a high-dimensional data space (1 axis per variable), PCA can supply the user with a lower-dimensional picture, a "shadow" of this object when viewed from its (in some sense) most informative viewpoint. This is done by using only the first few principal components so that the dimensionality of the transformed data is reduced.PCA is closely related to factor analysis; indeed, some statistical packages (such as Stata) deliberately conflate the two techniques. True factor analysis makes different assumptions about the underlying structure and solves eigenvectors of a slightly different matrix.。

3.主成分分析

主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构。

综合指标即为主成分。所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。

因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程。

其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。三种分析方法既有区别也有联系,本文力图将三者的异同进行比较,并举例说明三者在实际应用中的联系,以期为更好地利用这些高级统计方法为研究所用有所裨益。

二、基本思想的异同(一) 共同点 主成分分析法和因子分析法都是用少数的几个变量(因子) 来综合反映原始变量(因子) 的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85 %以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。并且新的变量彼此间互不相关,消除了多重共线性。

这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量。在主成分分析中,最终确定的新变量是原始变量的线性组合,如原始变量为x1 ,x2 ,. . . ,x3 ,经过坐标变换,将原有的p个相关变量xi 作线性变换,每个主成分都是由原有p 个变量线性组合得到。

在诸多主成分Zi 中,Z1 在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。

公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子。对新产生的主成分变量及因子变量计算其得分,就可以将主成分得分或因子得分代替原始变量进行进一步的分析,因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的作用,为我们处理数据降低了难度。

聚类分析的基本思想是: 采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系[3 ]。

聚类分析是通过一个大的对称矩阵来探索相关关系的一种数学分析方法,是多元统计分析方法,分析的结果为群集。对向量聚类后,我们对数据的处理难度也自然降低,所以从某种意义上说,聚类分析也起到了降维的作用。

(二) 不同之处 主成分分析是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,也就是求出少数几个主成分(变量) ,使它们尽可能多地保留原始变量的信息,且彼此不相关。它是一种数学变换方法,即把给定的一组变量通过线性变换,转换为一组不相关的变量(两两相关系数为0 ,或样本向量彼此相互垂直的随机变量) ,在这种变换中,保持变量的总方差(方差之和) 不变,同时具有最大方差,称为第一主成分;具有次大方差,称为第二主成分。

依次类推。若共有p 个变量,实际应用中一般不是找p 个主成分,而是找出m (m 因子分析是寻找潜在的起支配作用的因子模型的方法。

因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

通过因子分析得来的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。

具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。因子分析只能解释部分变异,主成分分析能解释所有变异。

聚类分析算法是给定m 维空间R 中的n 个向量,把每个向量归属到k 个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。聚类可以理解为: 类内的相关性尽量大,类间相关性尽量小。

聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内在的数据规律。从三类分析的基本思想可以看出,聚类分析中并没于产生新变量,但是主成分分析和因子分析都产生了新变量。

三、数据标准化的比较 主成分分析中为了消除量纲和数量级,通常需要将原始数据进行标准化,将其转化为均值为0方差为1 的无量纲数据。

主成分分析应用毕业论文

转载请注明出处众文网 » 主成分分析应用毕业论文(毕业设计:二维主成分分析在人脸中的应用研究)

资讯

电影的创新毕业论文(求电影方面论文)

阅读(79)

本文主要为您介绍电影的创新毕业论文,内容包括求电影方面论文,谁能写一份关于《创新》的论文,求一篇中国电影史的论文。《集结号》 从某种意义上讲,本片更多地探讨的是《父辈的旗帜》中战士走向和平之后如何适应和平生活的问题,在这部美国影

资讯

电气行业销售毕业论文(电力市场营销毕业论文,咋写)

阅读(83)

本文主要为您介绍电气行业销售毕业论文,内容包括电力市场营销毕业论文,咋写,电力市场营销毕业论文,咋写,帮忙找一篇关于电力市场营销的毕业论文。前言进入二十一世纪,社会经济的发展日新月异,大量新技术的运用,使得市场中充满了各种各样的产品

资讯

传感器与检测技术毕业论文(检测与传感技术工程硕士论文)

阅读(69)

本文主要为您介绍传感器与检测技术毕业论文,内容包括求一篇关于传感器的论文40005000字,,检测与传感技术工程硕士论文,有关传感器的一篇论文。检测与传感技术方面的论文在 轻风论文网 很多的哦,你可以参考下,如果还有不清楚的地方,可以咨询下

资讯

毕业论文老教育(如何实施《老年教育发展规划》论文)

阅读(68)

本文主要为您介绍毕业论文老教育,内容包括如何实施《老年教育发展规划》论文,求一篇老年大学论文,老年毕业论文。一:题目。应能概括整个论文最重要的内容,言简意赅,引人注目,一般不宜超过20个字。论文摘要和关键词。2、论文摘要应阐述学位论文

资讯

本科毕业论文写作注意事项(毕业论文写作的注意事项有哪些)

阅读(78)

本文主要为您介绍本科毕业论文写作注意事项,内容包括毕业论文写作的注意事项,本科毕业论文要注意哪些方面,毕业论文的写作应该注意什么。论文摘要中应排除本学科领域已成为常识的内容;切忌把应在引言中出现的内容写入摘要;一般也不要对论文内

资讯

毕业论文的项目分解结构(毕业论文一般分哪几个部分)

阅读(73)

本文主要为您介绍毕业论文的项目分解结构,内容包括毕业论文一般分哪几个部分,论文的框架是什么,论文的组成部分。据学术堂了解毕业论文一般分为以下八个部分:论文题目,有的含副标题。题目之下是作者署名,署名之前或下边一行写作者的校、院、系

资讯

毕业论文事实婚姻(关于事实婚姻的著作有什么)

阅读(64)

本文主要为您介绍毕业论文事实婚姻,内容包括周末自考论文答辩我写的论文是论事实婚姻的认定和处理老师一般会,法律上已经没有规定事实婚姻了还可以写这方面的论文吗,重婚罪有关毕业论文,关于前后两个事实婚是否构成重婚。论事实婚姻的法律

资讯

电影的创新毕业论文(求电影方面论文)

阅读(79)

本文主要为您介绍电影的创新毕业论文,内容包括求电影方面论文,谁能写一份关于《创新》的论文,求一篇中国电影史的论文。《集结号》 从某种意义上讲,本片更多地探讨的是《父辈的旗帜》中战士走向和平之后如何适应和平生活的问题,在这部美国影

资讯

电气行业销售毕业论文(电力市场营销毕业论文,咋写)

阅读(83)

本文主要为您介绍电气行业销售毕业论文,内容包括电力市场营销毕业论文,咋写,电力市场营销毕业论文,咋写,帮忙找一篇关于电力市场营销的毕业论文。前言进入二十一世纪,社会经济的发展日新月异,大量新技术的运用,使得市场中充满了各种各样的产品

资讯

传感器与检测技术毕业论文(检测与传感技术工程硕士论文)

阅读(69)

本文主要为您介绍传感器与检测技术毕业论文,内容包括求一篇关于传感器的论文40005000字,,检测与传感技术工程硕士论文,有关传感器的一篇论文。检测与传感技术方面的论文在 轻风论文网 很多的哦,你可以参考下,如果还有不清楚的地方,可以咨询下

资讯

毕业论文老教育(如何实施《老年教育发展规划》论文)

阅读(68)

本文主要为您介绍毕业论文老教育,内容包括如何实施《老年教育发展规划》论文,求一篇老年大学论文,老年毕业论文。一:题目。应能概括整个论文最重要的内容,言简意赅,引人注目,一般不宜超过20个字。论文摘要和关键词。2、论文摘要应阐述学位论文