矩阵,数学术语。在数学中,矩阵(Matrix)是一个按照长方阵列排列的
复数或
实数集合,最早来自于
方程组的
系数及
常数所构成的
方阵。这一概念由19世纪英国数学家
凯利首先提出。
历史
矩阵的研究历史悠久,
拉丁方阵和幻方在史前年代已有人研究。
在数学中,矩阵(Matrix)是一个按照长方阵列排列的
复数或
实数集合,最早来自于
方程组的
系数及常数所构成的
方阵。这一概念由19世纪英国数学家凯利首先提出。作为解决
线性方程的工具,矩阵也有不短的历史。成书最早在东汉前期的《
九章算术》中,用分离
系数法表示
线性方程组,得到了其
增广矩阵。在
消元过程中,使用的把某行乘以某一非零
实数、从某行中减去另一行等运算技巧,相当于矩阵的
初等变换。但那时并没有现今理解的矩阵概念,虽然它与现有的矩阵形式上相同,但在当时只是作为线性方程组的标准表示与处理方式。
矩阵正式作为数学中的研究对象出现,则是在
行列式的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在实际的历史上则恰好相反。日本数学家
关孝和(1683年)与
微积分的发现者之一
戈特弗里德·威廉·莱布尼茨(1693年)近乎同时地独立建立了行列式论。其后行列式作为解
线性方程组的工具逐步发展。1750年,
加布里尔·克拉默发现了
克莱姆法则。
矩阵的概念在19世纪逐渐形成。1800年代,高斯和威廉·若尔当建立了高斯—若尔当消去法。1844年,
德国数学家
费迪南·艾森斯坦(F.Eisenstein)讨论了“变换”(矩阵)及其乘积。1850年,英国数学家
詹姆斯·约瑟夫·西尔维斯特(James Joseph Sylvester)首先使用矩阵一词。
英国
数学家阿瑟·凯利被公认为矩阵论的
奠基人。他开始将矩阵作为独立的
数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现了,这也使得凯利认为矩阵的引进是十分自然的。他说:“我决然不是通过
四元数而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达
线性方程组的方便方法而来的。”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文,研究了矩阵的运算律、矩阵的逆以及
转置和
特征多项式方程。
凯利还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。
哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是德国数学家
弗罗贝尼乌斯(F.G.Frohenius)于1898年给出的。
1854年时
法国数学家
埃尔米特(C.Hermite)使用了“
正交矩阵”这一术语,但他的正式定义直到1878年才由费罗贝尼乌斯发表。1879年,费罗贝尼乌斯引入矩阵
秩的概念。至此,矩阵的体系基本上建立起来了。
无限维矩阵的研究始于1884年。
庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,
施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究
函数空间算子的有力工具。
矩阵的
概念最早在1922年见于中文。1922年,程廷熙在一篇介绍文章中将矩阵译为“纵横阵”。1925年,科学名词审查会算学名词审查组在《
科学》第十卷第四期刊登的审定名词表中,矩阵被翻译为“矩阵式”,
方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“
伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,
中国数学会审查后,
中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就
数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。中华人民共和国成立后编订的《
数学名词》中,则将译名定为“(矩)阵”。1993年,中国自然科学名词审定委员会公布的《
数学名词》中,“矩阵”被定为正式译名,并沿用至今。
定义
由 m × n 个数aij排成的m行n列的数表称为m行n列的矩阵,简称m × n矩阵。记作:
这m×n 个数称为矩阵A的元素,简称为元,数aij位于矩阵A的第i行第j列,称为矩阵A的(i,j)元,以数 aij为(i,j)元的矩阵可记为(aij)或(aij)m × n,m×n矩阵A也记作Amn。
元素是
实数的矩阵称为
实矩阵,元素是
复数的矩阵称为
复矩阵。而行数与列数都等于n的矩阵称为n阶矩阵或n阶方阵。
基本运算
矩阵运算在
科学计算中非常重要,而矩阵的基本运算包括矩阵的加法,减法,数乘,转置,共轭和共轭转置。
加法
矩阵的加法满足下列运算律(A,B,C都是同型矩阵):
应该注意的是只有同型矩阵之间才可以进行加法。
减法
数乘
矩阵的数乘满足以下运算律:
矩阵的加减法和矩阵的数乘合称矩阵的线性运算。
转置
把矩阵A的行和列互相交换所产生的矩阵称为A的转置矩阵(),这一过程称为矩阵的转置
矩阵的转置满足以下运算律:
共轭
矩阵的共轭定义为: .一个2×2复数矩阵的共轭(实部不变,虚部取负)如下所示:
则
共轭转置
矩阵的共轭转置定义为: ,也可以写为:或者写为。一个2×2复数矩阵的共轭转置如下所示:
则
乘法
两个矩阵的乘法仅当第一个矩阵A的列数和另一个矩阵B的行数相等时才能定义。如A是m×n矩阵和B是n×p矩阵,它们的乘积C是一个m×p矩阵 ,它的一个元素:
并将此乘积记为: .
例如:
矩阵的乘法满足以下运算律:
结合律:
左分配律:
右分配律:
行列式
一个n×n的正方矩阵A的行列式记为 或者 ,一个2×2矩阵的行列式可表示如下:
一个n×n矩阵的行列式等于其任意行(或列)的元素与对应的
代数余子式乘积之和,即:
特征值与特征向量
n×n的方块矩阵A的一个特征值和对应特征向量是满足 的
标量以及非零向量。其中为特征向量, 为特征值。
A的所有特征值的全体,叫做A的谱,记为 。矩阵的
特征值和特征向量可以揭示线性变换的深层特性。
矩阵的迹
矩阵A的对角元素之和称为矩阵A的迹(trace),记作 , 即
正定性
n×n的
实对称矩阵A如果满足对所有非零向量 ,对应的
二次型若 ,就称A为正定矩阵。若 则A是一个
负定矩阵,若 ,则A为
半正定矩阵,若A既非半正定,也非半负定,则A为
不定矩阵。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其
特征值都是正数。
矩阵的分解
矩阵分解是将一个矩阵分解为比较简单的或具有某种特性的若干矩阵的和或乘积,矩阵的分解法一般有三角分解、谱分解、
奇异值分解、满秩分解等。
三角分解
设 ,则A可以唯一地分解为A=U1R ,其中U1是酉矩阵,R是正线上三角复矩阵,或A可以唯一地分解为其中L是正线上三角复矩阵,是酉矩阵 。
谱分解
谱分解(Spectral decomposition)是将矩阵分解为由其
特征值和
特征向量表示的矩阵之积的方法。需要注意只有对
可对角化矩阵才可以施以特征分解。
奇异值分解
假设M是一个m×n阶矩阵,其中的元素全部属于
域K,也就是
实数域或复数域。如此则存在一个分解使得
其中U是m×m阶
酉矩阵;Σ是m×n阶
实数对角矩阵;而V*,即V的
共轭转置,是n×n阶酉矩阵。这样的分解就称作M的
奇异值分解。Σ对角线上的元素Σi,i即为M的
奇异值。常见的做法是将奇异值由大而小排列。如此Σ便能由M唯一确定了。
满秩分解
设 ,若存在矩阵 及 ,使得A=FG,则称其为的A一个满秩分解。
LUP分解
LUP分解的思想就是找出三个n×n矩阵L,U,P,满足 。其中L是一个单位下三角矩阵,U是一个单位上三角矩阵,P是一个置换矩阵。 而满足分解条件的矩阵L,U,P称为矩阵A的一个LUP分解。
特殊类别
对称矩阵
在
线性代数中,对称矩阵是一个方形矩阵,其转置矩阵和自身相等。即 。例如: 。
Hermitian矩阵
一个正方的复值矩阵 称为Hermitian矩阵,若A=AH即其元素 ,换言之Hermitian矩阵是一种复共轭对称矩阵。
对一个实值矩阵,Hermitian矩阵与对称矩阵等价。
正交矩阵
一个实的正方矩阵 称为正交矩阵,若 。
酉矩阵
一个复值正方矩阵 称为酉矩阵,若 。
带型矩阵
矩阵 ,若矩阵满足条件aij=0,|i-j|>k,则矩阵A可以称为带型矩阵(banded matrix)。
三角矩阵
在
线性代数中,三角矩阵是方形矩阵的一种,因其非零系数的排列呈三角形状而得名。三角矩阵分上三角矩阵和下三角矩阵两种。若 ,则 的矩阵称为上三角矩阵,若 ,则的矩阵称为下三角矩阵。三角矩阵可以看做是一般方阵的一种简化情形。
相似矩阵
在
线性代数中,相似矩阵是指存在相似关系的矩阵。相似关系是两个矩阵之间的一种
等价关系。两个n×n
矩阵A与B为相似矩阵
当且仅当存在一个n×n的
可逆矩阵P,使得: 或 。
相合矩阵
令 ,并且C非奇异,则矩阵 称为A的相合矩阵。其中线性变换 称为相合变换。
Vandermonde矩阵
Vandermonde矩阵(
范德蒙矩阵)的命名来自Alexandre-Théophile Vandermonde的名字,范德蒙矩阵是一个各列呈现出
几何级数关系的矩阵。
例如:
或以第i行第j列的关系写作:
Hadamard矩阵
Hadamard矩阵(
阿达马矩阵)是一个
方阵,每个元素都是 +1 或 −1,每行都是互相正交的。
n阶的阿达马矩阵H满足: 。这里In是n×n的
单位矩阵。
对角矩阵
对于m×m的矩阵,当 时,有 ,此时所有非对角线上的元素均为0,此时的矩阵称为对角矩阵。
分块矩阵
一个分块矩阵是将矩阵分割出较小的矩阵,这些较小的矩阵就称为子块。例如:
该矩阵可以分为四个2×2的矩阵:
分块后的矩阵可以写为如下形式:
Jacobian矩阵
Jacobian矩阵是函数的一阶
偏导数以一定方式排列成的矩阵。
可表示为如下形式:
旋转矩阵Rotation matrix
旋转矩阵(Rotation matrix)是在乘以一个向量的时候有改变向量的方向但不改变大小的效果的矩阵。旋转矩阵不包括反演,它可以把右手坐标系改变成左手坐标系或反之。所有旋转加上反演形成了正交矩阵的集合。
旋转矩阵是世界上著名的彩票专家、澳大利亚数学家底特罗夫研究的,它可以帮助您锁定喜爱的号码,提高中奖的机会。首先您要先选一些号码,然后,运用某一种旋转矩阵,将你挑选的数字填入相应位置。如果您选择的数字中有一些与开奖号码一样,您将一定会中一定奖级的奖。当然运用这种旋转矩阵,可以最小的成本获得最大的收益,且远远小于复式投注的成本。
旋转矩阵的原理在数学上涉及到的是一种组合设计:覆盖设计。而覆盖设计,填装设计,斯坦纳系,t-设计都是离散数学中的组合优化问题。它们解决的是如何组合集合中的元素以达到某种特定的要求。
范数
矩阵的范数主要包括三种主要类型:诱导范数,元素形式范数和Schatten范数。
若映射 满足以下要求:
则称该映射为 上的矩阵范数。
诱导范数
诱导范数又称 矩阵空间上的
算子范数(operator norm),定义为:
常用的诱导范数为p-范数:
p范数也称为明克夫斯基 p范数或者 范数。特别的,当 时,对应的诱导范数分别为
元素形式范数
将 矩阵按照列的形式,排成一个 的向量,然后采用向量范数的定义,即得到矩阵的元素形式范数,表式如下:
Schatten范数
Schatten范数是用矩阵的
奇异值定义的范数,定义为:
其中 为对应矩阵的奇异值。
应用
图像处理
在图像处理中图像的仿射变换一般可以表示为一个仿射矩阵和一张原始图像相乘的形式,例如,
这里表示的是一次线性变换再接上一个平移。
线性变换及对称
线性变换及其所对应的
对称,在现代
物理学中有着重要的角色。例如,在量子场论中,
基本粒子是由狭义相对论的
洛伦兹群所表示,具体来说,即它们在
旋量群下的表现。内含
泡利矩阵及更通用的
狄拉克矩阵的具体表示,在
费米子的物理描述中,是一项不可或缺的构成部分,而费米子的表现可以用
旋量来表述。描述最轻的三种夸克时,需要用到一种内含
特殊酉群SU(3)的群论表示;物理学家在计算时会用一种更简便的矩阵表示,叫
盖尔曼矩阵,这种矩阵也被用作SU(3)
规范群,而强核力的现代描述──量子色动力学的基础正是SU(3)。还有
卡比博-小林-益川矩阵(
CKM矩阵):在
弱相互作用中重要的基本夸克态,与指定粒子间不同质量的夸克态不一样,但两者却是成线性关系,而CKM矩阵所表达的就是这一点。
量子态的线性组合
1925年海森堡提出第一个
量子力学模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子。这种做法在
矩阵力学中也能见到。例如
密度矩阵就是用来刻画量子系统中“纯”
量子态的线性组合表示的“混合”量子态。
另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在加速器中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为
S矩阵,其中记录了所有可能的粒子间相互作用。
简正模式
矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的
运动方程可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过
对角化等方式),称为系统的简正模式。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加。描述力学振动或电路振荡时,也需要使用简正模式求解。
几何光学
在
几何光学里,可以找到很多需要用到矩阵的地方。几何光学是一种忽略了光波波动性的近似理论,这理论的模型将光线视为几何射线。采用近轴近似(英语:paraxial approximation),假若光线与光轴之间的夹角很小,则透镜或反射元件对于光线的作用,可以表达为2×2矩阵与向量的乘积。这向量的两个分量是光线的几何性质(光线的
斜率、光线跟光轴之间在
主平面(英语:principal plane)的垂直距离)。这矩阵称为
光线传输矩阵(英语:ray transfer matrix),内中元素编码了光学元件的性质。对于折射,这矩阵又细分为两种:“折射矩阵”与“平移矩阵”。折射矩阵描述光线遇到透镜的折射行为。平移矩阵描述光线从一个主平面传播到另一个主平面的平移行为。
由一系列透镜或反射元件组成的光学系统,可以很简单地以对应的矩阵组合来描述其光线传播路径。
电子学
在
电子学里,传统的网目分析(英语:mesh analysis)或
节点分析会获得一个
线性方程组,这可以以矩阵来表示与计算。