变分法
数学学科概念
变分法是17世纪末发展起来的一门数学分支,是处理泛函的数学领域,和处理数的函数的普通微积分相对。它最终寻求的是极值函数:它们使得泛函取得极大或极小值。变分法起源于一些具体的物理学问题,最终由数学家研究解决。有些曲线上的经典问题采用这种形式表达:一个例子是最速降线,在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。
简介
变分法的关键定理是欧拉-拉格朗日方程。它对应于泛函的临界点。在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。它分辨不出找到的是最大值还是最小值(或者两者都不是)。
变分法在理论物理中非常重要:在拉格朗日力学中,以及在最小作用量原理量子力学的应用中。变分法提供了有限元方法的数学基础,它是求解边界值问题的强力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有,黎曼调和函数中使用狄力克雷原理。最优控制的理论是变分法的一个推广。
同样的材料可以出现在不同的标题中,例如希尔伯特空间技术,摩尔斯理论,或者辛几何。变分一词用于所有极值泛函问题。微分几何中的测地线的研究是很显然的变分性质的领域。极小曲面(肥皂泡)上也有很多研究工作,称为Plateau问题。
发展简史
变分法可能是从约翰·伯努利(Johann Bernoulli)1696年提出最速曲线(brachistochrone curve)问题开始出现的。它立即引起了雅克布·伯努利(Jakob Bernoulli)和洛必达的注意,但欧拉首先详尽的阐述了这个问题。他的贡献始于1733年,他的《变分原理》(Elementa Calculi Variationum)寄予了这门科学这个名字。拉格朗日对这个理论的贡献非常大。拉格朗日(1786)确定了一种方法,但在对极大和极小的区别不完全令人满意。牛顿莱布尼茨也是在早期关注这一学科。对于这两者的区别Vincenzo Brunacci(1810),Carl Friedrich Gauss(1829),Simeon Poisson(1831),Mikhail Ostrogradsky(1884),和Carl Jacobi(1837)都曾做出过贡献。Sarrus(1842)的由Cauchy(1844)浓缩和修改的是一个重要的具有一般性的成就。Strauch(1849),Jellett(1850),Otto Hesse(1857),Alfred Clebsch(1858),和Carll(1885)写了一些其他有价值的论文和研究报告,但可能那个世纪最重要的成果是Weierstrass所取得的。他关于这个理论的著名教材是划时代的,并且他可能是第一个将变分法置于一个稳固而不容置疑的基础上的。1900发表的第20和23个希尔伯特(Hilbert)促进了更深远的发展。在20世纪David Hilbert,Emmy Noether,Leonida Tonelli,Henri Lebesgue和Jacques Hadamard等人做出重要贡献。Marston Morse将变分法应用在Morse理论中。Lev Pontryagin,Ralph Rockafellar和Clarke广义变分法理想控制论发展了新的数学工具。
欧拉-拉格朗日方程
简介
欧拉-拉格朗日方程(Euler-Lagrange equation)简称E-L方程,在力学中则往往称为拉格朗日方程。正如上面所说,变分法的关键定理是欧拉-拉格朗日方程。它对应于泛函的临界点。
值得指出的是,E-L方程只是泛函有极值的必要条件,并不是充分条件。就是说,当泛函有极值时,E-L方程成立。在应用中,外界给定的条件可以使得E-L方程在大多数情况下满足我们的需求。所以尽管下面我们要在比较强的条件下推导,并且这种推导在某些意义上有些不太严谨,完全可以在较弱的情况下予以完全严谨的证明,但是就我们所要用的层面而言,也是足够的了。
推导
对于泛函
固定两个端点,在泛函S取到极值时的函数记作g(x),定义与这个函数“靠近”的一个函数,h(x)=g(x)+δg(x),其中δg(x)在从x1到x2上都是小量,同时也满足,
这里δg(x)称为函数g(x)的变分。
因为在从任何函数代替g(x)都会使得泛函S取不到极值,所以用h(x)代替g(x)使得作用量产生了增量,为,
将第一项 按照δg(x)和δg'(x)幂级数打开,并且注意到δg(x)和δg'(x)永远是小量,舍弃掉二次项及以上高次项,可得关于δg(x)和δg'(x)一次项的和。则S取到极值的必要条件就是这些项的和的值为0。这些和称之为S的一阶变分(或者简称变分),变分为0记作,
按照幂级数打开后,可以得到,
将第二项分部积分得:
由于 ,于是第一项等于0,换而言之,就是这个等式成立,
于是对任何小的函数δg(x)该积分都等于0,于是只有被积函数等于0的时候才有可能。(这个论断是不严谨的,这里应该由Du Bois Reymond 引理给出)于是我们得到方程,
这就是E-L方程。
在力学上,这里的g用任何一个广义坐标q表示,x用t代替,而L(拉格朗日量)=T(动能)-V(势能),那么拉格朗日方程则为,
物理学应用
物理学中泛函极值问题的提出促进了变分学的建立和发展,而变分学的理论成果则不断渗透到物理学中。
费马原理
费马原理指出:光沿所需时间为极值(极大值、恒值、极小值)的路径传播。假设 y=f(x)为光的路径,则光程可以下式表示:
其中折射率n(x,y)依材料特性而定。
若选择,则A的一阶导数 (A对ε的微分)为
将括号中的第一项用分部积分处理,可得欧拉-拉格朗日方程
光线的路径可由上述的积分式而得。这可以看作上面E-L方程的特例。
大范围变分法
18世纪是变分法的草创时期,建立了极值应满足的欧拉方程并据此解决了大量具体问题。19世纪人们把变分法广泛应用到数学物理中去,建立了极值函数的充分条件。20世纪伊始,希尔伯特在巴黎国际数学家大会讲演中提到的23个著名数学问题中就有三个与变分法有关,变分法的思想贯穿了R.库朗和希尔伯特所著的《数学物理方法》一书。而H.M.莫尔斯的大范围变分法则是20世纪变分法发展的标志(见莫尔斯理论)。
物理学中的变分原理
P. de费马欧几里得确立的光的反射定律出发提出了光的最小时间原理:光线永远沿用时最短的路径传播。他原先怀疑光的折射定律,但在1661年费马发现从他的光的最小时间原理能够推导出折射定律,不仅消除了早先的怀疑,而且更加坚信他的原理。拉格朗日把变分法用到动力学上。他引进广义坐标q1,q2,…,qn,动能T是 q'=(q'1,q'2,…,q'n)的函数,q'表示广义速度。他又假定力有位势V,V是q的函数,又假定T+V是常量,即系统无耗散,令L=T-V,称为作用量,拉格朗日的最小作用原理是说真实的运动使作用量取极小值。通过欧拉方程,拉格朗日建立他的运动方程,据此推出了力学的主要定律,并解决了一些新的问题。这些工作都记载在他在1788年出版的《分析力学》一书中。
量子力学
变分法在量子力学中主要解决基态能量波函数问题。
经济学应用
变分法用于求解经济学中的动态最优问题,即给定目标函数和约束条件的情况下,求解使得目标函数维持最优状态的控制变量函数,也叫作“古典变分法”。下述两个问题都可以通过变分法解决,即通过欧拉方程得出其一阶条件。
拉姆齐模型(动态)
Max U=∫EXP(-rt)U(C(t))dt (积分区域为(0,T))
s.t. iK(t)+W(t)=C(t)+K*(t)(i是无风险收益率,W是工资,K*(t)是K(t)的变动率)
K(0)=K0,K(T)=KT (终结线)
乔根森模型(企业投资的最优路径)
Max V(K)=∫EXP(-ρt)(PQ(K)-mI)dt (积分区域为(0,∞))
s.t. I=K*+δK (投资I=资本变动K*+折旧δK)
变分法与微分法
变分法概念与寻常分析中的微分概念很为类似,但所联系的不是x的变化,而是函数y(x)的变化。如果函数y(x)使U(y)达其极值,则U的变分δU变为0。
几乎所有的物理和力学的基本规律都陈述为规定某一泛函的变分应该是0的“变分法原理”,由于这个原故变分法使许多重要的物理问题及技术问题得以解决。
参考资料
最新修订时间:2024-01-30 16:04
目录
概述
简介
参考资料