微分(differential)和导数(derivative)都与函数的变化率有关,它们是两个相关但不完全相同的概念。首先一起深入了解这两者的定义和区别。
导数
导数描述了一个函数在某一点上的切线斜率。如果有一个函数$y=f(x)$,则其在点x处的导数通常表示为\(f'(x)\)或 \(\frac{dy}{dx}\) 。导数的定义是函数在该点的平均变化率的极限,公式如下:
$$f'(x) = \lim_{x \to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x}$$
微分
微分描述了函数值的微小变化与自变量的微小变化之间的关系。对于函数\(y = f(x)\),它的微分表示为\(dy\)和\(dx\),其中\(dy\)是函数值的微小变化,而\(dx\)是自变量的微小变化。微分的定义基于导数,可以表示为:
$$dy = f'(x) \cdot dx$$
所以,导数和微分都与函数的变化率有关,但它们的重点略有不同。导数关注的是函数在某点的切线斜率,而微分关注的是函数值的微小变化与自变量的微小变化之间的关系。简言之,导数是一个比率或斜率的概念,而微分描述了当自变量发生微小变化时,因变量如何变化。
下面笔者分别从几何、物理和代数角度解释导数的含义。
导数的几何解释是:该函数曲线在这一点上的切线斜率。
导数的物理解释是: 导数物理意义随不同物理量而不同,但都是该量的变化的快慢函数,即变化率。
导数的代数解释是:更精细的除法运算。
前两个解释的角度相信读者已经很熟悉了,那么怎么理解导数的代数是更精细的除法运算这一说法呢?
举一个物理例子:距离s = 25m,时间t = 5s,求平均速度v?
这个问题很好回答,正常的除法即可轻松处理(\(v = s/t\))。但是如果速度不是均速,而且希望求得第5秒时的瞬时速度,怎么办?
$$v=\left.\frac{ds}{dt}\right|_{t=5}\lim_{\Delta t \to 0}\frac{s(5+\Delta t) – s(5)}{\Delta t}$$
如公式(1-3)的解法,\(\Delta t\) 是一个很多的时段,用\((5+\Delta t)\)时刻走过的路程\(s(5+\Delta t)\)减去第五秒时走过的路程\(s(5)\),再除以时段\(Delta t\),解得的就是第五秒时的瞬时速度。当无穷小时,就是导数的概念了,即\(\displaystyle \lim_{\Delta t \to 0}\frac{s(5+\Delta t) – s(5)}{\Delta t}\)。
可以看出来导数是即时的变化率,放在路程和时间这个物理场景下,瞬时速度就是路程的即时变化率。其求解的方法就是一个简单的除法而已!本质上还是除法运算。
微分的解读
回忆一下微分的数学表达式:
$$\frac{dy}{dx} = f'(x)=\lim_{h \to 0}\frac{f(x+h) – f(x)}{h}$$
导数含义的解读:
(1)导数揭示了函数\(f(x)\)在某点的切线斜率。
(2)导数揭示了函数\(f(x)\)在某点的变动规律。
在这里笔者更推崇第二种解读方法。其实可以把\(dx\)乘到等号右边去会更形象,即:
$$\frac{dy}{dx} = f'(x)$$
$$dy = f'(x)dx$$
举个例子来解读什么叫函数\(f(x)\)在某点的变动规律。假设\(f(x) = x^2\),求\(x = 5\)处的导数。
$$\frac{dy}{dx} = 2x = 10 \quad dy = 10dx$$
即,变量\(x\)变动一点点,将引起函数\(f(x)\)值相对于变量\(x\)十倍的变化。这点很重要。
可以根据这个解读来推导一下微分的乘法法则和幂法则。举一个例子,假设函数\(h(x) = f(x) \cdot g(x)\),先回忆一下微分的乘法法则:
$$h'(x) = [f(x)\cdot g(x)]’ = f'(x)\cdot g(x)+f(x)\cdot g'(x) = f’g+fg’(或写作df \cdot g + dg \cdot f)$$
下面来推导一下乘法法则怎么来的。首先,把函数\(h(x) = f(x) \cdot g(x)\)放在求解矩形面积这个例子中,即\(h(x)\)是矩形面积、\(f(x)\)是宽、\(g(x)\)是高,此时当变量\(x\)变动一点点时,根据微分的解读,其意义是矩形面积的变动率,如图一所示。
![图片[1]-重拾微分-点头深度学习网站](http://www.diantouedu.net/wp-content/uploads/2024/10/image.png)
图一 微分推导示意图
其中\(dh\)为面积的变动,即图1-1中深色的部分:\(dh(x) = df(x) \cdot g(x) + f(x) \cdot dg(x) + df(x) \cdot dg(x) \) ,由于\(df(x) \cdot dg(x)\)是二阶无穷小,约等于0,可以约掉;再在等号左右分别除去\(dx\)就得到了微分的乘法法则。此时,\(dh\)为面积的变动,而\(\frac{dh}{dx}\)为面积的变动率。
下面来推导一下这个导数的幂法则怎么来的,先来回忆一下幂法则:
$$\frac{d(x^n)}{dx} = nx^{n-1}$$
还用刚刚的例子,如果此时\(f(x)\)和\(g(x)\)都等于\(x\),那么\(h(x) = x^2,dh = dx^2,如图二所示。
![图片[2]-重拾微分-点头深度学习网站](http://www.diantouedu.net/wp-content/uploads/2024/10/image-1.png)
图二 导数幂法则推导
此时正方形面积的变动根据公式推导如下:
$$dh = x \cdot dx + x \cdot dx + dx \cdot dx = 2xdx$$
因为\(dh = dx^2\),带入整理得到\(\frac{dx^2}{dx} = 2x\)。
这个推导结果与直接使用幂法则\(dh = dx^2 = 2x \)求得的结果是一致的。同样的方法推广到三维空间,乘法法则和幂法则的推导也是适用的,如图三所示:
![图片[3]-重拾微分-点头深度学习网站](http://www.diantouedu.net/wp-content/uploads/2024/10/image-2.png)
图三 高维空间的导数乘法法则和幂法则推导
此时的体积计算公式为\(y = f(x) \cdot g(x) \cdot z(x)\),体积的变动为:
$$dy = dx\cdot x^2 + dx\cdot x^2 + dx\cdot x^2 = 3x^2dx$$
体积的变动率\(\frac{dy}{dx}\)为:
$$\frac{dy}{dx}=3x^2$$
根据这个规律可以继续推广到高维空间,这里就不方便做可视化了。
暂无评论内容