
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是什么? 263 15 454
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
为了降低随机梯度的方差,从而使得迭代算法更加稳定,也为了充分利用高度优化的矩阵运算操作,在实际应用中我们会同时处理若干训练数据,该方法被称为小批量梯度下降法 (Mini- Batch …
如何理解随机梯度下降(stochastic gradient descent,SGD)?
随机梯度下降 Stochastic Gradient Descent SGD (Vinilla基础法/Momentum动量法) 一开始SGD没有动量,叫做Vanilla SGD,也就是没有之前时刻的梯度信息。
哪里有标准的机器学习术语 (翻译)对照表? - 知乎
梯度裁剪 (Gradient Clipping) 在应用梯度值之前先设置其上限。 梯度裁剪有助于确保数值稳定性以及防止梯度爆炸 [14]。 梯度下降法 (Gradient Descent) 一种通过计算并且减小梯度将损失降 …
Gradient Reversal Layer指什么? - 知乎
Gradient Reversal Layer指什么? Domain Adaption里面的GRL到底能发挥什么作用呢? 显示全部 关注者 309
谁能解释一下密度泛函理论(DFT)的基本假设和原理么? - 知乎
GGA (Generalized Gradient Approximation) 90 年代后,渐为化学界所接受,Kohn 因此1998年获诺贝尔化学奖。 思考:Kohn-Sham 方程与 Hartree-Fock 方程有什么本质的区别? 主要区别 …
如何理解Adam算法 (Adaptive Moment Estimation)? - 知乎
效果如下: 4.AdaGrad 全程为Adaptive Gradient,意思就是,学习参数的更新率要适当地根据每个参数的历史几率调整,怎么调整呢?
怎样理解近端梯度下降PGD? - 知乎
近端梯度下降法(PGD)是一种优化算法,适用于具有非光滑目标函数的问题。
ai绘画反提示词中常用的nsfw这个提示词是什么意思? - 知乎
渐变背景 gradient background, 白色背景 white background, 投影阴影 drop shadow, 背光 backlighting, 闪烁的星星 glinting stars, 城市背景 cityscape, 异世界奇幻城市 Isekai cityscape, …
怎么训练自己的ai小模型? - 知乎
介绍 大语言模型(Large Language Model, LLM)的出现引发了全世界对AI的空前关注。 无论是ChatGPT、DeepSeek还是Qwen,都以其惊艳的效果令人叹为观止。 然而,动辄数百亿参数 …