首页 > 精品推荐 > 科研系学霸 > 第67章 Q&A

第67章 Q&A(2/2)

目录
好书推荐: 推演,道成元始 清冷直男,被疯批皇帝强制爱了 再度盛夏 完美世界:重瞳开天,羽化登仙 天幕宝可梦:曝光小智弒神救世! 穿越菩提老祖,西游第一劫难 穿越高育良:牢不可破的汉大帮 我有了透视眼之后,运气好到爆 不是!我怎么就成了区委书记呢? 赶你去封地,你竟带着北凉王造反

如果周昀无法回答这个问题,这篇文章的严谨性就会受到质疑。

何凯明也很好奇周昀会怎么回答这个问题,於是他看向台上,结果对方的反应倒是有些出乎他的预料。

周昀的眼神中没有丝毫的慌乱,反倒是有些......兴奋?

其实这个问题周昀自己也问过自己,他本来还想著如果没人提出这个问题,自己是不是要在报告的时候提一下,毕竟这个点確实非常重要。

不过最后还是没有加到前面的报告里,主要是之前报告要讲的都已经確定了,再加上这一段,时间上可能会超。

现在有人提出来,正合他的心意。

“何教授,非常感谢您如此深刻的提问,这確实是我的工作中最需要谨慎对待的部分。

您提到的『无限递归』风险,在任何自指系统中都是理论上存在的。

为了规避这一点並確保系统的收敛与可靠,我们引入了一个基於博弈论和不动点理论的混合数学框架。”

这就是为什么周昀在一开始要学习数学的原因了,一个良好的数学功底,真的能在很多时候帮忙解决一些关键性的问题。

周昀看了眼时间,应该够了。

他用电脑创建了一个白板,然后开始用滑鼠作画,虽然有点抽象,但是配合他的讲解,也算能勉强看的懂。

“首先,我们將『被压缩的ai模型』与『负责调教的ai元模型』之间的关係,形式化为一个非零和合作博弈。

『被压缩的ai模型』选择一组模型参数θ目標是在给定的压缩约束下最小化任务损失函数 l_task(θ),

而『负责调教的ai元模型』选择一种压缩策略φ,目標是最小化一个元损失函数 l_meta(φ,θ),

这样就能得到一个组合的惩罚项,也就是一般模型里的损失函数l_meta(φ,θ)= l_task(θ)+λ* r(φ),

我们並不追求一个无限递归的最优,而是试图找到一个平衡,这正是一个纳什均衡点的概念。

之后我设计了一个交替优化算法来逼近这个均衡点,其叠代过程可以假设地抽象为一个映射t:(θ_k,φ_k)->(θ_{k+1},φ_{k+1})

......

经过以上的过程,我们就可以证明t確实是压缩映射,根据banach不动点定理,

这个映射就存在唯一的不动点,並且无论从任何初始点开始叠代,

该算法都会以线性收敛速度全局收敛到这个唯一的不动点(θ*,φ*)。

而这个不动点正是我们寻求的纳什均衡。”

其实说到一半的时候大部分人就已经跟不上周昀的思路了,毕竟不是数学系的,

对於这种数学证明,大部分人都不是特別擅长,更別说周昀这个证明也没那么简单。

不过何凯明倒是能跟得上,毕竟他在从事计算机的研究之前,是水木大学物理系的学生,数学功底也会强一点。

周昀说完,再次向何凯明微微点头示意:“不知道这个解释是否回答了您的问题?”

目录
新书推荐: 这也太谐门了 战锤:从种田开始重塑黄金时代 逆袭从四合院开始 我在须弥建造黑塔城 魔祸诸天:从小李飞刀开始横行 穿越崩铁成为莫德凯撒,但源计划 漫威:末日开局,儘是高端局! 四合院:二锅头换航母,举国沸腾 轮回乐园:兴趣使然成就最强 洪水末世:开局一根神级钓鱼竿
返回顶部