免费阅读
返回
菜单
上一章查看最新章节下一章

第六百三十六章

作品:我的超级黑科技帝国作者:萌主天下无敌
如果本章错误,请点击报错10秒纠正

征了网络的实际输出值和期望输出值的接近程度。越接近,C(w,b)的值就越小。因此,学习的过程就是想办法降低C(w,b)的过程,而不管C(w,b)的表达形式如何,它是w和b的函数,这就变成了一个求函数最小值的最优化问题。

由于C(w,b)的形式比较复杂,参数也非常多,所以直接进行数学上的求解,非常困难。

为了利用计算机算法解决这一问题,计算机科学家们提出了梯度下降算法(gradient descent)。

这个算法本质上是在多维空间中沿着各个维度的切线贡献的方向,每次向下迈出微小的一步,从而最终抵达最小值。

由于多维空间在视觉上无法体现,所以人们通常会退到三维空间进行类比。当C(w,b)只有两个参数的时候,它的函数图像可以在三维空间里呈现。

就好像一个小球在山谷的斜坡上向下不停地滚动,最终就有可能到达谷底。这个理解重新推广到多维空间内也基本成立。

而由于训练样本的数量很大(上万,几十万,甚至更多),直接根据前面的C(w,b)进行计算,计算量会很大,导致学习过程很慢。

、于是就出现了随机梯度下降(stochastic gradient descent)算法,是对于梯度下降的一个近似。

在这个算法中,每次学习不再针对所有的训练集,而是从训练集中随机选择一部分来计算C(w,b),下一次学习再从剩下的训练集中随机选择一部分来计算,直到把整个训练集用光。然后再不断重复这一过程。

深度神经网络(具有多个hidden layer)比浅层神经网络有更多结构上的优势,它有能力从多个层次上进行抽象。

从上个世纪八九十年代开始,研究人员们不断尝试将随机梯度下降算法应用于深度神经网络的训练,但却碰到了梯度消失(vanishing gradient)或梯度爆发(exploding gradient)的问题,导致学习过程异常缓慢,深度神经网络基本不可用。

然而,从2006年开始,人们开始使用一些新的技术来训练深度网络,不断取得了突破。这些技术包括但不限于:

采用卷积网络(convolutional networks);

Regularization (dropout);

Rectified linear

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【无极书院】 m.wjzxchina.com。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看最新章节下一章
临时书架加入书签回顶部↑

看了《我的超级黑科技帝国》的书友还喜欢看

大秦:开局扶苏被贬,忽悠他造反
作者:瑜兰瑾
简介: “扶苏你都三十万大军在手了,还不造反?”\n

“等秦始皇死...
更新时间:2026-03-03 23:39:57
最新章节:第1071章 在船上加上火炮口!
重生八零,苏小姐杀疯了
作者:倾城五儿
简介: 苏瑶死前才知道,自己一辈子未婚。她被江家骗了一辈子,为江家奉献了自己的一辈子。
更新时间:2026-03-03 23:27:00
最新章节:第175章 离了
长空战旗
作者:康斯坦丁伯爵
简介: 3000小时空战游戏时长的王礼被扔到了一个气态巨星表面的世界,这是个所有人都生活在飞...
更新时间:2026-03-03 23:00:00
最新章节:第87章 可怕的约瑟芬(求月票)
恋痛癖
作者:水无伶
简介: 杭意追谢铮玉的时候,图财,图色,别人骂她自不量力。结果不仅真让她得逞,还扭脸把人甩了...
更新时间:2026-03-03 23:36:25
最新章节:第65章 泼脏水
直播相亲:我的情报无限刷新
作者:一剑斩南天
简介: 网友:“张哥,我的相亲对象说自己是库里那样的球员,一人一城,但是我调查发现,她其实是...
更新时间:2026-03-03 23:14:57
最新章节:第531章 灵魂伴侣不等于婚姻幸福
本官娘子就是妖
作者:登仙长安
简介: “大人,你家娘子是蛇妖!”看着面前眼含杀气的和尚,许仙面不改色地下达两个命令,妖僧诽...
更新时间:2026-03-03 23:18:00
最新章节:第三百九十章 成就神仙,普贤破防
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 无极书院 All Rights Reserved.kk

SiteMap