手机浏览器扫描二维码访问
当梯度太大时,参数的调整会变得过于剧烈,网络的学习变得不稳定,甚至会导致训练失败。
这就像你在陡峭的悬崖边滑落,一下子失去了控制。
网络的参数变化过大,导致结果变得很不稳定,甚至完全错误。
概括地说:
梯度消失就像在一座越来越平的山坡上,梯度变得很小,神经网络不知道该怎么调整,进而学习变得很慢,甚至无法进步。
梯度爆炸就像从悬崖边滚下去,梯度变得很大,网络的学习变得过于剧烈,结果会非常不稳定,训练过程变得不可控。
这两个问题经常会出现在深层神经网络中。
而这也是马库斯所要倾诉的困扰。
“说起来,最近的研究还卡在了‘梯度消失’的问题上。”马库斯苦笑着说道,靠在沙发上,“我们在训练一些更深层次的神经网络时,发现模型一旦超过一定的深度,反向传播算法中的梯度会逐渐趋近于零,根本无法有效更新权重。深度越大,梯度就越容易消失,整个网络的学习效率大幅下降。”
马库斯知道林枫硕士是麻省理工学院的计算机硕士,因此也就全都用专业术语表述了。
对于这些林枫当然能听明白,非但能听明白,而且作为一个资深的人工智能从业人员。
林枫也清楚知道马库斯面临的难题。
林枫对AI的发展也有所了解,涉及到梯度问题在2014年是深度学习研究中的一个巨大挑战。
甚至可以说解决不了梯度问题就很难有真正的深度学习,也就不会有后来的人工智能成果的一系列井喷。
林枫心说,自己这是一不小心站在了技术发展的最前沿了吗?
不得不说,这种举手投足之间就能影响时代命运的感觉是真的无比美妙。
“梯度消失的问题一直存在,尤其是深层网络。梯度爆炸倒是相对好解决,但梯度消失会直接导致学习过程停滞不前。”林枫沉思片刻,补充道,“这不仅是你们实验室的问题,也是整个领域的瓶颈。反向传播的基本原理决定了,当信号在网络中层层传递时,梯度的变化会以指数级缩小。”
马库斯脑海中泛起了大大的问号,梯度爆炸问题好解决吗?
他怎么觉得梯度爆炸问题也挺麻烦的?
不过聊天本来就是求同存异,既然林同样认为梯度消失难以解决就够了。
马库斯也没纠结为什么林说梯度爆炸容易解决,而是继续就梯度消失发表观点说道:“是啊,哪怕有了ReLU(修正线性单元)激活函数的引入,虽然能在一定程度上减轻梯度消失,但对深层网络还是不够。”
林枫想了想,说道:“你们有考虑过改进网络结构吗?”
喜欢不朽从二零一四开始请大家收藏:()不朽从二零一四开始
小小领主不好惹!惹急眼了争天下 清末小旗兵 鬼魂与反派的禁忌之恋 贾二虎的迷乱青春续集 祁木温年 人在四合院:我能看见弹幕 趣谈老祖宗那些事儿 全民巨鱼求生:我能听到巨鱼心声 第四天灾:我的玩家会修仙 我有无限分身,成就仙帝不过分吧 穿越大唐:打造最强工业园 穿越后,我被新帝瞄上了 我在都市学会了修真直到无敌于世 纨绔女王爷:腹黑夫君别使坏 八零:迫嫁糙汉怀上三胞胎 综穿带着王者系统当bKing 你跟我很想至少一半以上 费伦大陆的普通奇幻冒险 轮回天帝 致命毒宠,凛冬玫瑰
家里的桂花树成精了!带着意外身亡的梅梦珍回到了2007年。看着父母留下的3200块钱,梅梦珍决定带着弟弟摆脱贫穷。人家都说大隐隐于市,那她就小隐隐于菜市场。本想利用空间赚点生活费,谁知这个生活费渐渐地有些不受她的控制啊!本文事业主线,cp副线已有完结文重生之年代纪事重生之倩女纪事更新有保障,欢迎入坑。如果您喜欢重生后我靠种田逆袭了,别忘记分享给朋友...
关于都市极品医圣我有一根银针,可除疾破邪驱魔定乾坤!且看江守道,如何一步步成为名满天下的一代医圣!...
一个腹黑冷情的现代女汉子,穿越成爹不疼后娘害的软妹纸!遇上霸道冷酷武宣王,只手遮天权倾朝野,传闻说,他睡过的女人比吃过的饭都多,可是一夜贪欢之后,他竟对她痴缠不止,他说,女人,你姿势多技术好...
重生过去畅想未来梦幻现实,再塑传奇人生!如果您喜欢大戏骨,别忘记分享给朋友...
关于头号宠婚总裁的风水宝妻她是新世纪风水师,逆天改命,算过去未来,一朝穿越平行世界,谱写新一世的商界传奇!他是严氏集团掌舵人,翻手为云覆手为雨,狠辣无情,在商界拥有‘枭狼’之名。被他缠上,她无处可逃。对付你,我没兴趣。他勾起那好看的薄唇,眸底却一片冰冷和你联姻,我相当有兴趣。她以退为进有名无实的婚姻,井水不犯河水,OK?他深眸一瞥,不作犹豫好。但谁来告诉她,说好的‘有名无实’呢?说好的‘井水不犯河...
又一位加入穿越大军的中年的故事如果您喜欢影视穿越从四合院开始,别忘记分享给朋友...