首页

都市青春

带着手机重生,目标科技教父

设置

字体样式
字体大小

带着手机重生,目标科技教父:第636章 AlexNet登场

看到ImaNet广告的亚历克斯漫不经心地扫了两眼,原本靠在椅背上的身体突然坐直了。 通告下方的赞助商列表里,英伟达的标志十分显眼。 亚历克斯迅速点开相关链接,开始查阅英伟达最近发布的技术文档和论坛动态。 他越看眼睛越亮,之前熬夜写代码的疲惫一扫而空。 “伊利亚,别敲你那祖传代码了,快过来看这个!”亚历克斯激动地拍了拍桌子。 伊利亚停下动作,滑着椅子靠了过来。 “什么东西能让你兴奋成这样?找到自动清理bUg的咒语了?”伊利亚调侃道。 亚历克斯指着屏幕上的比赛页面和英伟达CUDA架构说明。 “我刚刚发现了一个比赛,李飞飞教授发起的。这不是重点,重点是比赛的赞助商。你看,是英伟达。”亚历克斯语速极快。 还没等伊利亚细看,教研室的门被推开了。 杰弗里·辛顿拿着几份打印好的论文走了进来。 “嗨,伙计们,今天的研究进展如何?”辛顿把论文放在桌上,拉过一把椅子坐下。 亚历克斯立刻站了起来,走到辛顿面前。 “教授,您来得正好。我有个疯狂的想法,也许能彻底打破我们现在的研究瓶颈。”亚历克斯神情激动。 辛顿有些意外,示意亚历克斯继续说下去。 亚历克斯直接把显示器转了过去,对着辛顿。 “这是一个拥有千万级图片数据的挑战赛。最关键的是,英伟达最近在大力推广他们的CUDA架构,并且重金赞助了这个比赛。”亚历克斯抛出信息。 辛顿看了一眼屏幕上的硬件参数说明。 “一家做游戏显卡的公司,跑到学术界推销他们的并行计算技术?”辛顿提出了疑问。 亚历克斯连连点头,拿过旁边的白板笔。 “对,他们肯定想要推广他们的底层技术生态。教授,我的想法是,我们可以用GPU来做神经网络的计算!”亚历克斯说出了自己的计划。 伊利亚在旁边听得直皱眉。 “GPU?那是用来渲染三维游戏多边形的硬件。我们做的是深度神经网络训练,底层逻辑不兼容吧?”伊利亚提出质疑。 亚历克斯立刻转身面对伊利亚,开始在白板上列数据。 “表面上看是两码事,但实际上完美契合。你想想,我们现在的代码用CPU跑,为什么这么慢?”亚历克斯反问。 伊利亚思索了一下。 “因为要处理庞大的矩阵乘法运算,数据量太大了。”伊利亚如实回答。 亚历克斯重重地敲了敲白板。 “这就对了!CPU的核心数量很少,一般只有两到八个。它的架构设计是为了处理操作系统里复杂的逻辑分支。”亚历克斯开始分析。 接着,他在旁边写下英伟达显卡的参数。 “但你看GPU。它精简了复杂的控制逻辑,把芯片面积全留给了几百上千个小计算核心。”亚历克斯指着那些数字。 “深度神经网络的核心运算是什么?就是海量的加减乘除和取最大值。根本不需要复杂的逻辑跳转。”亚历克斯看着两人。 “让几个全能的CPU核心排队去处理上百万次简单的乘法运算,这完全是资源错配。”亚历克斯抛出核心论点。 “而GPU的几百个核心,可以把这上百万次乘法拆解开,同步进行并行计算。这才是真正的算力匹配!”亚历克斯提高了音量。 教研室里安静了几秒钟。 伊利亚的大脑飞速运转,推演着亚历克斯的设想。 “如果真能把我们的代码通过CUDA接口迁移到GPU上……”伊利亚喃喃自语。 “几百个核心同时进行矩阵运算,训练速度绝对会成百倍上升!以前需要一个月的模型,可能两天就能跑出结果!”亚历克斯接上了伊利亚的话。 辛顿听完亚历克斯的长篇大论,陷入了深深的思考。 他站起身,走到白板前,看着亚历克斯写下的对比数据。 “2006年的时候,我一直在研究深层网络训练难的问题。”辛顿缓缓开口。 亚历克斯和伊利亚都安静地听着导师的复盘。 “由于信号在传播过程中会逐层衰减,也就是梯度消失,导致网络根本无法有效训练。”辛顿指出当年的痛点。 “后来我提出了逐层预训练的方法。先逐层训练好每一层的参数,再堆叠起来整体训练。”辛顿回顾着自己的理论成果。 “这个理论证明了深度的价值,奠定了基础,但实际操作中,算力一直是我们跨不过去的天堑。”辛顿叹了口气。 他转过身,看着亚历克斯,脸上露出了赞赏的笑容。 “亚历克斯,你今天提出来的这个思路非常合理。如果GPU的并行计算真的能解决算力问题,我们就能探索更深层的网络。”辛顿给出了肯定的答复。 亚历克斯兴奋地搓了搓手。 “既然英伟达想借这个比赛推广技术,那我们就顺水推舟,用他们的硬件拿个冠军。这绝对是一次双赢。”亚历克斯分析着局面。 这一切的提前发生,自然是源于夏冬重生产生的蝴蝶效应。 原本的时空里,亚历克斯要再过两年才会用GPU在ImaNet上一战封神。 但现在,因为夏冬在太平洋彼岸搅动的风云,促使老黄感受到了危机,提前加大了对CUDA的宣传。 这股算力的东风,恰好吹到了正为进度发愁的亚历克斯面前。 辛顿看着这两个干劲十足的学生,做出了决定。 “伊利亚,亚历克斯,你们两个马上去比赛官网注册报名。我们用实际行动测试这个设想。”辛顿下达指令。 “记得报名的时候把我也加上,这种见证技术突破的时刻,我不想错过。”辛顿笑着宣布加入队伍。 亚历克斯凑到伊利亚的电脑前。 “那我们团队叫什么名字?总得有个酷一点的代码代号。”亚历克斯询问。 辛顿看着亚历克斯。 “这个提议是你发现并提出来的,底层的GPU接口调试肯定也要靠你。名字的话,就用亚历克斯命名吧。”辛顿直接拍板。 伊利亚在一旁立刻敲击键盘。 “AleXNet,亚历克斯网络。简单直接,而且有一种赛博朋克的美感。”伊利亚完成了团队注册。 亚历克斯没有推辞,开始思考更深一步的计划。 “有了算力支持,我们可以彻底放弃以前的浅层模型。这次我要搭建一个八层的网络!”亚历克斯说出了大胆的构想。 “八层?五层卷积加上三层全连接层?那参数量会非常恐怖。”伊利亚被这个规模惊到了。 “为了防止这么深的网络训练不稳定,我们还得加点新花样。”亚历克斯大脑飞速运转。