首页

都市青春

带着手机重生,目标科技教父

设置

字体样式
字体大小

带着手机重生,目标科技教父:第633章 ImageNet挑战赛开启,赛制堪比天梯排位

时间进入2009年12月中旬。 墙上的电子挂钟跳到上午十点整。 对于写字楼里的上班族来说,年底只意味着写不完的年终总结。 但对于京城邮电大学计算机系教研室里的人来说,今天是个大日子。 郭长征站在电脑屏幕前。 楚一航坐在椅子上,右手握着鼠标,左手习惯性地搓着下巴上的络腮胡。 旁边站着研究生钟柏、江深和叶言。 电脑浏览器上,INet视觉识别挑战赛的官方网站正式开放访问。 楚一航点击刷新按钮。 原本只有倒计时的页面瞬间变了模样,深蓝色的导航栏加载出来。 赛题和规则文档链接出现在页面正中央。 钟柏赶紧凑近屏幕,指着其中一行英文。 “上面说,开放了一百二十万张图像,作为训练集?这数据量有点离谱吧。” 楚一航摸了摸下巴。 “以前的视觉识别比赛,搞个几万张图片就算顶格配置了。” “这次一上来就直接放出百万级别的数据集,跨度太惊人了。” “主办方这明摆着是鼓励大家别走寻常路,逼着所有参赛队伍去点新的科技树啊。” “而且这是明示大家,要用GPU去处理图片,传统的CPU干冒烟了,也处理不过来这么多图片。” 叶言在旁边点头赞同,补充说明。 “确实,要是继续用传统的老算法去跑这百万张图像的特征,算到比赛结束都跑不完第一轮。” “除了训练集,还有五万张验证集图片,这部分是带标签答案的,是让方便我们对自己的模型,先内部评估一下。” “算是模拟试卷。” 楚一航继续往下念规则。 “十五万张测试集图片,答案不公开。” “这就是这个比赛真正的考题了。” “我们需要用自己的算法,预测这十五万张测试集的标签,然后上传到官网。” 郭长征看着比赛周期说明。 “比赛为期三个月,到明年3月15日截止。” 钟柏指着“UplOad”按钮旁边的一行小字。 “这上面写着,比赛期间可以随时提交预测结果。” “官网会根据提交的结果,动态更新每个团队的当前排名。” 叶言愣了一下。 “实时排名?还能这样玩?” 楚一航乐了,拍了拍大腿。 “这哪是搞学术,这纯纯是网游里的天梯排位赛啊。” 钟柏也跟着分析。 “以前的学术比赛,都是大家蒙头搞几个月。” “最后一天统一提交,组委会再花几天时间评阅,最后放榜。” 郭长征思索着这种新赛制带来的变化。 “实时更新排名,意味着所有参赛队伍都能看到别人的进度。” “这就倒逼着大家一刻不能停,只要被人超了,就得继续优化模型重新跑。” 叶言接着念规则。 “整个比赛期间,每个账号最多只能上传五次预测结果。” “最终成绩,取五次中得分最高的那一次。” 楚一航啧了一声。 “五次机会,这不就是排位赛里的保级赛机制吗?用完就只能干瞪眼看别人上分了。” 钟柏继续看排名机制的具体算法。 “榜单分为TOp-1正确率和TOp-5正确率两个实时排名。” 楚一航看着那两条榜单规则,直接乐了。 “这赛事主办方也太懂年轻人了,硬生生把沉闷的学术比赛做出了电子竞技的刺激感。” 叶言在一旁兴奋地搓了搓手。 “确实有意思,以前搞研究只能自己一个队伍闷头死磕代码,毫无互动可言。” “现在搞出实时排行榜和提交次数限制,直接变成了全网极客在线大乱斗。” 钟柏的胜负欲完全被勾起来了,声音都不自觉地拔高。 “这么一来,咱们上传成绩的时间节点就非常讲究了,还得跟全世界的其他队伍玩心理战。” 郭长征看着几个干劲十足的年轻人,笑着点头。 “这种赛制把竞争完全摆在明面上,确实能最大程度逼出大家的好胜心。” 楚一航双手在键盘上快速敲击了两下,眼神里全是跃跃欲试。 “那还等什么?我已经迫不及待想下场,好好蹂躏他们了。” …… 至于为什么这次比赛的赛制,会如此有意思,还要说回两周前。 远在魔都的高档写字楼里。 英伟达中国大区总经理张建忠的桌面上,放着INet赛事的最终赞助确认书。 秘书小刘站在办公桌对面,正在汇报赛事的媒体宣发情况。 “张总,INet官网已经按照我们的要求,把实时排行榜功能上线了。” 张建忠翻看着文件。 “李飞飞教授那边没再提出什么异议吧?” 小刘摇头。 “没有。他们团队的资金缺口很大,亚马逊的众包标注平台收费很高。” “我们这笔赞助解了他们的燃眉之急,对于赛制修改的要求,他们全盘接受了。” 张建忠拿笔在文件上签下名字。 实时排行榜这个点子,就是他本人向总部提议,并要求加进INet比赛里的。 传统的学术比赛太过沉闷,圈外人根本不关心。 既然英伟达赞助这次比赛的核心诉求就是热度,那就需要一种能让媒体持续报道、能让参赛者产生焦虑感和竞争欲的机制。 排行榜就是最好的焦虑制造机。 为了放大这种竞争欲,英伟达不仅赞助了赛事运营,还单独设立了三万美元的冠军奖金。 小刘提出一个疑问。 “张总,官网还开通了论文和代码同步公开的功能。” “这也是我们提的诉求。” “您就这么确信,排在前面的队伍,会用我们英伟达的CUDA架构吗。” 张建忠靠在椅背上。 “这不需要确信,这是概率学。” “目前市面上能提供大规模并行计算能力,且被学术界广泛接受的,就只有我们的显卡。” “高校那些传统的图像特征提取算法,处理几千张图片还行。” “面对一百二十万张的庞大数据集,传统的CPU计算模式根本跑不动。” 小刘接着问。 “万一有人用AMD的显卡呢?” 张建忠笑了笑。 “硬件只是躯壳,生态才是灵魂。” “AMD没有CUDA这样成熟的底层调用架构。” “研究员拿了AMD的卡,连最基础的矩阵运算库都要自己从头写。” “三个月的比赛时间,光写底层代码都不够,还比什么赛?” 小刘翻开手里的另一份简报。 “那盛夏科技前两个月推出的那个九章计算平台呢?” 张建忠听到这个名字,手指在桌面上敲了两下。 “九章确实是个变数,它能兼容AMD的硬件。” “但一个推出才两个月的新平台,很多高校的老师,甚至都没听过它的名字。” “研究员们习惯了我们英伟达的工具链,谁会冒着比赛失利的风险,去踩一个新平台的坑?” 张建忠对目前的局势判断非常清晰。 英伟达通过几年的高校赞助,已经完成了用户习惯的初步绑定。 这三万美元的奖金,就是用来收割这批高校用户的成果的。 只要前几名使用了CUDA并在官网上公开技术论文或者源码,那就是对英伟达最好的免费广告。