首页
[切换至繁体版]
返回

第396章 我这有几千张GPU,你要吗?

章节报错(免登陆)
下载APP,无广告、完整阅读

笔趣阁(biquge2345.com)更新快,无弹窗!

  任少卿把U盘插进去,屏幕上亮出报告封面:
    《基于改进卷积神经网络的目标检测:突破传统特征工程的范式》
    他扫了一眼台下,做了个深呼吸。
    “各位老师、各位同学,下午好。我叫任少卿,来自中科大与微软亚洲研究院的联合培养项目。今天我要跟大家分享的工作,核心出发点是一个我认为非常重要的问题——传统的手工特征,在目标检测任务上,是不是已经遇到了天花板?”
    后排有几个博士生坐直了一点。
    前排的老先生们,表情没什么变化。
    任少卿继续往下走。
    他讲架构,讲他对AleXNet的改进,讲数据增强,讲在PASCALVOC上跑出来的结果。
    讲得快,但逻辑清晰,每一步推进都有据可查。
    讲到第七页,他把那张对比折线图放到了最大。
    “……在相同的测试集上,我们的方法在mAP指标上比当前最优的DPM模型高出了11.3个百分点。这个差距,我认为不是调参层面的改进,而是底层特征提取范式的本质性跃迁。”
    (本章未完,请点击下一页继续阅读)第396章我这有几千张GPU,你要吗?(第2/2页)
    报告厅里安静了大概两秒钟。
    然后,前排左边第二个位置的老先生开口了。
    任少卿认识这位老先生。
    西安交大计算机视觉领域的老前辈,做了三十年图像处理,手底下出来的博士生如今遍布国内各大高校和研究院,标准的一代宗师。
    “小伙子,”
    老先生语气并不严厉,甚至带着点慈祥,
    “你这个结果,训练的时候用了多少GPU?”
    “四张NVIDIAGTX780,训练了大约十二天。”
    老先生点了点头,慢条斯理地说:
    “我想问你,这十二天、四张显卡跑出来的东西,在工程落地上怎么解决?你这个模型,推理一张图片需要多长时间?”
    “目前大概是0.5到0.8秒每帧——”
    “那实时检测呢?”
    老先生温和地打断,
    “工业摄像头要求的是25帧以上,你离这个目标还差多远?”
    任少卿顿了一下。
    ——他当然知道差多远。他只是同样知道,五年后这个问题会变成什么样的答案。
    “目前确实还不满足实时要求,但是——”
    “还有,”
    旁边另一位中年教授接过话头,语气更直接,
    “你说比DPM高11个点,但你用的训练数据量是DPM的几倍?GPU算力消耗是DPM的几倍?这个对比,公平吗?”
    “数据量大约是……两倍,”
    任少卿深吸一口气,
    “算力消耗相对更高,这点我承认。不过我想指出的是,随着GPU硬件成本持续下降,算力约束在未来三到五年内会快速缓解,到那个时候——”
    “到那个时候再说到那个时候的事。”
    中年教授语气不咸不淡,
    “我们讨论的是2013年可落地的工作。”
    后排有几个博士生没忍住,凑在一起交换了几句什么。
    任少卿站在台上,握着激光笔的手指不动声色地收紧了一下。
    他在组会上被导师骂过,被审稿人拒过,被同组的师兄用红笔密密麻麻划过论文草稿。
    但今天这种感觉,不一样。
    不是羞辱,老先生显然没有这个意思。
    是隔阂。
    是两个人分别站在两座山顶,隔着一道深不见底的沟壑喊话。
    彼此都能听见声音,却没有一个人能确认,对方说的是不是同一件事。
    老先生看到的是2013年的现实:算力稀缺,工程不成熟,理论可解释性不足。
    任少卿看到的,是2016年,是2018年,是2020年。那是一条已经确定了走向的单行道。
    所有在入口踟蹰不前的人,都会被后来的历史证明,站在了错误的一侧。
    但他没法证明这件事。
    他没有办法站在2013年,把未来的那些数字递给眼前这些前辈看。
    “感谢各位老师的宝贵意见,”
    任少卿调整了一下神情,扯出个平静的笑,
    “工程落地和理论解释性的问题,我会认真思考,这部分工作确实还有很大的空间……”
    剩下几页PPT快速过完,宣讲在稀稀落落的掌声里结束了。
    ……
    报告厅外的走廊里,任少卿靠着一根石柱,把双肩包从肩膀上拽下来,随手扔在脚边,仰起头,盯着头顶白炽灯管里那道平静的光。
    窗外,八月的夕阳把整个交大校园熏成了一片焦橙色,梧桐树的叶子在热风里懒洋洋地翻着肚皮。
    他把今天下午的剧本在脑子里重放了一遍。
    宣讲失败,这个结论不用再论证了。
    那两位超算中心的挂名负责人,他宣讲一结束就特地凑过去,名片还没来得及换,对方就礼貌性地微笑着接了个电话走开了。
    任少卿揉了揉太阳穴。
    这趟西安,白来了。
    从北京过来的机票和这两天的住宿,是他自掏腰包的。
    导师给的差旅报销额度他留着出去参加顶会用,舍不得花在这种研讨会上。
    想想都亏。
    他弯腰把包捡起来,准备去找学生餐厅对付一顿。
    “同学,等一下。”
    任少卿回过头。
    一个男生从他左边三米外走过来,大概十七八岁的样子,一头染得张扬的黄毛,大裤衩加白T恤,脖子上随便挂着个不知道从哪顺来的临时旁听证,脚上踩着一双半旧的运动鞋,要多随意有多随意。
    这栋楼里全是西装和pOlO衫。
    这个人跟所有人都格格不入。
    但他走路的姿势,带着一股说不清楚的笃定。
    他在任少卿面前停下来,抬起头,打量了他两秒,开口:
    “你就是刚才做卷积神经网络目标检测报告的那位吧?”
    任少卿微微一怔:
    “是。”
    那个黄毛少年把手插进裤兜,嘴角往上扯了一下。
    “算力不够用?”
    不是疑问句。
    陈述句。
    任少卿盯着他看了整整三秒,没有说话。
    “我在锦城,”
    黄毛少年语气轻描淡写,像在聊今晚吃什么,
    “雅安大渡河边上有个数据中心,现在装机规模大概是几千张GPU,目前主要跑推荐算法和挖矿。不过,我刚抛了一笔比特币,下个月会有两千张英伟达最新的顶级计算卡进场,专门留给深度学习。”
    他顿了顿。
    “你有没有兴趣,去我公司上班?”
    “算力,管够。”
    PS:【糊涂旧岛】大佬送出的【礼物之王】加更三章第一章
章节报错(免登陆)
下载APP,无广告、完整阅读
验证码: 提交关闭