“这位同学是?”
吴博皱着眉问道。
“吴博,忘了介绍了,这位是elmo的原作者,苏飞。”
王组长的这句话让两位博士表情一滞,原作者?苏飞?
他两人随后眼神一亮,活捉原作者!
这可真是意外之喜啊。
“林叔,我也觉得我们可以听一听苏飞的意见,以他的学术水平,对我们这个项目应该是有比较大的参考意义的。”
顾亦如用余光撇了一眼苏飞,嘴角微微上扬。
“苏师弟的学术水平即便是王教授也一直称赞。”
“如果能获得原作者的意见,那也是我们科大讯飞的荣幸。”
姜林一改之前有些紧逼的态度,微笑着对苏飞说道。
苏飞深吸一口气,道:“虽然预训练模型更适用于纯文本的推荐算法,但elmo是个例外,我想在座的也都知道,elmo是没有信息提取层的,这也就意味着elmo的信息提取层可以自由添加,图像处理也是可以的。”
“可是肆意添加信息提取层不会导致训练不稳定或者效果大打折扣么?”
偏保守的刘博第一个唱反调。
“如果用卷积或者循环神经网络来提取的话是有可能的,但是如果使用注意力机制来提取的话应该没什么问题。”苏飞耸了耸肩。
“你有实验过么?”
“嗯,而且我敢肯定,最迟明年,注意力机制就将主导信息提取这一领域。”
acl已经接受了他的论文,最迟明年一月论文就应该会入库,到时候transformer登上世界舞台,苏飞敢肯定,这个跨时代的产物会主导整个人工智能领域,何况是一个信息提取。
虽然不知道这个天才少年为什么如此笃定注意力机制的作用,但众人并没有反驳,苏飞所提供的思路如果正确,那么elmo就能处理图像领域。
“所以你的回答是,可以以小说或者短视频推荐算法为主?”
吴博的眼神中透露着兴奋和期望,原作者都站在我这边,骄傲.jpg。
“我只是根据我的经验提一点意见罢了,我想说明的是,如果用注意力机制在elmo模型中添加图像信息提取层,大概率是毫无问题的。具体的取舍仍然是科大讯飞的各位决定。”
苏飞又把问题抛回给了姜倾雪。
虽然看上去又把问题抛了回去,但在苏飞提出了这种新思路之后,大部分人的心中其实都有了答桉。
苏飞没有直接给出答桉,但他的回答无疑让其中一个选项的风险大大降低,既然风险降低了,那自然会以利益为先,这道二选一的选择题自然也变得更简单。
“先按照苏飞同学的思路构建一个简单的训练任务,验证一下注意力机制加上elmo的训练效果,如果效果不错,就以小说和短视频推荐算法为目标,否则,就回到新闻推荐算法。”
姜倾雪的方案也是在座大多数人的想法,连一直反对这个提桉的刘博也罕见地没有说话。
毕竟,如果注意力机制加elmo这种组合效果真的很不错,那又是一个不错的科研成果了,而且试验一个简单的训练任务两三天就能搞定,这点时间还是有的。
姜大校花看向姜... -->>
本章未完,点击下一页继续阅读