未来科技在线电子商务平台
当前位置:未来科技 > 人工智能 > 正文

智能计算机系统的大规模深度学习 Large-Scale Deep Learning for Intelligent Computer Systems

作者:keji.okinfo.org/       ;点击:      时间:2016-03-21 14:25:01

  智能回复(Smart Reply)

 

  Smart Reply是序列到序列在产品中的一个应用案例。在手机上,你希望快速回复邮件,而打字又让人痛苦。

 

  和 Gmail 团队合作,他们开发了一个能预测一条信息可能的回复的系统。

 

  第一步是训练一个小模型以预测一条信息是否是可以快速回复的信息。如果是,就会激活一个更大的计算上更昂贵的模型;该模型将该信息作为一个序列,并尝试预测回复的单词序列。

 

  比如,对于一封询问感恩节邀请的电子邮件,可预测到的回复有三个:把我们算上;我们会去;抱歉我们去不了。

 

  Inbox 应用中惊人数量的回复都是通过 Smart Reply 生成的。

 

  图片说明

 

  生成一张图片说明时,你会试着让机器尽可能写出类似人类基于图片会做出的说明。

 

  采用已经开发出来的图片模型,以及已经研发出来的Sequence-to-Sequence模型,把它们插在一起。图片模型被用作输入。

 

  它被训练用来生成说明。训练数据集拥有五种不同的人给出的五种不同说明的图片。10万到20万的图片需要写70万句的说明。

 

  一张婴儿怀抱泰迪熊的图片,电脑这么写的:一个抱着填充玩具动物孩子的特写;一个婴儿在泰迪熊旁边睡着了。

 

  还没有达到人类理解水平,但机器出错时,结果可能会有趣。

 

  综合视觉+翻译

 

  技术能够综合起来。翻译团队编写了使用了在取景器中识别文本的计算机视觉APP。翻译文本,然后给图片叠加翻译文本(让人印象非常深刻,约37;29)。

 

  模型足够小,整个计算都在设备上运行。

 

  迭代(turnaround)时间和对研究的影响

 

  在一天内完成单个CPU花费6周才能完成的训练

 

  谷歌真的关心能够快速迭代研究。它的想法是快速的训练模型。理解什么运行良好,什么运行欠佳,找出下一组要运行的实验。

 

  一个模型应该在在几分钟几小时内就能可训练,而不是几天甚至几个礼拜。让每个做这类研究的人更加富有生产力。

 10/11   首页 上一页 8 9 10 11 下一页 尾页
标签:智能计算机系统的大规模深度学习,Large-Scale Deep Learning