微信号:ali_tech

介绍:阿里巴巴官方技术号,关于阿里的技术创新均将呈现于此

“天猫精灵”如何为你写诗?人机共创的秘密在这儿

2018-08-29 08:08 人工智能实验室

阿里妹导读:在AlphaGo人机大战之后,AI在模仿学习人的能力上得到了关注。同时,一种焦虑也在人们心中蔓延,我们的工作何时会被AI替代?


阿里巴巴人工智能实验室用好玩的“天猫精灵写诗”告诉我们实现人机共创的可能,接下来,我们一起了解七夕节,天猫精灵花式表白背后的技术。


今年七夕期间,由阿里巴巴人工智能实验室(A.I.Labs)AI创作团队研发的《天猫精灵为你写诗》(以下简称“为你写诗”),通过它,你可以用AI给心爱的人写一首藏头情诗,还可以进行人机共创的合作。


今天,我们对AI创作团队负责人进行了专访。该团队在A.I.Labs的认知实验室负责探索AI智能创作、深度学习、自然语言理解、智能对话等人工智能技术在智能音箱上的应用。


识别上方二维码,可亲身体验~

 

如何实现古诗创作中的人机共创?

 

Q:为什么想到从AI写诗这个角度切入,去做人机共创?

 

A:在文艺创作这件事情上,我们认为最重要的不是智能,人机共创才能将“智能”与“情感”的结合推向一个更高的高度,让创作更具“心智”和“情感”才是更重要的。在人机共创的过程中,机器也可能会越来越多地了解“情感”的表达。为印证人机共创的价值,我们做了“天猫精灵为你写诗”的尝试。

 

 

Q:“为你写诗”人机共创的部分是如何实现的?

 

A:人机共创的模式是机器为人提供推荐,而不是让人独自去完成修改。例如,诗句生成模型在每一句诗的每一个字都可以提供候选集,还可以通过beam search固定一部分文字生成后序的文字等等。

  

但是,单句或者单字的修改其实是会影响整首诗的质量的,如果只修改一句,不能对后续诗句做相应的推荐则不能发挥人机共创的优势,针对这个问题我们给出了一个解决方案:

 


我们在绝句的生成过程中保一个位留了每置诗句的不同表达,然后再选择匹配句子,通过统一的评价模型来衡量不同的佳句组合的质量,从中选择最具品质的作为输出。

 

Q:如何构建人机共创的评价模型呢?

 

 

A:整诗的评价模型实际上是用整诗的概率来表征成诗质量,可以拆解成为 。我们通过在几十万古诗上训练得到评分模型,其中每一个诗句都通过bigram词袋来表征。

 

前序诗句的bigram词袋经过嵌入层之后再经过全链接网络对后一句打分,这个分数可以看作是对每一边的评分,而整诗的评分就是所有边评分个乘积。评分模型可以通过在古诗训练集上学习,同时在使用过程中很容易通过对计算的缓存来加速。

 

 

整个搜索的过程是一个求出最大K路径的问题,每一个路径的打分则通过评分模型完成。搜索过程中,通过剪枝来去除压韵和平仄不相符的路径,最终按照评分排序得到最佳绝句。

 

这个过程可以从任意一句诗开始,当其中一句诗被修改之后,就可以从它开始重新构建整棵树,然后根据评价模型的结果来推荐后续诗句。

 

让机器写诗变得更优秀

 

Q:在写诗这件事上,“为你写诗”如何做到人有我优?

 

A:从写一句诗到写两句诗的最大挑战在于如何让两句诗的语境相连,也就是说在写第二句诗的时候机器需要知道第一句诗在说些什么,并且承前启后。

 

语境的延续表现为选择合适的汉字组成合理的诗句,需要解决通顺和达意两个难点,前者可以通过RNN模型解决,后者则需要通过sequence-to-sequence模型来传递前句的意思。



Sequence-to-sequence最早应用于机器翻译领域,而后应用场景拓展到了对话等语言生成任务中。Sequence-to-sequence的基本组成是两个RNN网络:LSTM Encoder网络和LSTM Decoder网络。

 

Encoder网络的目标是将第一句诗的不同元素都表征成一个实数向量,可以理解为将第一句诗所包含的语义encode到了这些向量中;Decoder网络则更像是一个RNN语言模型,只不过在选取汉字的时除考虑已经写出来的前半句还要考虑Encoder网络的输出。Encoder网络的输出时,通过注意力机制(Attention)来选取前句中的中心意思,以便在生成诗句的时候做到真正的达意。



我们认为整诗的质量应该是能够通过人机协作共同创作的方式提高的,这和之前的写诗程序有很大的不同。机器的模型再丰富,历史的诗词再高雅,其实都及不上一颗参与其中的真挚的心,所以我们在设计上鼓励用户参与推敲,提供了自由修改诗句的能力。

 

Q:人机共创的技术应用前景如何?

 

A:对于语言的理解和生成可以被应用到更广泛的创作场景里。为机器装上“心”,与人协同创作,将为我们人工智能的高峰“文学艺术创作”打开全新的出路,就像AlphaGo的出现,给了职业棋手学习更开天辟地的棋路打开新的空间一样。


 

或许不久将来,天猫精灵能成为一个超级输入法,不用你输入每一个想写的字,而是输入一个梗概或者主题,天猫精灵就可以生成一篇对应的文章,再交互式的修改一下就完成了。

 

AI的价值在于帮助人,不是替代人,人机共创、共赢或许才是未来打开AI的正确方式。


资料

阿里巴巴人工智能实验室成立于2016年,负责集团旗下消费级AI产品的研发。主要研究方向为语音、视觉、行动力等。其使命是探索人机交互新大陆,带领人们体验探索未知世界的乐趣。


每天一篇技术文章,

看不过瘾?

关注“阿里巴巴机器智能”,

发现更多AI干货。


 ↑ 翘首以盼等你关注



你可能还喜欢

点击下方图片即可阅读


领域驱动设计,盒马技术团队这么做


如何量化考核技术人的 KPI?


看完这8本算法好书,才算真正懂了 AI



关注「阿里技术」

把握前沿技术脉搏

 
阿里技术 更多文章 AI时代的全链路监控,阿里工程师怎么做? 健康知识图谱,阿里工程师如何实现? 城市大脑背后的技术有哪些? 阿里副总裁玄难:藏经阁计划首次在阿里应用落地 从技术角度聊聊,短视频为何让人停不下来?
猜您喜欢 Android兼容性系列(一)适配重点 数据处理之——dplyr Python正则表达式之四:re模块 浏览器访问一个网站所经历的步骤 为什么要开始写作