微软AI可以根据详细的文本描述来绘制对象.doc

ID：27912080

大小：409.00 KB

页数：8页

时间：2018-12-07

资源描述：

《微软AI可以根据详细的文本描述来绘制对象.doc》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、微软AI可以根据详细的文本描述来绘制对象　　谷歌可能教过人工智能如何涂鸦，但绘制一些更复杂的东西对于电脑来说很难。想象一下，让一台电脑画一只“黑色的翅膀和一个短喙的黄色的鸟”;这听起来有点棘手。不过，微软的研究人员已经开发了一种基于人工智能的技术来做到这一点。根据团队发布的最新文章，它以惊人的准确性从文本描述生成图像。　　系统根据您的输入找不到现有的图像，但会创建真实的图形。首席研究员何晓东在一份声明中表示：“如果你去了Bing并且寻找一只鸟，你就会得到一张鸟的照片，但是这里的照片是由计算机逐个像素地从头开始制作的。“这些鸟可能不存在于现实世界中-它们只是我们计算机对鸟类

2、想像力的一个方面。”　　微软AI可以根据详细的文本描述来绘制对象　　谷歌可能教过人工智能如何涂鸦，但绘制一些更复杂的东西对于电脑来说很难。想象一下，让一台电脑画一只“黑色的翅膀和一个短喙的黄色的鸟”;这听起来有点棘手。不过，微软的研究人员已经开发了一种基于人工智能的技术来做到这一点。根据团队发布的最新文章，它以惊人的准确性从文本描述生成图像。　　系统根据您的输入找不到现有的图像，但会创建真实的图形。首席研究员何晓东在一份声明中表示：“如果你去了Bing并且寻找一只鸟，你就会得到一张鸟的照片，但是这里的照片是由计算机逐个像素地从头开始制作的。“这些鸟可能不存在于现实世界中-

3、它们只是我们计算机对鸟类想像力的一个方面。”　　　　虽然这种绘画技术的当前形式并不完美，但不难想象，未来它可以作为画家和室内设计师的素描助手，或者是基于语音输入来精炼照片的工具。更远的是，研究人员他想象从书面脚本生成的动画电影。　　该团队开始研究计算机视觉和自然语言处理与CaptionBot，一个人工智能系统，自动为照片写字幕，然后创建一个系统回答人们问的图像称为SeeingAI的问题，如果你是盲人。目前的技术由两部分组成：一个是产生被称为生成对抗网络（GAN）的图像，另一个是判断所产生的图像的质量，称为鉴别器。绘图机器人接受了一系列图像和标题的训练，教导人工智能学习使用

4、哪些图像处理哪些单词。团队还创建了一个人类关注的数学表示，当我们从复杂的描述中绘制图片时，我们都使用这个表示：一个红色的翅膀，一个尖锐的喙，一个黄色的翅膀。他说：“注意力是一个人的概念，我们用数学来计算注意力。”　　这个绘图机器人完成了围绕计算机视觉和自然语言处理交叉部分的研究循环，何晓东和他的同事在过去五年中一直在这个领域内摸索。他们一开始研究的是一项能够自动为照片编写标题的技术——CaptionBot，然后转向能够回答人类关于图像问题（例如语音对象的位置和属性）的技术，这种技术对于盲人来说特别有用。　　　　这些研究工作需要训练机器学习模型来识别对象、解释行为并用自然语

5、言进行交谈。　　微软研究院研究员PengchuanZhang补充表示，图像生成是一项比图像字幕更具挑战性的任务，因为这个过程需要绘图机器人想象出标题中没有包含的细节。“这意味着，你需要让运行人工智能的机器学习算法想象出这个图像中缺失的部分。”　　会集中注意力的图像生成　　微软绘画机器人的核心是生成式对抗网络（GenerativeAdversarialNetwork，或者称为GAN）技术。该网络包含了两个机器学习模型，一个根据文字描述生成图形；另一个则作为鉴别器（discriminator），使用文本描述来判断所生成的图像的真实性。这两个模型组合既矛盾又融合，生成器试图让假

6、的图片通过鉴别器的鉴定，鉴定器决定了自己不被愚弄，两者一起工作，鉴定器会推动生成器变得完美。　　传统生成式对抗网络（GAN）在根据简单文字（例如蓝色的鸟或者常青树）描述生成图像方面做得非常好，但是当文字描述变得更复杂的时候，例如绿色的头、黄色的翅膀、红色的肚皮的鸟，质量就会停滞不前。这是因为整个句子对于生成器来说是一个单一输入，这些描述中的详细信息丢失了，结果生成的图像是一只模模糊糊的、有点绿、有点黄也有点红的鸟，而不是严格按照句子中的描述进行着色的鸟。但是，微软的该项技术尤其擅长根据复杂的句子绘制图像，而且，在标题的描述中没有提到的具体细节方面，机器人也可以填补这些空白

7、。　　这是因为，它有一点自己的常识和想象力，这要感谢它的训练数据。在鸟的例子中，机器人画的鸟通常是站在枝头上的，即使是文本内容中并没有提到这一细节也是如此，这是因为最初提供给它的图像经常出现类似的内容。　　微软的绘图机器人使用了标题和图像匹配好了的数据集进行训练，这让这些模型能够学会如何将文字内容和这些内容的可视化表达相匹配。例如，这个生成式对抗网络（GAN）学会了在标题是鸟的时候生成一个鸟的图像，而且也学到了鸟的图像应该是什么样子。何晓东表示：“这是我们相信机器可以学习的根本原因。”　　在人类画画的过程中，会反复查看下一步画

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 8



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

微软AI可以根据详细的文本描述来绘制对象.doc

微软AI可以根据详细的文本描述来绘制对象.doc

相关文章

相关标签