英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了

9158APP 2022年08月14日 09:57:00 608 0

　　人类幼崽 2 岁就能做的事，AI 竟然才学会?

　　早在 2017 年，就有网友吐槽：2 岁幼童只要见过一次犀牛的照片，就能在其他图片里认出不同姿势、视角和风格的卡通犀牛，但 AI 却做不到。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第1张图片-9158手机教程网

　　直到现在，这一点终于被科学家攻克了!

　　最新研究发现，只要给 AI 喂 3-5 张图片，AI 就能抽象出图片里的物体或风格，再随机生成个性化的新图片。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第2张图片-9158手机教程网

　　有网友评价：非常酷，这可能是我这几个月来看到的最好的项目。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第3张图片-9158手机教程网

　　它是如何工作的?

　　让我们先来看几个例子。

　　当你上传 3 张不同角度的陶瓷猫照片，可能会得到以下 4 张新图像：两只在船上钓鱼的陶瓷猫、陶瓷猫书包、班克斯艺术风格的猫以及陶瓷猫主题的午餐盒。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第4张图片-9158手机教程网

　　同样的例子还有艺术品：

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第5张图片-9158手机教程网

　　铠甲小人：

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第6张图片-9158手机教程网

　　碗：

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第7张图片-9158手机教程网

　　不只是提取图像中的物体，AI 还能生成特定风格的新图像。例如下图，AI 提取了输入图像的绘画风格，生成了一系列该风格的新画作。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第8张图片-9158手机教程网

　　更神奇的是，它还能将两组输入图像相结合，提取一组图像中的物体，再提取另一组的图像风格，两者结合，生成一张崭新的图像。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第9张图片-9158手机教程网

　　除此之外，有了这个功能，你还可以对一些经典图像“下手”，给它们添加一些新元素。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第10张图片-9158手机教程网

　　那么，这么神奇的功能背后是什么原理呢?

　　尽管近两年来，大规模文本-图像模型，如 DALL・E、CLIP、GLIDE 等，已经被证明有很强的自然语言推理能力。

　　但有一点：如果用户提出一些特定的需求，比如生成一张包含我最喜欢的童年玩具的新照片，或者把孩子的涂鸦变成一件艺术品，这些大规模模型都很难做到。

　　为了应对这一挑战，研究给出了一个固定的、预先训练好的文本-图像模型和一个描述概念的小图像集(用户输入的 3-5 张图像)，目标是找到一个单一的词嵌入，从小集合中重建图像。由于这种嵌入是通过优化过程发现的，于是称之为“文本倒置(Textual Inversion)”。

　　具体来说，就是先抽象出用户输入图像中的物体或风格，并转换为“S∗”这一伪词(pseudo-word)，这时，这个伪词就可以被当作任何其他词来处理，最后根据“S∗”组合成的自然语句，生成个性化的新图像，比如：

　　“一张 S∗在海滩上的照片”、”一幅挂在墙上的 S∗的油画”、”以 S2∗的风格画一幅 S1∗”。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第11张图片-9158手机教程网

　　目前，该项目的代码和数据已开源，感兴趣的小伙伴可以关注一下。

　　作者介绍

　　该篇论文来自特拉维夫大学和英伟达的研究团队，作者分别是 Rinon Gal、Yuval Alaluf、Yuval Atzmon、Or Patashnik、Amit H. Bermano、Gal Chechik、Daniel Cohen-Or。

　　第一作者 Rinon Gal，是特拉维夫大学的计算机科学博士生，师从 Daniel Cohen-Or 和 Amit Bermano，主要研究方向是在减少监督的条件下生成 2D 和 3D 模型，目前在英伟达工作。

　　

英伟达从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能 AI 终于学会了-第12张图片-9158手机教程网

　　参考链接：

　　[1]https://textual-inversion.github.io/

　　[2]https://github.com/rinongal/textual_inversion

　　[3]https://arxiv.org/abs/2208.01618

　　[4]https://twitter.com/_akhaliq/status/1554630742717726720

　　[5]https://rinongal.github.io/

标签：英伟达人工智能 AI

本文地址： https://9158app.com/11989.html

文章来源： IT之家

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除;如已特别标注为本站原创文章的，转载时请以链接形式注明文章出处，谢谢！

上一篇北京发布国内首个数字人产业专项支持政策，2025 年产业规模突破 500 亿元

下一篇设计最高时速 350 公里，京唐京滨城际铁路开始联调联试

发表评论（已有0条评论）

还木有评论哦，快来抢沙发吧~