输入文字就能画出图片！人工智能再进一步 -6parkbbs.com

原标题：输入文字就能画出图片！人工智能再进一步

旧金山人工智能研究公司OpenAI已经开发了一种新系统，能根据短文本来生成图像。OpenAI表示，这个新系统名为DALL-E，名称来源于艺术家萨尔瓦多·达利（Salvador Dali）和皮克斯动画瓦力（WALL-E）的结合。 6park.com

新的AI有多厉害呢？只需要输入文字，它就能根据描述，生成图片。比如，在DALL·E模型中输入“穿芭蕾舞短裙、正在遛狗的萝卜宝宝”，它就可以生成这样一张图片： 6park.com

输入“鳄梨形状的扶手椅”，就是这样： 6park.com

甚至输入“含OpenAI字样的店铺”，它也能生成多种设计图 6park.com

人工智能“大神”吴恩达也第一时间转推点赞，还顺带挑选了一张满意的蓝色衬衫 + 黑色长裤的AI 生成图。 6park.com

在系统中，可以随时根据需求进行调整： 6park.com

比如：乌龟身子长颈鹿脖子的“物种”只要告诉它，就能呈现相关图像： 6park.com

同时控制多个对象、它们的属性以及它们的空间关系，对模型提出了新的挑战。例如，考虑 "一只刺猬戴着红色的帽子、黄色的手套、蓝色的衬衫和绿色的裤子 "这句话，为了正确解释这个句子，DALL-E不仅要正确地将每件衣服与动物结合起来，而且要形成（帽子，红色）、（手套，黄色）、（衬衫，蓝色）和（裤子，绿色）的关联，不能将它们混为一谈。 6park.com

研究人员测试了DALL-E在相对定位、堆叠对象和控制多个属性方面的能力。例如：一个Emoji的小企鹅，带着蓝帽子，红手套，穿着黄裤子。 6park.com

虽然DALL-E确实在一定程度上提供了对少量物体属性和位置的可控性，但成功率可能取决于文字的措辞。当引入更多的对象时，DALL-E容易混淆对象及其颜色之间的关联，成功率会急剧下降。研究人员还注意到，在这些情况下，DALL-E对于文字的重新措辞是很脆弱的：替代的、语义等同的标题往往也不会产生正确的解释。 6park.com

今天AI学会了画图，谁知道下一步会的是什么呢？ 6park.com

评分完成：已经给本帖加上 10 银元！

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

打开微信，扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐：

2022年中胡润全球独角兽榜发布：诚瑞光学连续两年上榜 09/18/22
增收不增利！市值减少700亿，扫地茅石头科技不香了？ 09/18/22
疫情之下，连锁酒店还是一门好生意吗？ 09/18/22
iPhone14预售平台跑路：当黄牛遇上骗子 09/18/22
段永平称赞库克：非常棒非常刻苦，希望他在苹果多待几年 09/18/22
天邑股份：9月16日召开业绩说明会 09/18/22
理想为什么急了？ 09/07/22
“缺芯少魂”的汽车供应链，距离自主可控还有多远？ 09/07/22
别被爆亏吓到，蔚来正走近 “好日子” 09/07/22
Snap抗寒，Zenly殒命 09/04/22
现金流“缺血”的华为，如何过冬？ 09/04/22
我去了中国最大的 Web3 聚会，发现人们想要的不是 Web3 09/04/22

>>>>查看更多楼主社区动态...