DALL-E 3 是 OpenAI 突破性的生成式 AI 视觉艺术平台的最新版本,刚刚宣布具有突破性功能,包括 ChatGPT 集成。虽然这个公告非常强大,但我们决定把它放在一个环上,看看它的表现如何。
您将首先探索它们在用户友好性、一致性、视觉风格、真实感、功能、社区参与、成本等各个方面的表现。之后,您将使用相同的提示深入研究并排图像比较,从而获得更清晰的理解。这种比较将更清楚地说明每个选项的优势和独特品质。
准备好踏上一段令人振奋的旅程,穿越 AI 驱动的创造力的无限领域,让我们在激动人心的对决中让两位数字大师相互对抗!在一个角落里,我们有标志性的Midjourney,这个名字已经成为令人费解的视觉想象力的代名词。在另一个角落,一个新的挑战者有可能重新定义人工智能艺术格局——DALLE-3!系好安全带,因为这场 AI 巨头的冲突即将带您坐上过山车,穿越未来的创造力!
比较:DALL-E 3 vs Midjourney
以下是DALL-E 3与Midjourney的比较:
特征 | DALL-E 3型 | 中途旅程 |
易用性 | 更简单、更人性化的界面 | 更陡峭的学习曲线,基于文本的界面 |
及时一致性 | 优秀,经常捕捉到细微差别和意图 | 很好,但有时会误解提示 |
图像样式 | 干净、细腻,有时还逼真 | 更具艺术性,绘画性,有时是超现实的 |
现实主义 | 它可能非常逼真,但有时会产生看起来不自然的结果 | 通常更逼真,与自然纹理和照明一致 |
创作自由 | 受安全过滤器限制,无法生成某些内容(人物、商标徽标) | 更多的自由度可以生成几乎任何类型的内容,并由用户自行决定 |
特征 | 一组专注于生成图像的更简单的功能 | 更高级的功能,包括样式转换、放大和文本到图像的变化 |
社区 | 活跃的社区 | 由于其在 Discord 上的性质,一个更大的活跃社区 |
成本 | 按代付费(积分),包含在 ChatGPT Plus 中,可通过 Microsoft Bing AI Image Creator 免费访问 | 只有基于订阅的定价,没有永久免费计划,只有季节性优惠 |
伦理学 | 专注于防止有害内容的创建 | 虽然有严格的措施,但主要依靠用户遵守服务条款 |
DALL-E 3 于 10 月向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布,OpenAI 已经发布了一些带有提示的 DALL-E 3 作品。因此,我们将相同的提示放在 Midjourney 中,看看会发生什么。所以,让我们开始这场战斗吧!
第 1 轮:寻找宇宙
- 提示:“一幅由半透明玻璃制成的人类心脏的插图,站在波涛汹涌的大海中的基座上。阳光穿透云层,照亮心灵,揭示出内心的微小宇宙。'找到你内心的宇宙'这句话用粗体字刻在地平线上。
中途旅程
DALL-E 3型
我们首先要提的是,正如你所看到的,写作并不是Midjourney的强项。正因为如此,像表意文字这样能够通过书写生成图像的人工智能工具现在很流行。
DALL-E 3 图像非常平和安详,唤起了与宇宙的联系感。此外,Midjourney 的形象更加异想天开和俏皮。但是,我们在那里有一个写作错误。尽管存在差异,但这两种图像在视觉上都很吸引人,发人深省。它们都邀请我们反思我们在世界上的位置以及我们与比我们自己更大的事物的联系。
- 决定:DALL-E 3 以其完美的一代赢得了这一轮比赛。
第 2 轮:哪里是看日落的最佳地点?
- 提示:“一栋带有大玻璃窗的现代建筑,坐落在悬崖上,俯瞰日落时分宁静的海洋。
DALL-E 3型
中途旅程
尽管存在差异,但两幅图像都美丽而令人回味。它们都抓住了与自然亲密生活的本质。虽然我们在 DALLE-3 可以清楚地看到日落,但我们不得不承认 Midjourney 的“日落振动”值得一提。
- 决定:Midjourney 获胜。
第 3 轮:向土豆大王致敬!
- 提示:“小小的马铃薯国王戴着雄伟的王冠,坐在宝座上,监督着他们广阔的马铃薯王国,里面充满了马铃薯臣民和马铃薯城堡。”
中途旅程
DALL-E 3型
两代人都在同一个话题上失败了。根据提示,我们需要有多个宝座。但是,在 DALL-E 3 代中,没有宝座,而在 Midjourney 图像中,我们至少有一个宝座。
- 决定:虽然 DALL-E 3 土豆更像土豆,但我们至少可以看到 Midjourney 图像中提到的所有内容。所以,Midjourney 赢了。
第 4 轮:瓷女
- 提示:“一位亚裔中年妇女,她的黑发上布满了银色的条纹,看起来断裂和碎裂,错综复杂地嵌入了破碎的瓷器海洋中。瓷器闪闪发光,飞溅的油漆图案,光泽和哑光的蓝色、绿色、橙色和红色和谐地融合在一起,在运动和静止的超现实并置中捕捉了她的舞蹈。她的肤色,像瓷器一样浅色调,为她的身材增添了一种近乎神秘的品质。
中途旅程
DALL-E 3型
Midjourney 一代的现实主义在我们喜欢它时达到了顶峰!但是,我们不能说那张照片中有“碎瓷的海洋”。而在 DALL-E 3 代中,我们清楚地了解瓷器的触感。
- 决定:DALL-E 3 获胜。
第 5 轮:让我们跳舞吧!
- 提示:“一个由拟人化的秋叶组成的民间音乐乐队的 2D 动画,每个乐队都演奏着传统的蓝草乐器,在乡村森林环境中,收获的月亮的柔和光芒斑驳不堪。
中途旅程
DALL-E 3型
我们在那里有一个明显的赢家。虽然Midjourney这一代人表现得很好,但没有秋天的树叶来做音乐。
- 决定:DALL-E 3 获胜。
第 6 轮:椅子
- 提示:“一张以荔枝为灵感的球形椅子的照片,凹凸不平的白色外观和毛绒内饰,衬托着热带壁纸。
中途旅程
DALL-E 3型
是的,如果您想将其设置为壁纸,您可能会选择 Midjourney。但是,在这种比较中,提示准确性很重要。
- 决定:DALL-E 3 获胜。
第 7 轮:舞者的愿望
- 提示:“在深黑色的背景前,一个中年人,她丰满而发光的汤加皮肤被捕捉到,她的卷发在她身后像暴风雨一样飘动。她的装束就像一阵由大理石和瓷器碎片组成的旋风。在散落的瓷器碎片的光芒照耀下,营造出梦幻般的氛围,舞者设法显得支离破碎,但又保持着和谐流畅的形式。
DALL-E 3型
中途旅程
DALL-E 3 尽管付出了令人钦佩的努力,但差点被淘汰!在 Midjourney 图像中,我们可以看到每个提示细节,但效果更好。
- 决定: Midjourney 获胜。
第 8 轮:让我们去海滩寻找“合适的”隐士
- 提示:“寄居蟹依偎在湿沙中的特写照片,附近有海泡沫,它的壳的细节和沙子的纹理更加突出。
DALL-E 3型
中途旅程
最后,我们必须做出一个接近的决定。这两个图像都很好地表示并且与提示平行。为了公平地决定,我们不得不承认我们在谷歌上搜索了寄居蟹,似乎 DALL-E 3 的生物学比 Midjourney 更好。DALL-E 3图像的外观与真正的隐士更相似。
DALL-E 3 和 Midjourney 一样好吗?
DALL-E 3 是否与 Midjourney 一样好的评估取决于您在寻找什么。在基于提示生成图像的比较中,DALL-E 3 在提示准确性方面获胜,在八轮中的五轮中取得了胜利。
DALL-E 3 在生成逼真、准确的图像方面表现出了与指定提示密切相关的优势。它与 ChatGPT 的集成增加了一层多功能性,允许用户将语言和视觉创造力无缝结合。
另一方面,Midjourney 是 AI 艺术领域的知名玩家,展示了其在创造异想天开和富有想象力的视觉效果方面的优势。虽然它可能不像 DALL-E 3 那样始终如一地匹配提示细节,但它在美学吸引力和捕捉某些细微差别方面获胜。但是,值得注意的是,比较使用了特定的提示和标准,并且可能会根据替代方案或标准出现不同的评估。
如果优先考虑及时的准确性和简单性,则根据提供的比较,DALL-E 3 可能被认为更胜一筹。但是,如果需要更高级的功能和视觉丰富的输出,Midjourney 可能是首选。