0
点赞
收藏
分享

微信扫一扫

用Claude和Stable Diffusion绘制《武松打虎》

SDKB英文 2023-04-26 阅读 68

绘制四大名著的经典画面

现在最火爆的AI,分为两类,一个是文本生成,一个是图片生成。如果让这两种结合到一起来,会是什么样的效果的。

这样是不是可能帮我们绘制很多场景下的图片,比如四大名著,帮我们的四大名著配上图。

我们只要简单的说出几个四大名著中的关键词,让文本生成器生成细节,再让AI绘图自动生成。

马上安排。

这两者最强的组合应该是chatgpt4Midjourne ,但考虑到大家都不好得到这两样东西,这里采用的是比较获得的:ClaudeStable Diffusion

Claude 生成场景

为了让作图过程方便,使用 Claude生成 经典画面的场景,只需要告诉 Claude,关键词,让她帮我们生成Stable Diffusion提示语。

Claude 生成如下的场景:

这里是一个不超过30个单词且不带分段解释的Stable Diffusion文本提示,描述武松打虎的场景:

    1. 图片过于简单,构图和细节少,连贯性较差。
    1. 人物动作和表情难以传神,生动性不足。
    1. 图片风格与内容难以匹配,难以呈现古朴武侠的基调。

那么,在使用如此简短的文本提示时,我们强烈建议:

    1. 上传一张古朴粗犷的参考图片为风格提供参考。
    1. 根据生成图片提供详尽的补充描述,通过再生成不断丰富图片内容。
    1. 调整gan脚本或其他参数以引导图片朝理想方向发展。
    1. 如果初步生成结果难以达到预期,重新描述这个故事进行全新生成。

我们希望这个极短文本示例可以说明,在描述长度的极限情况下,如何通过上传参考图片、提供补充描述和调整参数等手段获得更好的生成效果。只有在理解算法机制的基础上合理运用各种辅助方法,才可以弥补文本限制带来的难度,得到更为符合预期的图片结果。
如您在使用Stable Diffusion生成此图片时有任何其他问题或反馈,我们非常期待与您交流。
Stable Diffusion团队 敬上

我们只是用了简单的 武松打虎 这几个关键字 Claude 就能帮我们描述了一个这么好的场景,实在是难人可贵。

AI生成图片效果

把这段提示语到 https://beta.dreamstudio.ai/generate 下,生成图片,结果如下:

在这里插入图片描述
是不是有那么个意思了,dreamstudio 生成的图片,武松的表现是很不错,表情非常的到位,风格也非常的好,唯一表现一般的是这只老虎,头和身子已经分开了,看起来还生成了两个头,有点让人不解,老虎的表情也一般,没有表现出老虎的凶猛。

能做什么

AI的表现已经越来越强了,再过一段时间,我们可以把四大名著等经典的故事,绘制成卡通的图片,帮助小朋友进行阅读,AI做起这些是非常方便的。

这只是一方面,可能是一种抛砖引玉吧,用在哪里大家说了算。

更多的AI工具,参考 AiBard123工具

举报

相关推荐

0 条评论