本文来自微信公众号:Web3天空之城(ID:Web3SkyCity),作者:城主,本文所有图例均为原创,原文标题:《地球最强组合GPT4+Midjourney V5 意味着什么? (多图演示)》,题图:作者由GPT4提示+MidJourney V5生成


AI绘画服务MidJourney刚发布了V5版模型。


网络上已经有了一些关于V5的介绍文章, 一般都在惊叹v5版模型生成超写实照片的能力。


当然了,这肯定是很强的能力,能轻松生成以假乱真的照片。不过坦诚地说,开源的Stable Diffusion社区也出过超写实照片版本的模型了,而且关键是,在创作领域,“写实”只是其中一种风格。很多时候,我们需要的或许是其他不同的艺术风格。


很多人忽视了这一次 MidJourney V5真正牛X的特点,那就是,V5更倾向于自然语言的输入,而不是一系列关键词(prompt)


这对AI绘画模型是一个革命性的变化。在之前,所有AI绘画模型都要求以一系列提示关键词组合即“Prompt”为输入;AI绘画结果的质量和prompt密切相关,甚至还诞生了一个名词“prompt工程师”,即专门研究AI绘画模型提示词的工程师。


但是,现在MidJourney V5居然支持自然语言输入了!


有人会说,即使用人类语言描述,我也不太会描写那些脑海中的细节啊。


别忘了,我们还有GPT4。


如果我们让GPT4来生成文本描述,甚至直接利用已有的prompt扩展成自然语言描述呢?话痨GPT是不是能把MJ V5的潜力挖掘到极致!


Talk is cheap, show me the pictures!


以下,我们就看看,同一个咒语在Stable Diffusion,Midjourney V4、V5、V5+GPT3.5、V5+GPT4 的加持之下,能达到什么样的水准。


先看一个星际大战场景:


咒语:


starcraft,terran,battlecruiser,combat,base,galaxy,laser gun,fire, quality,extremely detailed CG,unity 8K wallpaper,hyperdetailed,highres,cyber screen frame,absurderes,intricate and refined delicate detailed,cinematic lighting,strong rim light,brighter colours,depth of field


中文翻译:星际争霸,人类,战列巡洋舰,战斗,基地,星系,激光枪,火,质量,极度详细的CG,Unity 8K壁纸,超高细节,高分辨率,赛博屏幕框架,荒谬的分辨率,复杂而精致的细节,电影般的光线,强烈的边缘光线,更亮的颜色,景深


SD:



这个效果只能说勉强(顺便说一句,SD在科幻内容的训练语料似乎不足,整体表现较弱


MidJourney V4(上)| V5(下)




V4的水平已经比SD要好,V5的细节明显的更进一步。


那么,我们在V5+Prompt的基础上再引入GPT呢?


只要简单和GPT说一句:“用英文描述一幅ai绘画的prompt,关键词如下”,然后灌输给它prompt:



我们就得到了GPT给出的话痨版描述,要注意的是,GPT3.5和GPT4给出的答案是不同的:


GPT3.5生成的自然文本:


This Al-generated artwork depicts a battle scene in the world of Starcraft,Create a stunning AI-generated painting with the prompt of a battle scene set in the StarCraft universe. The focus of the painting is a Terran battlecruiser engaged in combat, hovering over a strategic base in the midst of a bustling galaxy. The battlecruiser is equipped with a powerful laser gun, firing at enemy forces with intense bursts of fire. The painting should be of extremely high quality and hyperdetailed, featuring intricate and refined delicate details. The unity 8K wallpaper should showcase the painting's impressive high resolution, cyber screen frame, and absurderes style. The cinematic lighting should be strong, with a powerful rim light casting the battlecruiser and base in a bright glow. The colours should be brighter and more intense, adding depth and dimension to the painting's composition. Finally, the depth of field should add a sense of realism, focusing the viewer's attention on the battlecruiser while blurring the background for added visual impact.


中文翻译:这幅AI生成的艺术作品描绘了星际争霸世界中的战斗场景。创建一幅令人惊叹的AI生成的画作,以星际争霸宇宙中的战斗场景为主题。画作的焦点是一艘参与战斗的人类战列巡洋舰,悬停在繁华星系中的一个战略基地上方。战列巡洋舰配备了强大的激光枪,向敌方部队发射强烈的火力。画作应该具有极高的质量和超高的细节,展示复杂而精致的细节。Unity 8K壁纸应该展示画作令人印象深刻的高分辨率、赛博屏幕框架和荒谬的风格。电影般的光线应该很强烈,有强大的边缘光线使战列巡洋舰和基地显得更加明亮。颜色应该更亮更强烈,为画作的构图增加深度和立体感。最后,景深应增加现实感,将观众的注意力集中在战列巡洋舰上,同时模糊背景以增强视觉冲击力。


GPT4 生成的自然文本:


Title: "Terran Triumph: An Epic StarCraft Battle in 8K"


In this extremely detailed CG masterpiece, inspired by the iconic StarCraft universe, a Terran battlecruiser dominates the scene, surrounded by a fierce and electrifying combat. Set against the backdrop of a distant galaxy, the intricately designed base bustles with activity, as laser guns discharge fiery beams in a thrilling display of high-resolution warfare.


This stunning 8K wallpaper showcases hyperdetailed visuals, immersing viewers in the captivating world of StarCraft. The cyber screen frame adds a futuristic touch, while the absurdly high resolution ensures that even the most refined, delicate details are meticulously captured.


Cinematic lighting, accompanied by strong rim light, illuminates the scene, highlighting the battlecruiser's sleek design and intensifying the sense of action. Brighter colors punctuate the chaos, guiding the viewer's eye through the vast expanse of the conflict. The depth of field effect brings the central elements into sharp focus, while the unity of the composition anchors the viewer in the heart of the battle.


This exceptional 8K wallpaper pays homage to the beloved StarCraft franchise, combining cutting-edge technology and artistic skill to deliver an unforgettable visual experience filled with intricate details, refined delicacy, and unparalleled realism.


标题:“人类胜利:8K星际争霸史诗战斗”


在这幅极具细节的CG杰作中,受到标志性星际争霸宇宙的启发,一艘人类战列巡洋舰主宰了整个场景,周围是激烈而震撼的战斗。在遥远星系的背景下,错综复杂的基地繁忙不已,激光枪释放出炽热的光束,展示了令人震撼的高分辨率战争场面。


这幅令人惊叹的8K壁纸展示了超高细节的视觉效果,使观众沉浸在迷人的星际争霸世界中。赛博屏幕框架增添了未来主义的触感,而荒谬的高分辨率确保了即使是最精致、细腻的细节也被精确捕捉。


电影般的灯光,伴随着强烈的边缘光,照亮了整个场景,凸显了战列巡洋舰的流线型设计,增强了动作感。更亮的颜色突显了混乱,引导观众的目光穿越广阔的战斗空间。景深效果使中心元素更加清晰,而画面的统一使观众沉浸在战斗的核心。


这幅卓越的8K壁纸向备受喜爱的星际争霸系列致敬,结合了尖端科技和艺术技巧,呈现出一幅充满错综复杂细节、精致优雅和无与伦比现实感的令人难忘的视觉体验。


那么具体应用起来如何呢?分别把生成文本扔到MidJourneyV5里,结果如下。


V5+GPT3.5:



V5+GPT4:



很明显,无论是使用GPT3.5还是GPT4 驱动V5,都比直接用prompt驱动的V5细节更多,而GPT4给出的结果更甚GPT3.5一筹!


各自抽一张大图对比, GPT3.5(上)V.S. GPT4(下)




注意看飞船的细节,细节!


好吧,要承认,人类不但不需要去画画,甚至都不需要动点脑筋去琢磨prompt组合了,生成文本都交给GPT4就好。我们只需要简单地告诉GPT4几个关键点,细节驱动文本的生成都交给AI。


上面这例子给到GPT的prompt还略复杂,后面有非常简单的例子,作为人类,只需要告诉AI几个寥寥几个词,然后有了Midjourney V5+GPT4这对无敌组合,从此,还没上岗的prompt工程师可以直接失业了。


以下, 我们给出更多的实例, 一起来看看SD(prompt only)、MJ V4(prompt only)、V5 prompt、V5+GPT3.5、V5+GPT4的对比吧!


(为了节省篇幅,不再给出GPT的话痨输出,prompt仍然奉上,大伙儿可以自行让GPT生成)


魔法美少女


咒语:


magic girl,library underground,candles,anime,posing,very long hair,white hair,detailed beautiful hair,floating hair,diamond earring,emotionless,ribbon choker,intricated filigree,aqua eyes,glowing eyes,crystal textured skin,cloaks,detached collar,summoning,light smile,bracelets,white lace detailed stockings,frilled hat,beautiful pupil,hair ornament,parted lips,magic book,masterpiece,best quality,extremely detailed CG,unity 8K wallpaper,hyperdetailed,highres,cyber screen frame,absurderes,intricate and refined delicate detailed,cinematic lighting,strong rim light,brighter colours,depth of field,


中文翻译:魔法少女,地下图书馆,蜡烛,动漫,摆姿势,非常长的白发,精美的头发细节,飘浮的头发,钻石耳环,面无表情,丝带颈圈,复杂的花纹,水绿色的眼睛,发光的眼睛,水晶质感的皮肤,披风,独立的衣领,召唤,微笑,手镯,白色蕾丝长筒袜,褶边帽子,美丽的瞳孔,头饰,微微张开的嘴唇,魔法书,杰作,最高质量,极度细腻的CG,统一的8K壁纸,超高细节,高分辨率,赛博屏幕框架,荒谬的高分辨率,精致且优雅的细节,电影级灯光,强烈的边缘光,更亮的颜色,景深


SD系列:



MJ V4 | V5:




V5+GPT3.5 | GPT4:




大图:




阳光下的少女


咒语:


Meticulous painting, sunshine, delicate, light, ancient girl, delicate facial features, watery eyes, game


中文翻译:精细绘画,阳光,精致,轻盈,古代少女,细腻的面部特征,水汪汪的眼睛,游戏


SD:



MJ V4 | V5:





MJ+GPT3.5 | GPT4:




大图:




盔甲美少女


咒语: 


extremely detailed CG unity 8k wallpaper, masterpiece,1girl, ahoge, armor, armored_dress, artoriapendragon(fate), blonde_hair, braid, glowing, holding, holding_sword, holding_weapon, looking_at_viewer, solo, weapon, yellow_eyes,album cover,movie poster


中文翻译:极致细腻的 CG Unity 8K 壁纸,杰作,1个女孩,呆毛,盔甲,盔甲裙,阿尔托莉雅·潘德拉贡(Fate),金发,辫子,发光,握持,握剑,握武器,凝视观众,独自,武器,黄眼睛,专辑封面,电影海报


SD:



V4 | V5:




V5+GPT3.5 | GPT 4:




大图:




再来看看场景。


一个日漫风格的场景


咒语:


street on a hill, urban, sunny day, animation concept art, clean, studio ghibli style, Clear reflection,  Makoto Shinkai style, Anno Hideaki, Toriyama Akira, Oshii Mamoru, Mamoru Hosoda, Katsura Masakazu, cyberpunk, 1.2 Neon lights, 0.4 8k, octane render, animated by madhouse inc, studio trigger, vibrant color scheme, epic composition, golden ratio, cinematic


中文翻译:坡上的街道,城市,晴天,动画概念艺术,干净,吉卜力工作室风格,清晰的倒影,新海诚风格,庵野秀明,鸟山明,押井守,細田守,桂正和,赛博朋克,1.2 霓虹灯,0.4 8k,辛辣渲染,由疯狂之屋公司制作的动画,触发工作室,鲜艳的色彩方案,史诗般的构图,黄金分割,电影般的场景


SD:



V4 | V5:




V5+GPT3.5 | GPT4:




大图:




一个幻想风格的城堡场景


咒语:


Beautiful fantasy, castle courtyard with a stunning maple tree in the centre, autumn, hyperdetailed, beautiful lighting, Arches, steps, symmetry, shadows, Jordon grimmer, Grzegorz rutkowski, Breath of the wild, Studio ghibli


中文翻译:美丽的幻想,城堡庭院中央有一棵令人惊叹的枫树,秋天,极度细致,美丽的光线,拱门,台阶,对称,阴影,乔丹·格里默,格热戈日·鲁特科夫斯基,荒野之息,吉卜力工作室


SD:



V4|V5:




V5+GPT3.5 | GPT4:




大图:





新海诚风的小镇山顶早晨


咒语:


house and street on a hill, sunrise, 2d, urban, by Makoto Shinkai


中文翻译:山上的房子和街道,日出,2D,城市,由新海诚创作


SD:



V4 | V5:





V5+GPT3.5 | GPT4:




大图:




其实……连英文prompt都不需要烦恼,简单地找GPT翻译就可以。


比如以下的一个中文关键词描述:


“孙悟空形象的高达,手持机械长棒,极致细节,大师之作,超级华丽,概念美术,游戏CG,杰作,高解析度,穆迪照明,延德尔效应,巨大的星空之门背景,金属,巨型机甲,月光,紫色光粒子特效,雷电特效,对称”


让GPT4翻译一下:


A Gundam with the likeness of Sun Wukong, wielding a mechanical staff, in 8K resolution, as a wallpaper. A masterpiece with ultimate attention to detail, super glamorous, created as concept art on Pixiv for game CG. Featuring high-resolution, moody lighting, and the Van Der Waals effect, with a massive gateway to the starry sky as the background. The metallic giant mecha is illuminated by moonlight, adorned with purple light particle effects, lightning effects, and symmetric features.


然后就成了可以用的咒语了。


MJ V4 | V5:




V5+GPT3.5 | GPT4:




大图:




AI正在用人类想象不到的速度在占领内容创作领域。


从不久前的ControlNet控制生成人物动作,到今天V5完全自然语言的绘画生成,AI每天都在刷新我们的认知;


作为人类的我们,除了颤抖,也许也可以想想,在AI能力的缝隙之上去占领一个什么样的新位置。


本文来自微信公众号:Web3天空之城(ID:Web3SkyCity),作者:城主