本文来自微信公众号:行者慎思(ID:shensing),作者:陆树燊,题图:由Midjourney生成
上一篇文章《我用GPT4 + Midjourney v5把〈三体〉的主角都画出来了》情理之中、意料之外地火了,首先感谢大家的支持!
文章火了之后,我却发现它造成了一些误解。很多人以为GPT4+Midjourney v5这样的AI神器无所不能,但他们不知道我作为“Prompt(提示词)工程师”,在背后需要反复修改提示词、挑选照片,特别是那些大家觉得像电视剧版本的人们角色,其实不过是我挑出来的……只能说可能是我的认知和审美受到电视剧的影响,而不是AI。
另外,写那篇文章的时候,我使用的Midjourney的功能并不多,我的GPT4那个时候也还没有训练得特别好。这篇文章将会演示一些真实制作AI照片的过程,还讲解AI制图的技巧和方法。相信看完本文,你会对AI生图有更完整的了解。
这征友启事中虽说强调女主“长得很漂亮”,但是到底有多漂亮呢?我也很好奇。于是乎,我八卦心起,把这段话“喂”给了AI画图神器Midjourney。它给出了4个候选图:
这个结果,怎么说呢。说它懂中文吧,它把大爷都画出来了。说它不懂吧,至少大爷还是对着话筒,命中了“播音主持”这个关键词。不管怎么样,我们对第二三两个结果进行多次训练,最后挑出了这样两张照片:
这两个结果已经是我在众多选择中挑出来还过得去的两个了,毕竟人脸是没问题的,手指也是没问题的。虽然两位小姐姐都对着乐器,但我们猜“播音主持专业”的小姐姐应该也能会点乐器吧。(只是这两个乐器确实清新脱俗了。再忽略一下她们背后似是而非的“汉字”,这可能是契丹文字吧。)
我把这个结果发在了朋友圈,并且搞起了一个玩法:让朋友们给我写一段个人描述,我给他们生成一张形象照。
第一个吃螃蟹的人
第一个客户来了:
于是我故伎重演,结果:不能说它跟描述不太相似,只能说是毫不相关。
对Midjourney的中文理解能力彻底失去信心的我,手工对描述做了翻译,并再次喂给了Mid大师:
A 28 old boy,tall,work in a famous company Tencent Inc. , in the Wechat Pay team, as a Product Manager. He likes free life,often go to surfing and his skin is a little black, his like boxing too --v 5
这下就靠谱多了!之后的客户就多了起来。
找到平行空间的姐妹和兄弟
一位朋友 @许霄霖 ,她说:
Beautiful and lively woman from Chaozhou,Guangdong,born in 1982,166 cm tall, graduated in English from Guangdong University of Foreign Studies in 2004, with a strong presence,attractive looks,fair skin,and slightly chubby at around 55 kg. --v 5
当事人觉得这是平行空间的姐妹:
还有一位朋友,原“莉莉丝游戏”产品总监、“轻描淡写科技”CEO吴迪, 他说:
A Chinese handsome 35 years old man, he is from Jiangsu province, he was a programmer, and a game designer, producter. He likes board games and likes studying new technology. --v 5
这两个结果的差异还是挺大的:
AI把他变成了自己的同事
(本节演示“喂图/垫图”)
一家房地产大数据服务商“禾略中国”的创始人 @郑永祥,他的自我描述是“潮州人,四十五了吧,173cm,78kg,发胖中,创业狗,长期奔波于上海深圳重庆,这些年饱受秃顶之苦。做的是房地产数据分析的工作”,他还跟我强调:不要太假正经,我是比较鬼马快乐的人。
根据他的要求,把GPT4帮我生成的prompt(提示词)提交给Midjourney,两大神器联手给出来的结果,让我实在不好意思发给当事人:
于是我用上了他的一张个人照片:
这还需要用到Midjourney的另外一个功能“喂图”,就是要在提交prompt的同时,带上相关图像的链接。
A 45-year-old Chaozhou man, 173cm tall and weighing 78kg, with a slightly overweight physique. As an entrepreneur, he constantly travels between Shanghai, Shenzhen, and Chongqing. Over the years, he has been troubled by hair loss. He is a humorous and playful person who dislikes being too serious. Do not change his face of https://s.mj.run/CNhCaGiigI --v 5
这里要说明一下,虽然我在prompt中要求“do not change his face”,但其实提供给Midjourney的照片,它只会提取其元素,然后加入到关键词中去生成,而不会真的去将人脸取出来一模一样地合并到图中。它生成图片的命令叫/imagine(想象),解读其字面意思也就比较好理解了。
看到结果,当事人说这个照片很像他的一个同事,果然是不是一家人,不进一家门。
让AI替她去海边玩耍
AI公司“文因互联”的市场负责人 @余姗 ,她的自我描述是“162高,55kg,在一家科技公司做市场负责人,她喜欢笑,总是手舞足蹈,会瑜伽,看着疯疯癫癫,长卷发,白色的吊带沙滩裙”,她还说:
收到她消息的时候,我刚好就在海南陵水的海边沙滩躺着,抱着一种罪恶感,我决定满足她的愿望,用了GPT4帮忙生成提示词:
A young woman with a height of 162 cm and a weight of 55 kg,working as a marketing head at a tech company. She has long curly hair,wearing a white strap beach dress, loves to laugh and always dances with joy. At this moment,she is playing on the beach,and her yoga skills make her look energetic.
结果:
当事人表示非常满意:
让AI替她去海边玩耍,这是多么卑微的职场人啊……有趣的是几天后,她告诉我,她因为工作原因,真的去到了海边,果然向AI许愿是有用的。
图像融合,美人随时可“炼”
( 本节演示 /blend 命令)
我的一位不愿意具名的优秀师姐,没有给我描述词,让我给她生成一张新的照片。我只有她的一张照片,于是我决定用上一个新的玩法:图像融合。
Midjourney有一个功能叫 “/blend”,可以把多张图像融合在一起出来新的图像。
首先我要请出来我之前用Midjourney炼出的一个小美女(我叫她 @Betty)。
与真人照片融合之后,神奇的效果出现了:
还有一位朋友,@魏碧珠 ,她是中山市一所学校的老师,同时还是一名驻唱歌手,一个单身的小姐姐。她没有给我个人描述,但她给了我一张很有趣的照片,这张照片上她戴着草帽。
于是我尝试用喂图的方式,再加上一点场景描述:
A realistic photo by Canon camera, focus on the Chinese girl's face, the girl is walking on the beach, and she has a pitch of flower on her right hand https://s.mj.run/SSwfJSEgYV --v 5
特别有趣的是,不管怎么切换场景,她的草帽一直在。
图/AI画图神器Midjourney
把她的照片用/blend命令,和前面的 @Betty 合体,结果Betty也戴上了帽子。
甚至,跟蒙娜丽莎合体,这位来自文艺复兴时期的欧洲贵妇也戴上了中国特色的草帽。
还原上个世纪30年代的魅力女性
(本节演示真正让GPT4和Midjourney v5的联动起来的方式)
AI的能力还不止如此。当我把Midjourney的文档,还有一系列优秀的prompt都喂给GPT4,希望它帮我生成一个能让Midjourney画出“一个1930年代的魅力女性”的提示词。GPT4的答案非常惊艳,这里面不只提出了场景要求,描述清楚了细节,还对相机、镜头、光圈、快门一一指明。
An exquisite,high-resolution photograph of a glamorous 1930s female influencer, exuding elegance and sophistication as she poses confidently in a luxurious Art Deco setting. The image showcases her impeccably styled attire,complete with a stunning silk gown,pearl necklace, and a chic feathered hat that perfectly encapsulate the timeless fashion of the era. The photograph is expertly composed using a classic Leica III rangefinder camera paired with a Summar 50mm f/2 lens,renowned for its distinctive bokeh and soft focus that lend a vintage charm to the image. The camera settings are carefully selected to emphasize the subject's alluring features,with an aperture of f/3.5,an ISO of 100,and a shutter speed of 1/60 sec,capturing the subtle interplay of light and shadow that accentuates her captivating expression. The composition is further enriched by the soft,warm lighting that illuminates the scene,casting a gentle glow on the intricate details of the Art Deco architecture and the luxurious textures of the influencer's attire. The final image is a breathtaking homage to the glamour and allure of the 1930s, immortalized in a stunning photographic masterpiece. --ar 4:5 --q 2 --v 5
而Midjourney v5给出的结果更加惊艳:
来自朋友圈的评价
我把上面一部分照片发在朋友圈,这是一些朋友的评价:
彩蛋
还记得《我用GPT4 + Midjourney v5把〈三体〉的主角都画出来了》文章里面的庄颜1号么?很多人都说最喜欢她。
于是我用她的照片,通过“喂图”技术,给她生成了几个姐妹,并且让GPT4给她们分别取了中文名和英文名,取得还真不错:
集齐庄家五朵金花。罗辑的“梦中情人”庄颜的四位姐姐,请您欣赏:
“炼”出了这么多美人(和帅哥),你最喜欢哪一位呢?
本文来自微信公众号:行者慎思(ID:shensing),作者:陆树燊