当前位置: 主页 > AI案例 >

AI案例

你可能误会了“文心一言”

2023-06-20
李源
网络
自从百度文心语言发布之后,互联网里面全部都是各种,对于文心一言图片生成能力的质疑。其实很多人不知道文心一言在发布之前,百度这边早就已经上线了文心一格专门用来图片生成的模型。并且通过了很多人的测试之后发现,它也会出现跟文心一言一样的笑话。
 
而人们口中的这个笑话,其实是来源于没有正确的进行使用。很多人只是给模型里面输入一个词,甚至还有一些人输入那种成语。这样的文字描述,跟模型的训练样本,肯定会存在着很大的差别。这样它就无法根据你的描述,去做出你想要的那种图画。
 
毕竟文本转图像模型设计的本心,并不是把随便一个词语或者是一个成语转换成为头图像,根据人们输入的文本描述来生成相应的图像。文本描述的越详细,那么它所生成的图像就会越精准。
接下我会简单对比同样的prompt下文心一格,MidJourney,GPT4(new bing)生成的图片。

第1轮比较

Midjourney prompt – “a robot working on a laptop, retro, illustrated, comic style”
一台在笔记本电脑上工作的机器人,复古,插画,漫画风格
 
a robot working on a laptop, retro, illustrated, comic style
文心一格在同样的提示下生成的图片:
 
一台在笔记本电脑上工作的机器人,复古,插画,漫画风格
GPT4(new bing 多模态)
 
a robot working on a laptop, retro, illustrated, comic style
三个模型都能够按照提示生成图片,GPT4的理解更到位一些。

第2轮比较

Midjourney prompt – “logo design for a food truck business, Psychedelic style”
“食品卡车业务的标志设计,迷幻风格”
 
 
logo design for a food truck business, Psychedelic style
文心一格在同样的提示下生成的图片:
 
食品卡车业务的标志设计,迷幻风格
GPT4(new bing 多模态)
 
logo design for a food truck business, Psychedelic style
GPT4效果差一些,其他两个模型基本可以非常好的完成prompt提出的任务。通过上面的简单的对比,。我觉得大部分人都误会了文心一言。
为了进一步验证,我把郑智化的一首歌《我这样的男人》的歌词转化成Prompt,用文心一格生成的图片制作了一个视频。
我这样的男人
大家可以看一下,文心一格生成的图片和歌词还是十分贴切的。
Prompt engineering 是一门新兴的学科,它涉及到如何设计和优化人工智能系统的输入和输出。prompt engineering 的目的是让人工智能系统能够更好地理解人类的需求和意图,以及更有效地传达信息和建议。prompt engineering 包括了多个方面,例如选择合适的数据集、构建合理的查询、评估系统的性能和可靠性等。而中文的Prompt Engineering研究还才起步一定会面临很多挑战,需要大家沉下心来多做研究,多一点耐心少点浮躁。