时隔一个月之久,360智脑又升级了。不过不知道这次升级后它的性能如何,今天就带大家来体验一下升级后的360智脑。
首先最显而易见的就是360智脑在外观上的变化,从原来的一个小小的搜索栏,到现在独立的聊天界面,360智脑越来越像一个独立的产品了。而且经过这一次的升级360智脑的搜索能力也有不少提升,最明显的就是360智脑在聊天过程中已经可以整合互联网实时内容,并开启了搜索回答这一功能。
由此,这个大模型产品日趋完整。它既能够调用大模型能力,也能够结合互联网内容,360甚至在所有回答下方都添加了一个点赞按钮——用户可以直接表达对大模型表现的喜欢与否,这些反馈反过来成为推动360智脑持续进化的宝贵数据。
这是一个完善的产品进化闭环。
扔给360智脑五个刁钻问题,看看它会如何巧妙地解决这些问题。
说了这么多,更重要的是实测。品玩第一时间上手试用了360智脑,并遴选了一些或古怪刁钻、或需要很强语境理解能力的问题来考验这个号称中国第一梯队的大模型产品。
它名副其实吗?(其实作者心中也存在着许多疑惑)
第一个问题是和科技有关,我们向360智脑询问了对苹果头戴显示设备的看法。
360智脑的回答考虑的还是比较全面,市场趋势,创新点和用户需求都涵盖到了,甚至还点到了成本问题。
当然,我们不会这么轻易放过它,在向360智脑表达了对这个答案的不满意后,它是这么回复我的。
首先,360智脑完全理解了这个问题,并在一开始就指出这个问题本身就没有明确的答案。其次,它还就这个问题涉及的一些具体技术细节做了简要分析。
最后我们针对这个问题做了一个追问——它的定价多少合适呢?这时360智脑的回答就让人颇为惊喜了。
从这个回答我们可以看出,360智脑有一个所谓对“合理范围”这个概念的理解,具体来说就是1000-2000美元,这实际上是符合逻辑的。
第二个问题,我们探讨了一下比特币。首先是解释比特币的技术原理,点击重新回答后,360智脑给出了两个答案。
分析一下就能看出来,第二个答案更侧重仔细解释了去中心化交易记录发生的过程。但总的来说,360智脑的回答都是精准的。
接下来,让我们把事情变得无厘头一点,360智脑根据要求创作了一个比特币笑话。
看得出来它是懂幽默感的,那么音乐感呢?
在我指出了这首歌词并没有押韵的时候,360智脑是这么说的。
不得不承认,有理有据,音乐性上或许有些强词夺理,但幽默感上一定是高分。
实际上在上面的例子里,我们能感受到360智脑整体涌现出的“智能”,也就是说你的聊天过程更像是和一个人,而不是机器。当然,这一切目前仍处于非常初级的阶段,上面的测试中也出现过一些意料不到的问题。比如360智脑实质上是无法写出押韵的内容来的,某些情况下它自己会承认这一点。
这种错误,正是大模型“幻觉”的一部分,但恰如周鸿祎说过的那样,“能否胡说八道,恰恰是智能的分水岭。”
带着这种对360智脑在智能上的期待,我们问了第三个问题。
这实际上体现了360智脑生成创作上的能力——这正是智能的重要体现。上面的回答能很好地看出,360智脑不仅理解了问题,而且针对“面试”这个特定情境,从孙悟空的性格特点出发很好地“创作”了符合要求的内容。
这种生成创作的能力让360智脑非常擅长回答一些抽象而困难,俗称一两句话说不清的问题。
或许目前360智脑对这些问题的回答,尤其是拆解逻辑链条的过程还较为简单粗暴,但我们已经能看到它对问题本身已有了相当的掌握度,随着训练规模和推理能力的继续提升,特别是引入了更多用户反馈后,360智脑潜在提升空间让人十分期待。
第四个问题我们要求360智脑写一篇大众点评文案。
这实际上是目前大模型应用最有商业化想象空间的功能部分——文案生成,如上图所示,360智脑完成的非常好。
除了社交网络文案,360智脑还能生成类似旅游攻略这样需要一定逻辑思维链支撑的内容。这一功能对假期想要出门旅游但却又不想自己准备旅游攻略的小伙伴们是非常友好的。
根据美国知名风投A16Z的估计,在美国AI在文案生成领域应用年营收已经超过1亿美元,这是一个已经被证明走得通的赛道,当然也是大模型“兵家必争之地”,360智脑在这方面展现出了第一梯队的实力。当然如果和国外的一些大型AI智能相比,360只能还是处于一种发展初期的状态,仍需要不断的投入。
最后一个问题颇具中国特色,我们想看看360智脑对中国深厚独特的传统文化的理解。我们试着询问360智脑对陆王心学的看法,以及它和程朱理学的区别,360智脑的回答相当出色。(不愧是中国的人工智能,赞!)
除了传统中国哲学,中国的诗词歌赋360智脑也很熟,比如它遴选出李白最好的诗是《将进酒》,而它对中国古诗诗句所代表的寓意和意象的理解也同样精准。
上面的这些问题,有些需要很强的逻辑思辨能力,有些要求大模型本身理解人类独有的幽默感,有的则必须熟稔中国传统文化背景,相对于一般问题,它们都具有一定的难度,而从360智脑的表现来看,它的理解度和完成度可以说相当之高。
这又呼应了我们最开始的那个观点:360智脑已经从搜索的附属功能定位独立了出来,自己变成了一个产品。
实际上360智脑的更新不止上述内容,作为一个多模态大模型,360智脑还可以在聊天对话过程中直接生成图片。
更专业的是去使用360专门用来生成图片的大模型产品——360鸿图。
下面这张图的提示词是在戈壁滩游弋的侦查机器人。
穿梭在宇宙中的超人。
以及在凡尔赛宫门口玩杂耍的小丑。
可以看到在对文字的理解和生成能力方面,360鸿图同样达到了相当不错的程度。
360何以能?360是如何做到现在这样的?
从文字到图片,360智脑在一个月内经历了急速进化,亮出了一套完成度相当不错的产品组合,速度不可谓不快。
中国用户或许都已经习惯了这种飞快的产品落地能力,尤其是周鸿祎在chatGPT推出后密集就AI的各种发声,让人们某种程度上忽略了大模型从训练、推理再到产品化落地实际是个庞大的工程,短时间内想要达到出色的质量并不容易。
360是怎么做到这一点的?
一方面,这当然与周鸿祎“一号位”的大力推动有关。360是最早意识到大模型颠覆性影响的国内互联网企业之一,因此没有走什么弯路,就制定了全面拥抱人工智能的战略。
360管这个叫做“两翼齐飞”,也就是一边发展核心技术,一边加速在场景中落地产品。甚至可以先落地,再优化,小步快走。
战略上的清晰定位为360在百模大战中赢得先发优势奠定了基础,而具体落实到产品上,360本身在数据语料和安全方面的经验积累发挥了大作用。
360的杀毒软件、浏览器还是搜索产品,坐拥庞大的用户群、丰富的数据集资源,加上在安全领域的经验积累,所有这些基础优势为360智脑的训练、推理和产品上线全过程提供了强大助力。
特别值得一提的是数据语料,多年来在搜索产品和浏览器上的深耕为360沉淀了大量优质数据。360宣称自己的数据量是第二名的两倍,更是GPT-3的14倍。
周鸿祎在360智脑刚发布的时候曾说,它是个“还没有准生证的孩子”,一个月过去,这个周鸿祎口中的“未完成版本”迭代成果让人无比惊喜,“准生证”无疑是有了,而360目前聚焦于用各种方式让它更快更好的长大。希望未来的360智脑能够成长得更好。中国人工智能的发展能够在这些AI研发公司的持续推动下更进一步。