没放PPT,360版的GPT怎么样?我们把它和ChatGPT、文心一言比了比
出品|三言Pro 作者|雨辰
要说搜索引擎和生成式AI大模型绝配应该不会有人反对。
前有微软bing+GPT,再有国内搜索头号玩家百度推出文心一言,昨日国内搜索的二把手360也忍不住秀了自己的GPT类产品。
“把刚生出来的孩子抱出来看看”,360创始人周鸿祎也直言可能还存在不足,顺便请网友帮产品取个名字。
直播间不少人敲出了“红孩儿”,看着周鸿祎的红色POLO衫就很应景。
而这次周鸿祎没放PPT,甚至和主持人以及现场观众互动演示产品,先不说产品怎么样,红衣大叔确实勇气可嘉。
那么360GPT到底效果咋样呢?我们一起来回顾下,顺便和ChatGPT、bing以及文心一言做个对比。
没有PPT,周鸿祎现场演示
和ChatGPT、bing以及文心一言还有差距
360这次演示的产品有点像bing+GPT,360也是将AI大模型与360搜索结合在一起。
具体使用方法与bing类似,就是在搜索框输入问题,然后会给出AI大模型生成的答案。
相比独立的AI大模型产品,和搜索引擎结合后大模型的信息源会更新。
这次现场演示总共测试了7个问题,咱们先来看看360的输出结果,后面也将和ChatGPT、文心一言以及bing作对比。
1、周鸿祎为什么老爱穿红衣服?
360的答案还算OK,可以看到答案援引了新浪科技的报道。
笔者找到当时新浪科技的那篇报道,基本就是复制了当时的报道原文。
再来看看下面3位参赛选手的生成结果,从上到下依次是bing、ChatGPT、文心一言,后文排列顺序也是如此。
测试下来其实只有bing说出了基于事实的正确答案,而ChatGPT、文心一言则是开启了分析模式,虽然讲的头头是道,但却不是基于已有事实。
ChatGPT、文心一言的回答展示了AI大模型生成答案的通用模式,像是经过分析的理性答案。相比而言,360和bing都体现了与搜索引擎结合的优势,能够利用搜索引擎的海量数据。
2、周鸿祎为什么总爱聊GPT?
同样的,360还是大比例地复制了经济观察网的报道原文。
而其他3个产品的答案更有加工因素,不像360会复制新闻,另外ChatGPT、文心一言比较喜欢长篇大论的分析,bing则比较简短。但总体上看,3个回答都有一定的参考价值。
3、为什么要暂停训练GPT5?
上述问题是昨日的新闻热点,我们可以看到360其实也是大段引用了昨日的新闻报道,这再次体现了与搜索引擎结合的优势。
而ChatGPT、文心一言都没有给出准确回答,文心一言干脆摆烂,表示不清楚。ChatGPT则基于各种常识进行了一波分析,但如果抛开新闻本身来说,这些分析也有参考性。bing则再次和360一样,得出了正确答案,甚至还贴出了新闻的相关链接。
4、卡塔尔世界杯冠军是哪个国家?
这个问题比较简单,不需要进行太复杂的判断,其实考察了数据量的问题。360轻松回答正确。
但ChatGPT则因为数据库最新的是2021年9月,所以没有给出答案,文心一言和bing也都成功作答,所以百度的训练数据还是比ChatGPT新的。
5、孙悟空大战灭霸,谁会赢?
这个问题考察了AI的逻辑思考能力,这次360的回答就比较离谱。360认为孙悟空吊打灭霸,但理性判断的话,二者并没有可比性,况且答案的结论也没有给出让人信服的理由。
事实上,三言发现360的回答部分内容就直接复制了中国新闻社2019年的一篇文章。
而相比360的莽撞回答,另外3个回答就比较理性。bing和ChatGPT的回答如出一辙,均认为虚构角色没办法直接对比,结果取决于创作者的想象力。
文心一言则从技能、战术等角度去分析二者的能力。
6、梅西在阿根廷国家队进了多少球?
这个问题也是考察了对最新数据的收集和分析整理能力,不过这次360翻车了。
360回答了3次,都是100个球,但事实上梅西是102个球。而102球的数据是昨天才有的。
值得注意的是,一直表现不错的bing这次也翻车了,显示梅西共进了90个球。ChatGPT同样是因为数据更新只到2021年9月,所以没有最新数据,给了老数据。
不过,文心一言这次给出了正确答案。
7、会议临近结束时,领导说我再讲十分钟,意味着什么?
这考察AI的语意理解能力,不过一开始360表现并不好。经过几次尝试,才最终理解了“领导想要占用更多时间”意思。
而在这次挑战中,ChatGPT成功给出了正确答案,文心一言和bing都没有理解正确。
经过对比测试,能够看到360、bing和文心一言由于和搜索引擎挂钩,所以在信息的实效性上表现较好。
不过360更倾向于复制信息原文,加工程度相比其他3家较低。
在逻辑理解、语意理解等能力上,ChatGPT是表现最好的,尽管它有时给出的回答并不是基于事实信息,但它的回答有逻辑性,大多数情况下都有参考价值。
相比而言,360更倾向于搜索新闻,但是没有体现AI生成式大模型的智能型,答案不够个性化,加工程度低。
360生成式AI还是个“宝宝”
买了船票还没上船
在昨日演示中,周鸿祎表示,“GPT是场新工业革命,其意义超越了互联网、iPhone的发明。”未来每个行业、企业、个人都会拥有定制化GPT。在场景化、工程化、产品化、商业化方面中国拥有优势,有能力发展自己的人工智能大语言模型。但中国大语言模型距离GPT-4有两到三年时间差距,需要更多的宽容和耐心。
周鸿祎还提出了360的AI发展策略:“两翼齐飞”。具体就是先占领场景,再同步发力核心技术。
周鸿祎现场介绍了360大模型战略在ToC、ToSME、ToG&B方面的商业化场景落地计划。
在To C端,将推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品;在To SME端,将基于生成式大模型推出SaaS化垂直应用,如结合生成式AI的“苏打办公套件”和“企业即时通讯工具-推推”等,以解决中小微企业数字化转型难题;在To G&To B端,360已将核心数字安全能力融入安全AI模型,计划结合数字安全业务推出企业私有化AI服务,满足客户对私有知识、资产的索引需求。
周鸿祎还指出360发展大语言模型的三大优势:数据获取和清洗;人工知识训练;场景。
而事实上,我们看到无论是bing、文心一言的背后都有搜索巨头的支撑,360的优势它们也有,而且更加强悍。
其实对于搜索引擎和生成式AI的组合,优势很多都是共通的,关键还是要看算法和训练量。
目前来看,ChatGPT和bing无疑是投入最多的,借助ChatGPT的能力bing的下载剧增。
据Data.ai数据,新版微软必应2月发布后下载量跃升8倍,谷歌应用下载量下降2%;必应的页面访问量上升15.8%,谷歌的页面访问量降1%。
在国内,文心一言还处于内测阶段,对普通用户来说还很难接触到,但起码迈出了第一步。相比而言,360才刚刚买了船票,还不算正式上船。
作为国内搜索市场的一二号玩家,百度相比360有了先发优势,百度在AI上积累也有目共睹。
两家搜索巨头都还是在探索之中,相比而言百度略有优势,但距离成熟产品还有距离。
正如周鸿祎所说,“GPT还是一个宝宝”,不过中国GPT距世界的标准比国足短多了。
最近更新
-
任泽平不容易,群里发广告被警告,生发产品功效又被质疑
科技 · 06-01 23:16
-
不只戴威,趣店也进军海外了:在澳洲和欧美做快递和生鲜电商
科技 · 05-30 22:08
-
重启天涯直播:最高观看不到1000人,情怀难抵现实,关键是重启后怎么办?
科技 · 05-29 17:32
-
媒体争相报道的“Midjourney官方中文版”是假的?
科技 · 05-18 17:28
- 短线题材策略股池
- 业绩双降,多项业务问题频出,兴业银行的内控风险何解?
- 万达商管香港IPO新进展:证监会关注出租率准确性、短债风险等焦点问题
- 非经营性资金占用未及时披露,ST海越收警示函
- 现制酸奶距离喜茶,只差一个高端化?
- 苹果“天价”新品,“吓崩”供应链!
- 上市前,万达要先回答这些问题
- 6月6日市场资金流向
- 2023年5月中国酒店业发展报告
- 亿联银行被通报批评,曾在遭调查后否认“违规”
专栏推荐
-
军师点兵 浓缩机构研究精华,提前捕捉市场风口 1608人已购
¥258.00/月 -
排股掌内功心法 股市修炼有三大要素,即方法、选股、择时。 145人已购
¥399.00/月 -
尾盘擒牛之如何选股? 学完这些方法,告别选股难! 114人已购
¥288.00/月 -
财报拆解 知识点解读+实战案例,帮你5小时学会看财报 72人已购
¥19.90/月
推荐阅读
-
2023年中国艺术教育培训行业市场同比增长率规模预测将达到12.1%
-
造“风”的AIGC,“吹灭”了元宇宙?
-
苹果画的Vision Pro“大饼”,全球创业者抢着吃
-
毕业旅行+暑期游引爆旅游酒店板块,景区概念放量大涨
-
陌陌一季报:又见降本增效,营收同比下滑10.5%,净利反增18.4%
-
【组委会&发言人更新!】塑造极致体验,重启品牌增长——CRCX2023|第六届中国零售消费者体验峰会与您相约上海!
-
股份行复苏浪潮中,浦发银行、兴业银行掉队了
-
文心一言,讯飞星火,ChatGPT写高考作文,你给打多少分?
-
三次折戟,李彦宏电商梦难圆?
-
2023年5月中国酒店业发展报告
-
2023,数据库国产替代走到哪了?
-
猿辅导们的AI野望|教育硬件专题