3 月 16 日下午 2
点,百度北京总部的发布厅内,李彦宏迈着急促的步伐走上台,和大家公布了最近一段时间备受关注的产品——文心一言。
尽管这位科技巨头创始人,登过《时代》周刊封面,见过无数大场面,但发布会中,他的神态里都透露了些许紧张和局促。
有人满怀期待,但也有很多人,只是单纯想看它出丑。
会上,百度共在 5 个场景下,展示了文心一言的能力。
在文学创作方面,文心一言可以总结出《三体》内容,也可以在哲学角度续写《三体》。
在商业文案创作这块,它可以根据公司的业务类型取名,生成 Slogan ,以及撰写几百字的新闻稿。
同时,它也可以做一些数理逻辑推算,比如鸡兔同笼,还可以判断出题目错了。
除此之外,文心一言可以给用户反馈图像,语音和视频。
比如它可以为 2023
世界智能交通大会创作一张海报,也能用四川话回答你的问题,甚至是生成视频。不过,想实现这些功能其实并不难,百度做的也许就是把这几项服务融合了一下。
可惜的是,发布会上所有素材都事先录好的,并非现场实操,所以对于文心一言的真实能力,很多人都表示怀疑。
我们先测试了一些日常问题:如何做一份好吃的松鼠桂鱼?
这是文心一言的回答。
这是 New Bing 的回答。
虽然我们没有时间测出谁的菜谱味道更好,但能看出百度文心一言的回答要优质一些。它按照标准的菜谱格式,分别给出了备料,步骤以及注意事项。
随后,我们又问了一个经典的带有思维陷阱数学问题:一个青蛙掉到了一个 10米深的井里,它每天晚上向上跳 3 米但会滑下来 2
米,请问他第几天能跳出井里?
文心一言的回答是 8 天,这是正确答案。
而 New Bing 的回答是 5 天。
但 New Bing 一共有三种模式,在切换了精确模式后,New Bing 也给出了正确回答。
接着,我们测试了大家比较关心的敲代码能力,让它们帮忙写了一个渐变色按钮的 CSS 。
这是文心一言给的代码。
在实测后发现可以跑出来,但它把“渐变色”理解成了鼠标指上去后,颜色发生变化。
而 New Bing 给出的代码显示,它成功理解了渐变色。
后来,我们又测试了取名, New Bing 给的是:麻晨曦、麻晴雯、麻璇玑、麻云舒,似乎挺有新意。
但文心一言的建议,说实话,我一眼就觉得好像在“中国新生儿最热姓名”里看过。。。
随后,我又提了一些节选自弱智吧的问题,测试下他们的“智商”。
比如:把加特林从冰箱拿出来算冷兵器吗?
两者都讲解了什么是冷兵器后,给出了正确答案:不是。
我们又接着问了另外一个问题“为什么贝多芬不出新歌了?”
New Bing 在简单介绍后,回答因为已经去世 200年了。
但文心一言似乎陷入了圈套,分析了一堆可能导致贝多芬不出歌的原因。。。
当然,测试 AI 智商肯定离不开数学题:请用 1 , 2 , 3 , 4 四个数字计算 24 点,每个数字只能用一次。
后来我们又测试了一下,虽然这次不烧了,但不知道它在回答什么东西。
这是 New Bing 的回答。
接着对于中文互联网黑话的理解能力,我们也测试了一下,但让人失望的是,这方面文心一言表现还不如 New Bing 。
比如鸡你太美的梗,它并没给出一个满意的答复。
而 New Bing 的回答,虽然也有错误,但起码比文心一言更接近答案。
对于差评 925 的梗,文心一言可能因为训练语料的原因,没给到我们想要的答案,而是放出了一个非常古老的谐音梗。
New Bing 则近乎完美解释了我们 925 的梗。
在信息搜索的问题上,我们也进行了提问:理想汽车过去五个月销量,请逐月列出。
文心一言的答案是:
New Bing 的回答是:
最后,我们测试了文心一言独有的画图能力。
我们先让它生成一只刺猬在敲键盘的图片,这个效果算挺不错的。
但在让它生成了一只小马拉大车的图片后,我们显然是高兴早了,这 TM 是真马车啊。。。
OK ,以上就是给大家做的文心一言测试。
其实这段时间,互联网上大家对文心一言都带着点嘲讽的味道,前两天,微信群里就流传着一个嘲讽表情包。
甚至还有聊天记录形式的段子,说一旦文心无法正确答复,要用员工顶上。( 明显是假的 )
发布会直播间里,质疑和嘲讽的弹幕也随处可见。
的确,对比New Bing来说,文心一言表现是挺一般,不少方面甚至可以用“拉”来形容。
百度自己也知道,文心一言还差了不少火候。
在测试中,它就像个不自信的小孩。不管答案怎样,只要你一否认,他就一边向你承认错误,一边保证自己会变得更好,给他点时间。
说句实在话,差评君觉得这次百度,可以说是勇气可嘉。
一方面,虽然大厂们都在说自己搞了类似的东西,但是在 ChatGPT
如日中天的这会儿,百度还是敢顶住压力,发布了文心一言。
而且,作为一家搞搜索引擎的,文心一言也很可能会颠覆自己的核心业务。毕竟咱们之前也和大家聊过,传统的搜索引擎与其广告模式,很可能会被类似的产品干掉。
百度这波啊,多少是有股激流勇进的味道。
体验完这波产品,我觉得百度最应该做的,还是尽快迭代,抓紧时间把用户体验拉上来。不然就现在这个状态,别说是 GPT-4 和 New
Bing 了,摆到 GPT-3.5 面前,还是有待增强。
至于咱们,也可以耐心一点,给这个初出茅庐的、不自信的小孩多一点时间。
万一哪天,它突然就把事干成了呢?
-->
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_rightside": {
"html":`
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_duturandom": {
"html":`
`,
"script":[]
}
, "gg_square": {
"html":`
`,
"script":[]
}
, "gg_topbanner": {
"html":`
`,
"script":[]
}
, "gg_middlesquare": {
"html":`
`,
"script":[]
}
, "gg_dutu": {
"html":`
`,
"script":[]
}
, "gg_botline": {
"html":``,
"script":[]
}
, "gg_dututop": {
"html":`
`,
"script":[]
}
, "gg_shipintop": {
"html":`
`,
"script":[]
}
, "gg_inContent": {
"html":`
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_inContentBot": {
"html":`
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_shipinrandom": {
"html":``,
"script":[]
}
, "gg_sideSticky": {
"html":`
`,
"script":[]
}
, "gg_bottombanner": {
"html":`
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_marquee": {
"html":`
`,
"script":[]
}
}
const adEnv={
"gg_header": {
"html":``,
"script":[{"exec":`(function(){/*
Copyright The Closure Library Authors.
SPDX-License-Identifier: Apache-2.0
*/
'use strict';var g=function(a){var b=0;return function(){return b
=b||null!=a.a&&0!=a.a.offsetHeight&&0!=a.a.offsetWidth||(fa(a),D(a),l.setTimeout(function(){return E(a,b-1)},50))},fa=function(a){var b=a.c;var c="undefined"!=typeof Symbol&&Symbol.iterator&&b[Symbol.iterator];b=c?c.call(b):{next:g(b)};for(c=b.next();!c.done;c=b.next())(c=c.value)&&c.parentNode&&c.parentNode.removeChild(c);a.c=[];(b=a.a)&&b.parentNode&&b.parentNode.removeChild(b);a.a=null};var ia=function(a,b,c,d,e){var f=ha(c),k=function(n){n.appendChild(f);l.setTimeout(function(){f?(0!==f.offsetHeight&&0!==f.offsetWidth?b():a(),f.parentNode&&f.parentNode.removeChild(f)):a()},d)},h=function(n){document.body?k(document.body):0e;e++){var f=c.concat(d[e].split(""));K[e]=f;for(var k=0;k>2;n=(n&
3)<<4|t>>4;t=(t&15)<<2|h>>6;h&=63;f||(h=64,e||(t=64));c.push(b[k],b[n],b[t]||"",b[h]||"")}return c.join("")};try{return JSON.stringify(this.a&&this.a,S)}finally{Uint8Array.prototype.toJSON=a}}:function(){return JSON.stringify(this.a&&this.a,S)};var S=function(a,b){return"number"!==typeof b||!isNaN(b)&&Infinity!==b&&-Infinity!==b?b:String(b)};M.prototype.toString=function(){return this.a.toString()};var T=function(a){O(this,a)};u(T,M);var U=function(a){O(this,a)};u(U,M);var ja=function(a,b){this.c=new B(a);var c=R(b,T,5);c=new y(w,Q(c,4)||"");this.b=new ea(a,c,Q(b,4));this.a=b},ka=function(a,b,c,d){b=new T(b?JSON.parse(b):null);b=new y(w,Q(b,4)||"");C(a.c,b,3,!1,c,function(){ia(function(){F(a.b);d(!1)},function(){d(!0)},Q(a.a,2),Q(a.a,3),Q(a.a,1))})};var la=function(a,b){V(a,"internal_api_load_with_sb",function(c,d,e){ka(b,c,d,e)});V(a,"internal_api_sb",function(){F(b.b)})},V=function(a,b,c){a=l.btoa(a+b);v(a,c)},W=function(a,b,c){for(var d=[],e=2;ec?0:c}else c=-1;0!=c&&(W(a.b,"internal_api_sb"),Z(a,Q(a.a,6)))},function(c){Z(a,c?Q(a.a,4):Q(a.a,5))})},Z=function(a,b){a.c||(a.c=!0,a=new l.XMLHttpRequest,a.open("GET",b,!0),a.send())};(function(a,b){l[a]=function(c){for(var d=[],e=0;e0}catch(o){}return!1})()&&(n=o[t].pubads())&&n.setTargeting("admiral-engaged","true")}(c=o[t]=o[t]||{}).cmd=c.cmd||[],typeof c.pubads===n?e():typeof c.cmd.unshift===n?c.cmd.unshift(e):c.cmd.push(e)})(window,"googletag","function");})(window,String.fromCharCode(97,100,109,105,114,97,108));!(function(t,n,c,i,o,a,r){!(function e(f,u,$,s){u=n.createElement(i),$=n.getElementsByTagName(i)[0],s=$.parentNode,u.async=1,u.src=f,u[o]&&u[o]("error",(function(i){s.removeChild(u),t++,i&&!i.isTrusted||t>2?(function(t,i,o){if(new(function(){t=(function h(e,t,r,n){if(!e||function e(r,n,i,o){for(o=0;r&&o0&&(r[o+1]||[]).unshift(i),i=(n=t[r[o]])&&n(e,r[o+1]||[]);return i}(e))return r.apply(this,n||[])}([0,[[[1,[[2,[[[4,["admbenefits"],3,[""]]]]]]]]]],[function c(e,t){for(var r=t[0]&&t[0].length>0,n=0;r&&n.bOvWNQ{all:initial;position:fixed;top:0;right:0;bottom:0;left:0;font-family:'Source Sans Pro',Arial,'Helvetica';overflow:auto;background-color:rgba(255,255,255,1);z-index:2147483647;}.ghwPHX{width:100%;height:100%;max-width:740px;margin:0 auto;position:relative;padding-top:0;}.duogaR{box-sizing:border-box;display:-webkit-box;display:-webkit-flex;display:-ms-flexbox;display:flex;-webkit-flex-direction:column;-ms-flex-direction:column;flex-direction:column;-webkit-align-items:flex-start;-webkit-box-align:flex-start;-ms-flex-align:flex-start;align-items:flex-start;-webkit-box-pack:center;-webkit-justify-content:center;-ms-flex-pack:center;justify-content:center;width:100%;margin:0 auto;height:100%;}.dzMDQR{display:inline-block;max-width:700px;width:100%;}.ingAWB{position:fixed;bottom:0;height:40px;width:100%;text-align:center;line-height:40px;font-size:13px;color:rgba(153,153,153,1);background-color:rgba(153,153,153,0.4);}.dfmDjJ{height:15px;vertical-align:middle;}.fWGjBK{text-align:left;box-sizing:border-box;margin:0 0 5px;font-size:24px;line-height:28px;font-weight:500;color:rgba(59,71,107,1);}.gXNCk{box-sizing:border-box;text-align:left;margin-bottom:15px;font-size:14px;line-height:22px;font-weight:400;color:rgba(59,71,107,1);}.cPOkjL{display:inline-block;margin-right:5px;line-height:40px;}.fKMnlC{-webkit-text-decoration:none;text-decoration:none;color:rgba(153,153,153,1);}.jPErAw{width:100%;height:33px;cursor:pointer;color:rgba(255,255,255,1);background-color:rgba(73,167,204,1);border:none;border-radius:3px;font-weight:700;margin-bottom:24px;}.kwsoEU{cursor:pointer;background-color:rgba(255,255,255,1);color:rgba(237,76,81,1);border:none;font-weight:700;}