搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
AI学习
›
ChatGPT
›
资讯
›
百度文心一言发布,我们拿到内测账号试了试,效果出乎意 ...
0
0
1
分享
百度文心一言发布,我们拿到内测账号试了试,效果出乎意料
nettman
2023-3-16 21:22:02
发表于
资讯
[显示全部楼层]
只看大图
阅读模式
关闭右栏
0
1207
About云VIP帮助找工作和提升
本帖最后由 阿飞 于 2023-3-17 09:16 编辑
微软 Bing 集成了爆火的 ChatGPT 后,人们对新一代的搜索引擎非常非常期待,知危编辑部当时还拿到了最早一批的测试资格,效果非常惊艳。
Bing 的惊艳,让中国最大的搜索引擎百度压力陡增。
百度火速宣布其将在 3 月推出自己的生成式对话产品 “ 文心一言 ”,截现在,已有 650 家机构宣布它们将接入文心一言的能力,但我们始终不能知道百度的文心一言效果如何。
今天,它终于被发布了。
发布会相信大家已经都看了,在此不赘述,知危编辑部想办法拿到了文心一言的内测账号,直接带大家体验一下。
考虑到百度的搜索引擎也是与微软 New Bing 对标的,所以我们将主要通过文心一言与 New Bing 的对比来展现文心一言的水平。
首先,对于文心一言的表现,我们先给出一个结论:
知危编辑部认为,与预期相比,百度文心一言做的还不错。虽然与搭载 Chat GPT 的 Bing 稍微有一些差距,但差距不是特别大,甚至某些问题的表现上,文心一言是强于 Bing 的。
下面,我们正式开始。
首先,知危编辑部提出了一个比较日常的问题:
如何做一份好吃的松鼠桂鱼?
文心一言的回答是:
New Bing 的回答是:
我们可以明显看到百度文心一言的回答要更为优质,它给出的备料更详细、制作方法也更详细,并且还强调了注意事项。
随后,我们又问了一个比较经典的带有思维陷阱数学问题:
一个青蛙掉到了一个10米深的井里,它每天晚上向上跳3米但会滑下来2米,请问他第几天能跳出井里?
文心一言的回答是:
New Bing 的回答是:
从这个问题的表现来看,百度文心一言明显是比 Bing要聪明的,思路清晰,解决方法合理。
随后,我们问了一个代码问题:
写一个渐变色按钮的 CSS
百度文心一言的回答是:
New Bing 给出的回答是:
我们咨询了程序员,程序员表示两家给的答案都一般,但也都没什么大问题,但做出来的东西都比较丑。( 或许给更多限制性词语答案可以优化,时间紧张我们没有进行更深度的测试 )
我们又提问了 AE 特效中的问题:
写一个AE色块跳动的表达式
百度文心一言的回答是:
New Bing 给出的回答是:
在这个问题的表现上,文心一言是弱于 Bing 的,它答非所问,没有理解 “ AE 表达式 ” 的意思。
在需要信息搜索的问题上,我们也进行了提问:
理想汽车过去五个月销量,请逐月列出
文心一言的答案是:
Bing 的回答是:
在这个问题中,文心一言的回答也是比 Bing 要差,他似乎抓取了错误的数据源。不过,中肯地讲,文心一言理解了这个问题、展现形式没有错,数据源的问题是可以被优化的,说不上是差。
随后,我们又问了市场分析的问题:
分析一下为什么最近一段时间理想汽车卖的比蔚来汽车要好?
文心一言的回答是:
Bing 的回答是:
在这个问题的表现上,文心一言给出了相对笼统的回答,含金量不是特别高但是可以看。而 Bing 虽然引经据典列了一堆东西,但在 “ 产品阵容 ” 和 “ 产品创新 ” 这两块甚至是暗含 “ 蔚来比理想强 ” 这个意思的,这与问题的题设有偏差。
所以在这个问题上,文心一言和 Bing 的表现都一般,但文心一言似乎是稍好一点的。
我们继续问了另一个产业分析问题:
关于最近一次特斯拉投资者大会上 “ 实现全球可持续能源 ” 的计划,你觉得是可行的吗?为什么可行?
文心一言的回答是:
Bing 的回答是:
在这个问题上,文心一言的回答表现较差给出了一些车轱辘话,并且还有事实错误, “ 赞助热门综艺节目、冠名品牌活动 ” 是在胡说。
这个现象的产生可能与上面 “ 理想汽车销量 ” 问题相似,文心一言没有很好地抓取到网络上的有用信息并分析,有待提高。
好了,知危编辑部对文心一言的测试差不多就这些,我们认为,文心一言的表现比大家预期中的似乎要好。
中肯地讲,文心一言与 Bing 有一定差距,但差距没有大到离谱,甚至某些问题的表现比 Bing 要强。
在中文互联网上,提到百度,人们都是讥讽居多,甚至昨天 GPT-4 推出时,已经有表情包出来调侃文心一言了。
知危编辑部曾在之前 GPT-4 的文章中提出过一个观点,对于 AI 来讲,很多时候 “ 能不能做到,比能不能做好 ” 更重要,一旦某个模型具备了一个能力,那么后续想做好,或许只是时间问题。
一口吃不成胖子,各位稍安勿躁,给百度留一些时间吧。
私密交流圈
原文链接
https://mp.weixin.qq.com/s/fYzjcR8UuFQkxiB8ieOE4g
加微信w3aboutyun,可拉入技术爱好者群
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
没找到任何评论,期待你打破沉寂
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
nettman
超级版主
关注
2849
主题
3142
帖子
477
粉丝
TA的主题
利用简历在面试中“带节奏”
2024-3-12
百度内核数据研发一面凉经
2024-3-11
大数据工程师面试 - 字节跳动 Spark 面试考点!
2024-3-11
数据开发 - 面经 - 来未来(医疗大数据)
2024-3-11
2024求职:慎填面试登记表
2024-3-5
24小时热文
从InfluxDB看时序数据的处理
哈佛通识教育红皮书 (北大高等教育文库·大
华为:HBase常见问题维护手册V1.0
字节三面过程,最终还是凉了
2024年求职攻略:掌握这4个习惯,迅速斩获
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈