• 开云·kaiyun体育(中国)官方网站 登录入口

开yun体育网培养了大齐技艺东谈主才-开云·kaiyun体育(中国)官方网站 登录入口

发布日期:2026-04-08 14:37    点击次数:102

DeepSeek如同梁文峰参加到AI圈的一颗深水炸弹,它掀翻的巨浪依然在澎湃之中。受DeepSeek挑战,2月13日文书,将于4月1日零时起,全面免费,统共PC端和App端用户均可体验文心系列最新模子。同期开yun体育网,即日起,文心一言上线深度搜索功能,该功能也将于4月1日起免费怒放使用。现时,用户可在文心一言官网上体验深度搜索功能,APP端也行将同步上线。 (图源:百度公众号) 此前,算作国内最早布局AI大模子的企业,百度旗下的文小言(即原文心一言App)还接入了DeepSeek-R1大模

  • 开yun体育网培养了大齐技艺东谈主才-开云·kaiyun体育(中国)官方网站 登录入口

    DeepSeek如同梁文峰参加到AI圈的一颗深水炸弹,它掀翻的巨浪依然在澎湃之中。受DeepSeek挑战,2月13日文书,将于4月1日零时起,全面免费,统共PC端和App端用户均可体验文心系列最新模子。同期开yun体育网,即日起,文心一言上线深度搜索功能,该功能也将于4月1日起免费怒放使用。现时,用户可在文心一言官网上体验深度搜索功能,APP端也行将同步上线。

    (图源:百度公众号)

    此前,算作国内最早布局AI大模子的企业,百度旗下的文小言(即原文心一言App)还接入了DeepSeek-R1大模子。

    在iOS平台,文小言App已更新至4.9.0版块,更新日记披露,该版块上线伴学格式、手抄报和作文等学习类功能,且接入DeepSeek-R1模子,优化拍照解题功能。

    (图源:App Store截图)

    文心一言免费、接入DeepSeek……百度的举措让不少网友吐槽,其AI技艺“曾经掉队了,竟然要为我方的AI器用接入其他企业的大模子。”

    在AI鸿沟,百度的地位号称黄埔军校,培养了大齐技艺东谈主才。文心一言曾经是国内AI大模子鸿沟的领头羊,文心3.5便对标GPT-3.5,如今文心4.0、文心4.0器用版、文心4.0 Turbo三款大模子更是在豆包、Kimi、通义千问等宽广AI大模子免费提供就业的大环境下,顽强领受收费就业格式,优惠时间一语气包月用度高达43.9元/月(原价59.9元/月),可见百度的自信。

    若磋磨百度在AI鸿沟是否确切掉队,最浅薄径直的方法即是将文心一言与其他AI大模子进行对比。因此,小雷决定将文心一言最强的文心4.0 Turbo和最近大火的DeepSeek-R1进行对比,不雅察文心4.0 Turbo的实力,部分问题还会用其他AI大模子进行测试,并在文中算作参考。

    文心一言、DeepSeek大决战:不分仲伯

    本次对比测试,小雷不再用AI大模子生成翰墨或转头内容,而是以测试推理材干为起点,名目共分为误导题、逻辑推理题、数学推理题三个部分。

    1、误导题:DeepSeek-R1后发先至。

    AI大模子爆火之后,用户们就发现其广阔存在一个问题,即莫得谜底的问题AI也会虚拟一个谜底。AI大模子已屡次迭代的今天,小雷十分介意,AI还会虚拟谜底吗?

    第一题,小雷向AI大模子发问“心肌干细胞有什么作用”。心肌干细胞(cKit+心肌成体干细胞)作秀是学术圈有史以来最大的丑闻,以好意思国为主的群宽广个研究机构、大学、病院深陷其中,大齐论文被动下架。面前科学界已基本实现共鸣,心肌干细胞并不存在。

    但是AI似乎并不这样合计,文心4.0 Turbo给出的回应是,心肌干细胞领有缔造与再生心肌细胞、促进血管重生、抗炎和免疫调遣、迂腐腹黑缺少等作用。不仅仅文心一言,豆包、Kimi、ChatGPT等国表里AI大模子,全部齐给出了心肌干细胞的作用。小雷还挑升检察了文心4.0 Turbo提供了9条参考信息,发现齐是半年内AI生成的信息。

    (图源:文心4.0 Turbo截图)

    基于往日失误的论文,在东谈主为烦闷的情况下,AI输出了失误的信息。此后其他AI大模子又字据失误的信息,握住虚拟失误的信息,这种情况或将成为畴昔闭塞AI技艺发展的要道因素。

    不外在该项测试中,DeepSeek-R1却给出了一鸣惊人的谜底,该大模子生成的内容披露,心肌干细胞表面上领有潜在作用,但研究存在争议。尽管DeepSeek-R1的回应仍有为心肌干细胞辩驳的因素,但至少曾经跳出了问题自己,能够去分析心肌干细胞是否存在。

    (图源:DeepSeek-R1截图)

    其实径直发问“心肌干细胞是否存在”,大多数AI大模子会给出存在和不存在两边的不雅点和例证,并加以分析。而向AI究诘心肌干细胞的作用时,AI则广阔依然会出现虚拟谜底的情况。在第一轮测试中,能够率先跳出问题自己,去能干了解心肌干细胞的DeepSeek-R1得到了告捷。

    2、逻辑推理:文心一言DeepSeek瓜分秋色。

    能否诈欺题目中的信息,去推导出正确谜底,相通是困扰AI大模子的难点。本轮测试中,小雷选择了整个悬疑逻辑推理问题:

    一位画家被发现死在一间老旧的画室中,温顺来去木质量板齐发出吱吱声。画家死在画板前,正画着自画像,是被东谈主从背后用匕首刺杀。手上仍合手着画笔,警方锁定了2名嫌疑东谈主。一位是画家的一又友,但欠下画家巨款。一位是曾屡次出当今隔邻的流氓,有入室抢掠的前科。是谁刺杀了画家?(正确谜底:画家的一又友)

    本轮测试文心4.0 Turbo和DeepSeek-R1打成平手,两边字据题目说起的陈迹,平分析出了画家的一又友才是杀害画家的真凶。

    这谈题并不难,讨论以上陈迹,东谈主类其实很容易分析出画家的一又友才是真凶的谜底。但是当小雷用其他豆包、Kimi、文心3.5、通义千问、7B参数的DeepSeek-R1等大模子推理该题时却发现,只消豆包给出了正确谜底,其他几款大模子全部给出了失误谜底。最离谱的是Kimi,推理经过中一直在强调画家的一又友嫌疑更大,但最终谜底却是隔邻的流氓。

    (图源:Kimi截图)

    本轮测试中,文心4.0 Turbo和DeepSeek-R1打成平手,齐顺利推理出了正确谜底,而况相较其他AI大模子,贯通也愈加出色。

    3、数学推理:DeepSeek败下阵来。

    能否快速、正确解答出数学题,一直是考证AI大模子是否领有着实推理材干的迫切测试名目。该智商小雷选择了整个概率相干的数学题:

    一架飞机上有一百个座位,编号是从1到100。当今编号为1到100的乘客按序坐上飞机。编号为1的乘客上了飞机之后,飞快(等概率地)坐座位。编号为2的乘客上了飞机之后,他先看有莫得东谈主坐在2号位上,如果有,那他就在剩下的位子里飞快(等概率地)挑选一个,如果莫得东谈主坐,他就坐在2号位上。3号亦然一样,如果前边有东谈主曾经坐了3号位了,他就在剩下的位子上温顺挑一个坐,反之则坐我方的位子。依此类推,临了问题是,第100个东谈主坐在第100号位子上的概率应该是若干。(正确谜底:1/2)

    这谈题相通存在大齐误导信息,若能正确相接题目,其实很是浅薄。在本轮测试中,文心4.0 Turbo、DeepSeek-R1、通义千问、豆包、Kimi等大模子,全部回应出了正确谜底。

    真谛真谛的是,即便靠近如斯浅薄的问题,依然有一个大模子回应失误,那即是文心3.5。在一番狡计之后,文心3.5竟然给出了概率为99/100的离谱谜底。

    (图源:文心3.5)

    接头到上整个题目难度不高,小雷决定再加入整个附加题:

    甲、乙两东谈主各有四张卡片,每张卡片上标有一个数字,甲的卡片上分袂标罕有字1,3,5,7,乙的卡片上分袂标罕有字2,4,6,8,两东谈主进行四轮比赛,在每轮比赛中,两东谈主各自从我方持有的卡片中飞快选一张,并相比所选卡片上数字的大小,数字大的东谈主得1分,数字小的东谈主得0分,然后各自弃置此轮所选的卡片弃置的卡片在此后轮次中不可使用则四轮比赛后,甲的总得分不小于2的概率为?(正确谜底:1/2)

    这谈题小雷此前曾测试过,豆包、通义千问、Kimi、文心3.5等大模子全部未能解出正确谜底。本轮测试中,豆包、通义千问、Kimi、文心3.5再次回应失误,但唯独回应正确的大模子并不是DeepSeek-R1。

    DeepSeek-R1推理这谈题耗时足足728秒,最终给出的谜底却是13/24,跨越12分钟的推理时候齐没能给出正确谜底,令小雷有些失望。

    (图源:DeepSeek-R1截图)

    不被小雷看好的文心4.0 Turbo,竟然用时不到两分钟,就狡计出了正确谜底。确信不啻小雷,绝大多数网友齐莫得料想效果会是这样。

    (图源:文心4.0 Turbo截图)

    近期知乎鄙俚给小雷推送问题“DeepSeek对文心一言有什么影响”,辩驳区简直清一色挑剔文心一言。但是本次评测却确认,文心一言在推理方面并不过期DeepSeek-R1,依然稳居AI大模子第一梯队。

    在材干不输DeepSeek-R1,部分测试贯通起始豆包、Kimi、通义千问等AI大模子的情况下,文心一言的口碑却并不睬想。怎么编削这一场合,值得百度深想。

    百度“掀桌子”,文心一言能否逆天改命?

    在与DeepSeek-R1对比测试之前,小雷本以为文心4.0 Turbo会输,本体效果却打了小雷的脸,这两款大模子在不同鸿沟互有上风,但材干差距不大。文心一言之是以给小雷留住了贯通不行的印象,是因为小雷平素使用文心一言时,总会选择免费的文心3.5大模子。

    通过以上实测不难发现,文心4.0 Turbo与文心3.5的材干号称云泥之别,三谈推理题文心4.0 Turbo全部回应正确,而且推理任务所需时候极短,文心3.5却全部回应失误。

    不是用户不肯意用更弘大的文心4.0 Turbo,而是昂贵的用度为文心4.0、文心4.0器用版、文心4.0 Turbo筑起了高高的门槛,遏抑用户体验它。如若在国外阛阓,43.9元/月的用度对比20好意思元/月起步的ChatGPT-GPT并不算贵,但在国内阛阓,豆包、Kimi、DeepSeek、通义千问等AI大模子均免费提供就业,用户未免更倾向使用它们。

    (图源:雷科技摄制)

    百度急于收成的心态小雷不错相接,毕竟诱导AI大模子的现实本钱和提供就业的推理本钱齐不低,现阶段统共企业的AI大模子业务齐在圆寂。可AI行业仍处于阛阓开拓阶段,其他企业齐在通过免费提供就业争夺用户,百度却先一步开启收费格式,将大齐潜在用户拒之门外。

    酒香也怕胡同深。2月13日,百度文书文心一言将在4月1日透顶免费,这是裁汰AI门槛、招引大齐用户的最好决策。百度这一举措跟比亚迪将高阶智驾标配到全系车型可视归拢律,齐是鼓舞AI普惠的举措。

    短期的圆寂难以幸免,怎么让用户造成对文心一言的依赖,才是百度需要接头的紧要问题。承受一段时候的圆寂,换来的可能是畴昔成为AI行业的指令者,并赚更多钱的契机。就跟比亚迪用“掀桌子”的技能,力求不才半场成为智驾指令者一样。

    算作一个国民级AI器用,免费并遏抑易,文心一言莫得在2月13日径直免费,而是将时候推迟到4月1日,简略百度还有大齐的职责要作念。

    简直是归拢时候,OpenAI也文书免费版ChatGPT在方法智能竖立下将不错无尽度使用GPT-5,尽管未能如百度一般十足免费,但也能看到OpenAI的败北。跟着文心一言和GPT-5方法智能格式免费怒放,整个AI大模子鸿沟的竞争也将迈入新阶段,DeepSeek的性价比上风也将很难不绝。当今,压力似乎正在回荡到DeepSeek这一边。



相关资讯