简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 阿里云推出AI旗舰模型 称超越DeepSeek-V3

阿里云推出AI旗舰模型 称超越DeepSeek-V3

文章来源: 德国之声 于 2025-01-29 23:07:43 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数

中国科技巨头阿里巴巴旗下的阿里云周三发布“通义千问”旗舰版模型(Qwen2.5-Max)全新升级版,并声称该模型超越了备受推崇的DeepSeek-V3。

本周三(1月29日),阿里云通义千问旗舰版模型(Qwen 2.5-Max)正式发布。这一发布时间颇不寻常,恰逢中国农历新年,大多数中国人都在假期中与家人团聚。选在春节期间发布也反映出中国AI初创公司DeepSeek在过去三周的迅猛崛起不仅给海外竞争对手带来压力,也让国内同行压力倍增。

在其官方微信账号阿里云上发布的公告称,在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等六项基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。”

其中,GPT-4o来自OpenAI,DeepSeek-V3来自深度求索DeepSeek,而Llama-3.1-405B则是Meta推出的最先进开源AI模型。

DeepSeek崛起引发竞争对手加速模型升级

DeepSeek于1月10日发布的DeepSeek人工智能助手由 DeepSeek-V3 模型驱动,并在1月20日推出了R1模型,这一系列举措震惊硅谷,并导致多家科技公司股价下挫。DeepSeek据称研发和使用成本都很低,令投资者对美国头部AI企业的巨额支出计划产生了质疑。

与此同时,DeepSeek的成功也促使国内竞争对手加紧升级自己的AI模型。

DeepSeek-R1发布两日后,字节跳动(TikTok母公司)更新了其旗舰AI模型,并声称该模型在AIME测试中优于OpenAI(微软)的o1模型。AIME是一项衡量AI模型理解和响应复杂指令能力的基准测试。

无独有偶,DeepSeek此前在推出新模型时也是拿ChatGPT的o1模型做比,表示其R1模型在多个性能基准测试中可与o1媲美。

DeepSeek与国内竞争对手的较量

DeepSeek-V3模型的前身DeepSeek-V2,于去年5月发布后,在中国AI行业引发了一场价格战。

DeepSeek-V2的开源特性和极低的使用成本(每100万词元(token,AI模型处理的数据单位)仅1元人民币,约合0.14美元)迫使阿里巴巴云计算部门宣布对其一系列模型降价,最高降幅达97%。随后,其他中国科技公司也纷纷跟进,包括百度(2023年3月推出了中国首个类似ChatGPT的产品)以及中国市值最高的互联网公司腾讯(Tencent)。

DeepSeek创始人梁文峰在去年7月罕见接受中国媒体《浪潮》采访时表示,自己的这间初创公司“并不在乎”价格战,而是专注于实现通用人工智能(AGI)。

OpenAI将“通用人工智能”定义为“能够在大多数经济价值较高的任务领域超越人类的自主系统”。

与阿里巴巴等拥有数十万员工的中国科技巨头不同,DeepSeek更像是一个研究实验室,主要由中国顶尖大学的年轻毕业生和博士生组成。

梁文峰在采访中表示,他认为中国的大型科技公司可能并不适应AI行业的未来。他将这些巨头的高成本以及自上而下的管理模式,与DeepSeek精简的运营和宽松的管理风格进行了对比。“大型基础模型需要持续创新,而科技巨头的能力是有限的。”他说道。

查看评论(20)

24小时热点排行

印巴之战,让人大吃一惊的背后...
第一批混进老年徒步团的人,已经进骨科了
黄仁勋:如果英伟达无法进入中国,那华为...
微软130亿美金投资OpenAI打水漂?AI巨头渐行渐远
中又赢?巴基斯坦证实:使用J10战机击落印军“阵风”

24小时讨论排行

近代最大规模缠斗!125架战机激战1小时 38人丧命
散播假消息?印驳斥“巴击落军机”:拿旧照发文
习近平冒着无人机袭击的危险来到莫斯科
纽约时报:中国远远落后于美国的时代已经终结
川普对等关税第一国!美国与英国签署贸易协议
沈阳将举行纪念苏军“不朽军团”游行 中小学生也参加
纽约时报:习近平访俄为中国拉拢欧洲的努力蒙上阴影
中西医之争,到底是哪一个更厉害?
习近平告诉普京 面对“霸权骚扰”他与俄罗斯站在一起
快讯!梵蒂冈冒白烟 新教皇当选
不减息!川普发文大骂鲍威尔:蠢材 什么都不懂
中国同意与美国谈判,但仍可能坚持强硬立场
印度空袭巴基斯坦后巴方报复是否无可避免?
“没人告诉我!”新移民买车加错柴油 退车被拒引热议
印度称摧毁巴防空系统 遭嘲讽:派几架阵风来查看
“超国民待遇”! 110北京医学部外籍生48个来自非洲
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

文学城新闻
切换到网页版

阿里云推出AI旗舰模型 称超越DeepSeek-V3

德国之声 2025-01-29 23:07:43

中国科技巨头阿里巴巴旗下的阿里云周三发布“通义千问”旗舰版模型(Qwen2.5-Max)全新升级版,并声称该模型超越了备受推崇的DeepSeek-V3。

本周三(1月29日),阿里云通义千问旗舰版模型(Qwen 2.5-Max)正式发布。这一发布时间颇不寻常,恰逢中国农历新年,大多数中国人都在假期中与家人团聚。选在春节期间发布也反映出中国AI初创公司DeepSeek在过去三周的迅猛崛起不仅给海外竞争对手带来压力,也让国内同行压力倍增。

在其官方微信账号阿里云上发布的公告称,在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等六项基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。”

其中,GPT-4o来自OpenAI,DeepSeek-V3来自深度求索DeepSeek,而Llama-3.1-405B则是Meta推出的最先进开源AI模型。

DeepSeek崛起引发竞争对手加速模型升级

DeepSeek于1月10日发布的DeepSeek人工智能助手由 DeepSeek-V3 模型驱动,并在1月20日推出了R1模型,这一系列举措震惊硅谷,并导致多家科技公司股价下挫。DeepSeek据称研发和使用成本都很低,令投资者对美国头部AI企业的巨额支出计划产生了质疑。

与此同时,DeepSeek的成功也促使国内竞争对手加紧升级自己的AI模型。

DeepSeek-R1发布两日后,字节跳动(TikTok母公司)更新了其旗舰AI模型,并声称该模型在AIME测试中优于OpenAI(微软)的o1模型。AIME是一项衡量AI模型理解和响应复杂指令能力的基准测试。

无独有偶,DeepSeek此前在推出新模型时也是拿ChatGPT的o1模型做比,表示其R1模型在多个性能基准测试中可与o1媲美。

DeepSeek与国内竞争对手的较量

DeepSeek-V3模型的前身DeepSeek-V2,于去年5月发布后,在中国AI行业引发了一场价格战。

DeepSeek-V2的开源特性和极低的使用成本(每100万词元(token,AI模型处理的数据单位)仅1元人民币,约合0.14美元)迫使阿里巴巴云计算部门宣布对其一系列模型降价,最高降幅达97%。随后,其他中国科技公司也纷纷跟进,包括百度(2023年3月推出了中国首个类似ChatGPT的产品)以及中国市值最高的互联网公司腾讯(Tencent)。

DeepSeek创始人梁文峰在去年7月罕见接受中国媒体《浪潮》采访时表示,自己的这间初创公司“并不在乎”价格战,而是专注于实现通用人工智能(AGI)。

OpenAI将“通用人工智能”定义为“能够在大多数经济价值较高的任务领域超越人类的自主系统”。

与阿里巴巴等拥有数十万员工的中国科技巨头不同,DeepSeek更像是一个研究实验室,主要由中国顶尖大学的年轻毕业生和博士生组成。

梁文峰在采访中表示,他认为中国的大型科技公司可能并不适应AI行业的未来。他将这些巨头的高成本以及自上而下的管理模式,与DeepSeek精简的运营和宽松的管理风格进行了对比。“大型基础模型需要持续创新,而科技巨头的能力是有限的。”他说道。