简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 中国AI“刷屏”硅谷 性能比肩OpenAI 成本仅1/30

中国AI“刷屏”硅谷 性能比肩OpenAI 成本仅1/30

文章来源: 联合早报 于 2025-01-26 09:50:41 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数


仅相隔两个月,中国初创公司DeepSeek(深度求索)再度发布廉价大模型,其性能可比肩美国OpenAI最新模型。

综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,DeepSeek去年12月发布免费语言大模型DeepSeek V3,并称在两个月内花费558万美元完成训练该模型,所需时间和费用仅硅谷竞争对手的十分之一。

中国对冲基金幻方量化旗下的子公司DeepSeek星期一(1月20日)发布推理模型DeepSeek-R1,在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。

据美国消费者新闻与商业频道(CNBC)报道,美国微软行政总裁纳德拉(Satya Nadella)星期三(1月22日)在达沃斯世界经济论坛上说,DeepSeek的新模型令人印象深刻,不仅因为他们有效地构建一个开源模型,还因为它的推理计算效率极高。“我们应该非常严肃地看待中国人工智能(AI)的发展”。

除测试表现优于o1外,R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称,开源开放指的是,让用户参与二次开发,可更改演算法。虽然可自由重複使用,但R1的开源开放程度仍受限,因为训练数据尚未公开。

《每日经济新闻》引述DeepSeek发布的技术报告称,R1的训练成本是o1的三十分之一。《自然》周刊报道称,R1给用户开出低廉的使用方案,是o1的三十分之一。

让西方科技界讚歎的是,DeepSeek在受美国限制先进科技输华的背景下,依然开发出新颖模型。

“生命科学”报道称,美国限制向中企出口先进AI计算芯片,迫使R1研发者採用更智能和有效的演算法,以弥补演算能力的不足。ChatGPT据报需要一万台英伟达(Nvidia)的图像处理器处理训练数据,DeepSeek工程师称他们仅用2000台图像处理器就取得相同结果。

查看评论(91)

24小时热点排行

博索纳罗:被强制戴电子脚镣无比屈辱 我已经70了
当不确定摆在眼前,他们为何仍然选择赴美留学?
文科专业大批裁撤后,理科专业的消亡也开始了
被边缘化处置 他可能是被扎克伯格伤害最深的人
参加演唱会致不伦恋曝光 美国科技公司总裁辞职

24小时讨论排行

加萨援助站再开火!以色列军队"无差别扫射"酿32死
川普将宣布重大贸易协议 产业国别关税 8月同步生效
因为天太热 美驻武汉总领馆罕见暂停签证面谈预约
官方数据的泄露,杭州"粪水"水一个月前已经爆发了
美籍华人商务部员工前往中国探亲后被禁出境
中国国防部:中越将在广西举行首次陆军联训
中国记协何时最勇敢?在安全的时候
特朗普:这语言最难学 我不会模仿 会引起很大混乱
5年人口暴涨近500万,它凭什么
中央城市工作会议提出七大任务,网民如何理解?
《华尔街日报》回怼特朗普:没在怕,法庭见!
川普孙女庆14岁生日!伊凡卡母女美照连发
宗庆后未在香港设立家族信托?律师分析三种可能
美政府想"断供"马斯克旗下航天企业,但审查发现离不开
丁家喜律师:"我爱你们,但我不能放弃理想和信念"
接收31名离美研究者,马克龙真从美国抢到了人
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

文学城新闻
切换到网页版

中国AI“刷屏”硅谷 性能比肩OpenAI 成本仅1/30

联合早报 2025-01-26 09:50:41


仅相隔两个月,中国初创公司DeepSeek(深度求索)再度发布廉价大模型,其性能可比肩美国OpenAI最新模型。

综合英国科技周刊《自然》(Nature)和英国科技网站“生命科学”(Live Science)等报道,DeepSeek去年12月发布免费语言大模型DeepSeek V3,并称在两个月内花费558万美元完成训练该模型,所需时间和费用仅硅谷竞争对手的十分之一。

中国对冲基金幻方量化旗下的子公司DeepSeek星期一(1月20日)发布推理模型DeepSeek-R1,在第三方多个项目的基准测试中均超越美国OpenAI开发的最新模型o1。

据美国消费者新闻与商业频道(CNBC)报道,美国微软行政总裁纳德拉(Satya Nadella)星期三(1月22日)在达沃斯世界经济论坛上说,DeepSeek的新模型令人印象深刻,不仅因为他们有效地构建一个开源模型,还因为它的推理计算效率极高。“我们应该非常严肃地看待中国人工智能(AI)的发展”。

除测试表现优于o1外,R1的训练成本和开源开放程度也胜于o1。《自然》周刊报道称,开源开放指的是,让用户参与二次开发,可更改演算法。虽然可自由重複使用,但R1的开源开放程度仍受限,因为训练数据尚未公开。

《每日经济新闻》引述DeepSeek发布的技术报告称,R1的训练成本是o1的三十分之一。《自然》周刊报道称,R1给用户开出低廉的使用方案,是o1的三十分之一。

让西方科技界讚歎的是,DeepSeek在受美国限制先进科技输华的背景下,依然开发出新颖模型。

“生命科学”报道称,美国限制向中企出口先进AI计算芯片,迫使R1研发者採用更智能和有效的演算法,以弥补演算能力的不足。ChatGPT据报需要一万台英伟达(Nvidia)的图像处理器处理训练数据,DeepSeek工程师称他们仅用2000台图像处理器就取得相同结果。