登顶!“神秘的东方力量”震动硅谷

中国AI公司的创造力正技惊四座。

登顶!“神秘的东方力量”震动硅谷

来源:中国日报网微信公众号    2025-01-27 14:31
2025-01-27 14:31 
分享
分享到
分享到微信

中国AI公司的创造力正技惊四座。最近几天,一家名为深度求索(DeepSeek)的中国公司在欧美AI圈引起了不小的震动,甚至被认为是大模型行业的最大“黑马”。DeepSeek被不少外国人称为“神秘的东方力量”。

1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

苹果美国区应用商店

苹果APP Store中国区免费榜

DeepSeek是什么?

为何技惊四座?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

几天前,总部位于中国杭州的DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。

纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。

有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

Meta生成式AI团队

正疯狂分析DeepSeek

1月24日,美国消费者新闻与商业频道CNBC发文称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。同日,华尔街顶级风投A16Z创始人马克·安德森在社交媒体发言称,DeepSeek R1是其见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是给世界的礼物。英伟达资深科学家、AI智能体业务负责人Jim Fan也对其给予了高度评价。

另据媒体报道,Meta(前身为 Facebook)员工在美国匿名职场社区teamblind上发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。

来源: 北京日报、 环球网

编辑:富文佳

审核:韩丰 董静更多精彩请关注:中国日报网微信公众号

【责任编辑:富文佳】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn