在刘知远看来,OpenAI o1相当于引爆了一颗原子弹,但没有告诉大家秘方。DeepSeek则可能是全球首个能够通过纯粹的强化学习技术复现OpenAI o1能力的团队,他们通过开源并发布相对详细的介绍,为行业发展做出了重要贡献。
在科技日新月异的今天,人工智能领域再次迎来重大突破。北京时间2月3日上午,OpenAI正式推出了一款名为“深度研究”(Deep Research)的智能体产品,专为深度研究领域打造,旨在大幅提升专业研究报告的生成效率。
但到了AI创业后,梁文锋则是哪吒式魔童,不惧挑战OpenAI等权威,更不愿走上一众大厂前辈们所都走过的老路,而是沿着“我命由我不由天”的信念,誓要搏杀出属于自己这代年轻人的未来,将命运掌握在自己手中。
这么说吧,传统大模型训练里边,非常注重标注数据微调( SFT ),也就是让大模型先按人类标注好的标准答案来学习,学着说人话;如果想要大模型性能强些,那还要再在 SFT 基础上加一些强化学习( RL ),让大模型的理解能力更好。
另一方面,AI概念出现了大面积飙涨。其中DeepSeek概念飙涨13.91%,云计算、华为概念、网络安全、国产软硬件等板块概念指数涨幅均超过6%,与一众红利资产板块形成巨大对比。甚至从涨停股和主力资金流向来看,市场越发明显地出现了抱团AI产业链的迹象。
今天,人形机器人公司 Figure 宣布结束与 OpenAI 的合作,转而自主开发 AI 模型,并计划在 30 天内推出重大创新,而据悉这一决定是出于对 AI 集成和硬件开发的垂直整合需求。 Figure 创始人 Brett Adcock 在 X ...
2025年春节期间,中国AI初创公司深度求索(DeepSeek)凭借开源模型DeepSeek-R1和V3系列,以“3%成本对标OpenAI”的技术突破,让全球科技圈迎来了“DeepSeek时刻”。
楼上说的很好:他不是知道自己错了,只是知道自己要死了。 DeepSeek 的开源和发布给了 OpenAI 极大的压力 —— R1 模型的优秀性能让 o1 不再是最领先的推理模型;V3 模型极低的训练成本打破了 OpenAI 和 NVIDIA 塑造的算力叙事。 为了避免信息在传播中失真,带大家看看语境和原话。 在 OpenAI 发布 o3-mini ...
先是“AI界拼多多”DeepSeek,从除夕前火到了现在。它凭借着“低训练成本”、“能和OpenAI一较高下的模型能力”,直接给全球来了一剂猛药,甚至让OpenAI、英伟达两大AI巨头公司感受到了“威胁”。关于DeepSeek成本、能力、创始人的“神话”和“误读”,还在此起彼伏出现。
占据标普500指数以及纳斯达克100指数高额权重的所谓“美股七大科技巨头”,即“Magnificent Seven”,它们包括:苹果、微软、谷歌、特斯拉、英伟达、亚马逊以及Facebook母公司Meta Platforms,它们乃标普500指数屡创新高的核心推动力。
据媒体报道,中国AI初创公司深度求索 (DeepSeek)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。
展望2月,中信证券表示,中国资产将迎来重估,春季躁动行情或进入加速阶段。首先,从大势层面看,外部风险扰动在4月前有望进入平静期,春季躁动时间窗口更加清晰,国产AI重估将成为重要情绪催化因素。其次,从市场流动性层面看,中长期资金入市进程和机制值得继续关注。