中国人工智能实验室DeepSeek能够使用数万个NVIDIA H100 AI GPU进行训练。其开发的AI模型DeepSeek R1被认为是世界上最先进的之一,可以与OpenAI的新o1和Meta的Llama AI模型相媲美。
2024年的一天,一场AI界的“地震”席卷全球。很多人都用“震惊”来形容这一事件。在那一天,一家几乎不为人知的中国初创公司DeepSeek仿佛在一夜之间横空出世,犹如一颗流星划过长空,留下的光芒刺痛了曾引以为傲的AI行业巨头们的眼睛。
现在的AI模型也能“灵光一现”,实现顿悟了?1月20日,中国AI公司深度求索(DeepSeek)发布的DeepSeek-R1模型,凭借其独特的强化学习(RL)训练方法,首次让AI展现出类人的“顿悟时刻”——在解决复杂问题时,模型会突然停下思考,自主修 ...
据观察者网报导,由陆企研发的DeepSeek-V3模型发布后,在美国热度持续飙升。截至台北时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT,而排在第三的则是Meta旗下的Threads。而 ...
大陆AI新创企业DeepSeek(深度探求)近期推出「DeepSeek-V3」与「DeepSeek-R1」两款最新的AI模型。这两款模型具备低廉的制造成本,且採用运算能力相对低阶的辉达H800晶片,却拥有与全球顶尖AI语言模型匹敌的表现(例 ...
我们关注中国在生成式人工智能(AI)领域的进展。自 ChatGPT ...
DeepSeek由一家名叫幻方的量化股票交易公司运营。到2001年,它已将利润投入购买数千枚英伟达芯片,用于训练其早期模型。公司没有回复记者的置评请求,它在中国有一种名声,那就是以高薪和让人们能够探索最感兴趣的研究课题为承诺,吸引了刚从顶尖大学毕业的 ...
在人工智能领域的竞争日益白热化背景下,国产大模型的崛起带来了全新的视野与可能性。近日,被誉为“AI界拼多多”的DeepSeek在不到十天的时间内,正式发布了其最新一代大模型DeepSeek ...
“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 ...
如果把人工智能(AI)技术的发展比喻为一条高速公路,那么中国一家之前没啥名气的小型初创企业DeepSeek(深度求索)最近的爆火,就如同一辆小车突然从一条大家都没想到的小道上,冲到了与前面快车“并行”的行列之中。DeepSeek开发的人工智能模型,其 ...