2024年,随着OpenAI等国际大模型企业的持续推进,国内大模型企业也在不断追赶和超越。总体上,中国大模型在经历2023年白热化的“百模大战”后,2024年迎来了“大浪淘沙”,竞争格局趋于稳定,呈现互联网大厂与初创公司“共舞”的局面。
在最新一期(第133期)中,节目迎来了重量级嘉宾——Uber联合创始人 Travis Kalanick。这一集围绕中国AI公司 DeepSeek ...
导读:奥特曼罕见地承认了自己犯下的‘历史错误’,LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪?圈内热转的这篇分析指出,相比R1,R1-Zero具有更重要的研究价值,因为它打破了终极的人类输入瓶颈!
近日,在国内某问答平台上,一则关于 DeepSeek 的提问登上问题热门排行榜。这一问题的描述是:“如何评价 DeepSeek 自称开源?但似乎并未开源(Open Source),仅为 Open Model?”(来源:资料图)那么,DeepSeek ...
特朗普政府上任伊始就展现了对AI领域的雄心壮志。1月21日,特朗普在白宫宣布了名为"星际之门"的庞大AI基础设施计划,预计在未来四年内投资5000亿美元,用于建设支持AI发展的基础设施(点击查看相关报道)。这一计划由OpenAI、软银集团和甲骨文公司 ...
新智元报道 编辑:KingHZ 桃子【新智元导读】一场改写AI历史的震撼对决正在上演!就在昨天,当DeepSeek ...
大和发表报告表示,内地人工智能公司深度求索(DeepSeek)截至本周一(27日)已成为苹果应用商店中免费应用程式排行榜第一名,此推理模型据称在某些AI基准测试中的表现与OpenAI的o1相当。根据DeepSeek ...
在当今竞争激烈的人工智能领域,DeepSeek的横空出世正如一阵狂风,令众多大厂如英伟达、Meta和OpenAI等面临前所未有的压力。近年来,随着AI技术的急速发展,市场内的竞争不断加剧,DeepSeek凭借其低成本高性能的大模型训练策略,成功挑战了行业巨头的地位。本文将全面解析DeepSeek的技术创新、市场影响,以及其背后的开放源代码理念,揭示其如何在短时间内成为全球AI研究者的首选模型。 深 ...
支持大语言模型 LLM、多模态图文模型 VLM 的预训练及轻量级微调。XTuner 支持在 8GB 显存下微调 7B 模型,同时也支持多节点跨设备微调更大尺度模型(70B+)。
OpenAI on Friday launched a new artificial intelligence (AI) "reasoning" model o3-mini. The company said the newest in the ...
从去年9月OpenAI以o1模型变革模型训练范式之后,各家大模型公司开始兑现当时的行业预期,形成了一定规模的国产o1类模型跟进潮。