另一个“无”是受限于对中国的高性能半导体出口管制。中国国产半导体仍处于试用阶段,因此中国企业在高效模型的开发上展开激烈竞争。“R1”在半导体内存使用量上大幅减少,具有简化的设计。这两个“限制”反而催生了创新。
DeepSeek以“AI大模型圈黑马“迅猛崛起,如何以低成本推出顶级模型?开源与闭源的选择会成为AI行业未来趋势吗?DeepSeek的成功是否意味着中国在AI领域赶超美国?欧洲AI领域为何相对落后?Jina AI创始人肖涵博士在德国之声专访中分享了他对DeepSeek在技术创新、商业策略上的看法,并探讨了中美在AI发展中的角色与分工。
据每日经济新闻报道,DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一。
OpenAI 首席产品官凯文·维尔(Kevin Weil)在达沃斯世界经济论坛上表示,OpenAI 预计将在 2 月或 3 月发布更智能的 GPT o3 模型。 他还提到,该公司准备在第一季度推出其首批 AI 智能体工具,使 ChatGPT ...
IT之家 1 月 20 日消息,尽管人工智能(AI)在编码等任务中表现出色,但一项最新研究发现,AI 在应对高级历史考试时仍显得力不从心。 这项研究由奥地利复杂科学研究所(CSH)的团队主导,旨在测试三大顶尖大型语言模型(LLMs)——OpenAI ...
OpenAI的首席执行官Sam Altman宣布,新型推理AI模型o3-mini已完成,预计将在数周内正式推出,为了满足用户的需求,API和ChatGPT版本将同步发布。Altman明确表示o3-mini在大多数方面比o1 pro差,但其最大优势在于速度极快。
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI OpenAI要研究人类长寿问题了??推出新模型GPT-4b micro。 可以设计出将普通细胞转化为干细胞的蛋白质。
用GPT-4辅助教学6周=正常学习两年?! 事情是酱婶儿的。 一支由世界银行教育专家、数据科学家、研究分析师等组成的权威团队,在尼日利亚 ...
IT之家1 月 16 日消息,面壁智能公众号今日宣布推出“小钢炮”MiniCPM-o 2.6 端侧全模态模型,参数为 8B,号称性能比肩 GPT-4o、Claude-3.5-Sonnet。 其采用了端到端多模态架构,可同时处理文本、图像、音频和视频等多种类型的数据,生成高质量文本和语音输出。
IT之家 1 月 16 日消息,面壁智能公众号今日宣布推出“小钢炮”MiniCPM-o 2.6 端侧全模态模型,参数为 8B,号称性能比肩 GPT-4o、Claude-3.5-Sonnet。
Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时,通义团队还开源首个步骤级的评估标准 ProcessBench,填补了大模型推理过程错误评估的空白。 在当前 ...
该系列模型实现突破性创新,以大规模应用“线性注意力”机制突破了Transformer(转换器)大模型架构的记忆瓶颈,不仅在综合性能上比肩GPT-4o ...