在人工智能快速发展的今天,新的AI工具不断涌现,为各行各业提供了全新的解决方案。最近,阿里云通义团队发布了全新数学推理模型Qwen2.5-Math-PRM以及字节跳动的豆包推出了AI编程功能,这两款工具的加入将为用户带来更多的创造力和工作效率提升。本 ...
和微软之前推出的 Phi-4 不同,rStar-Math 采用蒙特卡洛树搜索(Monte Carlo Tree Search)进行推理,这种方法模拟了人类逐步解决问题的思维方式,能够将复杂问题分解成更小的部分,逐步求解。
中国“双子星”打开了OpenAI的黑箱。此前,OpenAI定义了大模型训练的四个阶段:预训练、监督微调、奖励建模、强化学习。现在,这个范式被打破了,Kimi 和DeepSeek都证明了可以跳过和简化某些环节来提升模型的训练效率和性能。
1月20日,月之暗面推出多模态思考模型Kimi k1.5,DeepSeek开源R1推理模型,双双“硬刚”OpenAI。性能测试显示,这两款模型在多项测试中能与o1“叫板”。R1更是得到英伟达高级研究科学家Jim ...
“在过去的四年里,你们坚定不移地支持帮助Gauth取得了令人难以置信的里程碑,包括在App ...
从技术报告看,K1.5的亮点是真的不少。
【新智元导读】来了来了,月之暗面首个「满血版o1」来了!这是除OpenAI之外,首次有多模态模型在数学和代码能力上达到了满血版o1的水平。 还记得吗,AI大神Karpathy曾说过,「英文是最热门的编程语言」。 两年后的现在,这个规则彻底要被颠覆了。
1月20日, DeepSeek正式发布DeepSeek-R1,并同步开源模型权重 ...
IT之家1 月 15 日消息,月之暗面今日发布了 Kimi 多模态图片理解模型 API,全新多模态图片理解模型 moonshot-v1-vision-preview(以下简称“Vision 模型”)完善了 moonshot-v1 模型系列的多模态能力。 Vision 模型具备图像识别能力,能够识别出图像中的复杂细节和细微的差别 ...
早在去年3月正式亮相之前,就语言模型和多模态模型双管齐训,此后一直在多模态方面稳扎稳打;1个月前,官宣拿到了2024年的第n笔融资,数额为数亿美元;于是也很顺理成章的,在迎接蛇年之际,亮出了自己同时修的6个模型、“五个学位”。
表面上,是中国大模型某种程度上又一次在技术能力上直起了腰,而全球AI从业者的“围观”,本质上则透露出业界对大模型这台“蒸汽机”能够尽快出现属于自己的“瓦特”的期许。