Math图片 - 搜索 News

商业新知 on MSN18 小时

中国“双子星”打开了OpenAI的黑箱。此前，OpenAI定义了大模型训练的四个阶段：预训练、监督微调、奖励建模、强化学习。现在，这个范式被打破了，Kimi 和DeepSeek都证明了可以跳过和简化某些环节来提升模型的训练效率和性能。

12 小时

因为根据DeepSeek的研究，模型的进步并非均匀渐进的。在强化学习过程中，响应长度会出现突然的显著增长，这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟，暗示着某种深层的认知突破。

17 小时

“在过去的四年里，你们坚定不移地支持帮助Gauth取得了令人难以置信的里程碑，包括在App ...

来自MSN20 小时

从技术报告看，K1.5的亮点是真的不少。

19 小时

表面上，是中国大模型某种程度上又一次在技术能力上直起了腰，而全球AI从业者的“围观”，本质上则透露出业界对大模型这台“蒸汽机”能够尽快出现属于自己的“瓦特”的期许。

一些您可能无法访问的结果已被隐去。