Gpt架构 - 搜索 News

6 天

在AI技术日新月异的背景下，中国大模型DeepSeek的崛起引发了广泛关注。作为一个有潜力的竞争者，DeepSeek在特定领域成功反超了ChatGPT，这究竟得益于怎样的技术创新和策略布局？

这个风向怎么就一下子就转变了呢？在上几个月的时候，OpenAI还曾经被爆出其下一代大模型训练效果不佳，设置模型能力还没有GPT-4o的强。一直以来，很多人都认为GPT这种模式其实最后是通向不了AGI的。比如像之前李飞飞和Etchemendy（斯坦福哲 ...

5 天

久其软件女娲GPT：引领行业智能化转型，助力企业快速赋能

随着人工智能技术的发展，越来越多的企业开始追赶这一波技术浪潮。在这其中，久其软件（002279）凭借其自主研发的女娲GPT，正在快速推动多个领域的智能化转型。尤其是在1月26日，久其软件在投资者关系平台上回应了投资者对女娲GPT智能体的关心，表明其已 ...

3 天

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型和智能体

深度求索公司研发的DeepSeek大模型最近“出圈”，其实，国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到，上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4，改用DeepSeek-V3生成合成数据，开发垂类大模型。达观数据公司去年5月就引入DeepSeek-V2大模型，开发办公智能体（Agent），取得了很好效果。“DeepSeek的性价比极 ...

来自MSN2 个月

GPT 和大型语言模型，在NLP的未来

特别是 Transformer 架构，一直是该领域的游戏规则改变者，导致了 OpenAI 的 GPT（生成式预训练 Transformer）系列等模型的开发。与它们的前辈不同 ...

SBS1 年

简单听懂：升级到GPT-4的Chat GPT到底哪里变了？为何震撼许多人？

在GPT-4刚刚问世的时候，因其更大的规模和更复杂的架构，更准确地生成自然语言文本，更丰富的语言能力，更大的灵活性和更快的响应速度而“技 ...

腾讯网16 天

突破Transformer架构，MiniMax 01首次开源，海外开发者再一次被中国模型 ...

而且与GPT-4o和Claude-3.5-Sonnet性能平起平坐 ... 更重要的是，这两款全新模型扩展了新型Lightning Attention架构，突破了传统Transformer架构，同时也是线性 ...

36氪16 天

突破Transformer架构，MiniMax 01首次开源，海外开发者再一次被中国模型 ...

在架构方面，创新性地采用了混合架构 ... 且模型权重完全开源。而且与GPT-4o和Claude-3.5-Sonnet性能平起平坐，尤其在上下文窗口方面表现出色，处理 ...

新浪网1 个月

没有博士学位却开启了GPT时代，奥特曼盛赞Alec Radford，爱因斯坦级天才

不仅如此，Alec Radford 还参与了 GPT-3 论文的撰写、以及 GPT-4 的预训练数据和架构研究工作。 2024 年年末，在 OpenAI 赚尽眼球的 12 天连发的最后一天前 ...

10 天

中国大模型公司提出新架构，解决Context无限长问题，开启Agent时代

1月15日，MiniMax发布并开源新一代01系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新，以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈， ...

10 天

豆包大模型1.5 Pro正式发布：比GPT-4o更强

全新的豆包实时语音模型Doubao-1.5-realtime-voice-pro，采用Speech2Speech端到端框架，表现力实现质的飞跃，真正做到会哭会笑、能说方言会唱歌。该模型已在豆包App全量上线。

10 天on MSN

豆包大模型1.5 Pro横空出世，综合能力超越GPT-4o引关注

近期，豆包大模型迎来了其1.5 Pro版本的正式亮相，这一消息在业界引起了广泛关注。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果