搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
1 个月
OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话
Advanced Voice由OpenAI的多模态模型GPT-4o支持。 OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT 聊天栏旁边的语音图标,然后点击左下角的 ...
腾讯网
16 天
iPad 也能跑 GPT-4o 级别模型,国产小钢炮的新模型可能会让 AI 硬件不 ...
值得注意的是,GPT-4o API 无法同时输入语音和视频,目前定量评测输入文本和视频。 在语音理解方面,超越 Qwen2-Audio 7B,实现通用模型开源 SOTA(包括 ASR、语音描述等任务);在语音生成方面,MiniCPM-o 2.6 超越 GLM-4-Voice 9B,实现通用模型开源 SOTA。 MiniCPM-o 2.6 的 ...
腾讯网
10 天
豆包发布大模型1.5 Pro ,实测:国产AI用最「笨」的方法干翻GPT-4o
这几天海外科技圈最受关注的有两件事,一个是一众科技大佬齐聚特朗普就职典礼,川普还拉上 OpenAI、软银等公司成立一家叫「星际之门」(Stargate Project)的 AI 公司,未来 4 年要投资 5000 亿美元,掀起了新一轮 AI 军备竞赛 ...
腾讯网
12 天
豆包App灰度最新语音模式,实现了GPT-4o不会的唱歌
2025年,豆包的第一更,放在了语音通话功能上。 2025年1月20日,豆包发布了最新的“端到端”语音大模型,并基于该模型更新豆包APP的实时语音通话功能。 此前,豆包语音通话功能采用的是ASR(自动语音识别)+LLM(大语言模型)+TTS(文生音频 ...
搜狐
10 天
豆包大模型1.5 Pro发布:打破AI边界,超越GPT-4o
综合得分超越了业内标准的GPT-4o。这一消息无疑令广大开发者和AI技术爱好者振奋不已,因为它为未来的应用场景提供了更多可能性。 除了优秀的语言理解能力,豆包1.5 ...
18 天
RTE与AI的奇妙碰撞:Voice Agent引领未来生态革命
在2024年,实时互动技术(RTE)与人工智能(AI)的深度融合犹如点燃了科技领域的新引擎。一场技术革命悄然展开,GPT-4o和RealtimeAPI的推出,使得实时语音交互突破了各种边界,VoiceAgent似乎已成为生态创新的下一座金矿。 随着2024年的钟声敲响,RTE与AI的交汇带来了颠覆性的新体验。5月,支持文本、音频和视觉多模态推理的GPT-4o登场;10月,OpenAI推出支撑语音实 ...
11 天
豆包大模型1.5 Pro惊艳发布:超越GPT-4o的未来之路
快科技1月22日报道,热切期待的豆包大模型1.5 Pro在今天终于正式亮相,标志着这款先进的人工智能的里程碑式进展。作为一款全新的大模型,豆包1.5 Pro目前已在豆包APP灰度上线,开发者们也可在火山引擎上轻松调用其API。
10 天
on MSN
豆包大模型1.5 Pro横空出世,综合能力超越GPT-4o引关注
近期,豆包大模型迎来了其1.5 Pro版本的正式亮相,这一消息在业界引起了广泛关注。
来自MSN
1 个月
OpenAI ChatGPT推出Advanced Voice Mode with Vision、Projects功能
Advanced Voice Mode是以多模态模型如GPT-4o为基础,让ChatGPT具备听力,以便更流畅、更低延迟和用户交谈。在第6天的新功能发布中,OpenAI为之加入视频 ...
金羊网 on MSN
12 天
豆包App更新实时语音通话功能,中文满意率远超GPT-4o,情商智商在线!
豆包App更新实时语音通话功能,中文满意率远超GPT-4o,情商智商在线!,app,gpt-4,豆包,延时 ...
巨丰财经
12 天
豆包实时语音大模型上线,测试效果超GPT-4o
该功能基于最新豆包实时语音大模型(Doubao Realtime Voice Model)。 据界面新闻报道 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈