搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
腾讯网
3 天
给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
腾讯网
3 天
加快高质量人工智能中文语料库建设迫在眉睫
人工智能(AI)语料库是汇集大量来自书籍、学术文章、社交媒体等渠道的文本、图片、音频、视频数据集合,是人工智能领域研究和应用的基础数据。目前,国际主流大模型训练语料库以英文语料为主,中文语料占比不超过5%。中文人工智能语料库匮乏制约了我国大模型性能飞跃和技术创新。赛迪智库电子信息研究所建议加快专业语料建 ...
新浪网
10 天
英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC
数据来源方面,Nemotron-CC 基于 Common Crawl 网站数据构建,并在经过严格的数据处理流程后,提取而成高质量子集 Nemotron-CC-HQ。 在性能方面,英伟达称 ...
中国青年网
26 天
每周图片精选(12.28-1.3)
12月4日,韩国首尔,韩国最大在野党、共同民主党党首李在明在国会门前发表讲话。随后,国会通过“要求解除戒严”的决议。 近日,第十二届全国 ...
新浪网
13 天
中世纪游戏哪个好玩 十大经典中世纪游戏排行
目前只支持单人模式。 Card Crawl是一款由Arnold Rauers开发的益智游戏。玩家需要在游戏过程中不断收集卡片,提升自己的实力。游戏画面精美 ...
unite
28 天
人工智能垄断:科技巨头如何控制数据和创新
打破大型科技公司对数据的控制需要大胆和协作的努力。Common Crawl 和 Hugging Face 等开放数据计划通过创建可供小公司和研究人员使用的共享数据集,为数据开放提供了一条前进的道路。这些项目的公共资金和机构支持可以帮助创造公平的竞争环境,并鼓励更具 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈