首页
情报
装备
百科
精选
快讯
AI
猫咪范
首页
情报
装备
百科
精选
快讯
AI
猫咪范
注册
登录
推荐类别
栏目分类
开源软件
>
在线工具
开源软件
电脑软件
人工智能
>
3D
AI绘画
AI编程
AI视频
AI音频
ChatGPT
大语言模型
数字人
机器人
电脑游戏
>
chinaplay.store
Discord
Epic Games
Fanatical
GameSessions
giveaway
GMG
GOG
HumbleBundle
indiegala
IO游戏
itch.io
Microsoft Store
Origin
Rockstar Games Launcher
STEAM
Uplay
Wegame
Windows
战网
方块游戏
杉果游戏
主机游戏
>
任天堂Switch
微软Xbox
索尼PlayStation
手机游戏
>
IOS
taptap
安卓
优惠
基准测试Visual Haystacks:模拟了现实世界的场景,要求模型不仅要找到包含答案的图片,还要利用视觉内容进行推理来回答具体问题
AI
推荐人:暴走AI
标签:
Visual Haystacks
基准测试
AI
9个月前 (07-24)AI
加州大学伯克利分校的研究人员发布论文,论文的主题是关于如何让计算机更好地回答关于多张图片集合的问题,这在现实世界中非常有用,比如在翻看大量照片、网上搜索特定信息,或者通过卫星图像监控环境变化时。我们可以把这个问题想象成在一堆干草中找到一根针,但更难,因为需要在很多堆干草中找到答案。 论文还提到了他们创建的Visual ...
阅读全文
直达链接
好
0
不好
0
0
基准测试Visual Haystacks:模拟了现实世界的场景,要求模型不仅要找到包含答案的图片,还要利用视觉内容进行推理来回答具体问题
已关闭评论
优惠
GET-Zero:用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练
AI
推荐人:暴走AI
标签:
GET-Zero
AI
9个月前 (07-24)AI
斯坦福大学的研究人员推出GET-Zero,它是一种用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练。简单来说,GET-Zero通过一种称为Graph Embodiment Transformer(GET)的变换器模型,利用机器人的物理结构(即其关节和链接的图结构)作为学习到的结构偏差,...
阅读全文
直达链接
好
0
不好
0
0
GET-Zero:用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练
已关闭评论
优惠
Temporal Residual Jacobians:一种用于无绑定运动转移(rig-free motion transfer)的新方法
AI
推荐人:暴走AI
标签:
Temporal Residual Jacobians
AI
9个月前 (07-24)AI
伦敦大学学院、Adobe Research和蒙特利尔大学的研究人员推出Temporal Residual Jacobians,一种用于无绑定运动转移(rig-free motion transfer)的新方法。简单来说,这种方法可以自动将一个动作(例如,跳舞或跑步)从一个3D模型转移到另一个完全不同的3D模型上,而...
阅读全文
直达链接
好
0
不好
0
0
Temporal Residual Jacobians:一种用于无绑定运动转移(rig-free motion transfer)的新方法
已关闭评论
优惠
MUSICONGEN:于Transformer的文本到音乐生成模型
AI
推荐人:暴走AI
标签:
MUSICONGEN
AI
9个月前 (07-24)AI
MUSICONGEN是一个基于Transformer的文本到音乐生成模型。简单来说,MUSICONGEN能够根据文本提示生成具有节奏和和弦控制的音乐。这就像是给一个音乐智能助手一些文字描述,比如“一个充满活力的摇滚乐段”,然后它就能创作出符合这个描述的音乐。 项目主页:https://musicongen.github...
阅读全文
直达链接
好
0
不好
0
0
MUSICONGEN:于Transformer的文本到音乐生成模型
已关闭评论
优惠
HoloDreamer:从文本描述生成全包围3D全景世界的系统
AI
推荐人:暴走AI
标签:
3D全景世界
HoloDreamer
AI
9个月前 (07-24)AI
北京大学 和鹏城实验室的研究人员推出HoloDreamer,它是一个从文本描述生成全包围3D全景世界的系统。简单来说,HoloDreamer可以读懂你用文字描述的场景,然后创造出一个360度全方位的3D场景。这就像是用文字给一个画家描述你心中的梦想家园,然后画家不仅画出了家园的正面,还画出了周围和内部的所有视角。 项目...
阅读全文
直达链接
好
0
不好
0
0
HoloDreamer:从文本描述生成全包围3D全景世界的系统
已关闭评论
优惠
新型图像渲染技术BoostMVSNeRFs:用来提升一种叫做“多视图立体(MVS)基础神经辐射场(NeRF)”的渲染质量,特别是在处理大规模场景时的通用视图合成能力
AI
推荐人:暴走AI
标签:
BoostMVSNeRFs
AI
9个月前 (07-24)AI
阳明交通大学和台湾大学的研究人员推出一种新的图像渲染技术,名为“BoostMVSNeRFs”。这个技术是用来提升一种叫做“多视图立体(MVS)基础神经辐射场(NeRF)”的渲染质量,特别是在处理大规模场景时的通用视图合成能力。总的来说,BoostMVSNeRFs是一种先进的图像渲染技术,它通过智能地选择和组合多个视图的...
阅读全文
直达链接
好
0
不好
0
0
新型图像渲染技术BoostMVSNeRFs:用来提升一种叫做“多视图立体(MVS)基础神经辐射场(NeRF)”的渲染质量,特别是在处理大规模场景时的通用视图合成能力
已关闭评论
优惠
VIDEOGAMEBUNNY模型:为理解视频游戏图像而特别定制的多模态大模型
AI
推荐人:暴走AI
标签:
VIDEOGAMEBUNNY
多模态大模型
AI
9个月前 (07-24)AI
阿尔伯塔大学的研究人员推出VIDEOGAMEBUNNY模型,这是一个为理解视频游戏图像而特别定制的多模态大模型(LMM)。它基于Bunny模型,并对其进行了微调,以提高对视频游戏内容的理解能力。研究团队发布了中间检查点、训练日志以及一个包含185,259张来自413个游戏的视频游戏图像的广泛数据集,以及389,565个...
阅读全文
直达链接
好
0
不好
0
0
VIDEOGAMEBUNNY模型:为理解视频游戏图像而特别定制的多模态大模型
已关闭评论
优惠
新基准测试LONGVIDEOBENCH:为了评估大型多模态模型在处理长时间视频和语言交织输入时的理解能力而设计
AI
推荐人:暴走AI
标签:
LONGVIDEOBENCH
AI
9个月前 (07-24)AI
新基准测试LONGVIDEOBENCH,它是为了评估大型多模态模型在处理长时间视频和语言交织输入时的理解能力而设计的。这个基准测试特别关注那些能够处理长达一小时的视频内容的模型。论文还提到了LONGVIDEOBENCH的挑战性,即使是最先进的专有模型(如GPT-4o、Gemini-1.5-Pro)也面临挑战,而开源模型...
阅读全文
直达链接
好
0
不好
0
0
新基准测试LONGVIDEOBENCH:为了评估大型多模态模型在处理长时间视频和语言交织输入时的理解能力而设计
已关闭评论
优惠
无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算
AI
推荐人:暴走AI
标签:
SlowFast-LLaVA
AI
9个月前 (07-24)AI
苹果推出一个名为SlowFast-LLaVA(简称SF-LLaVA)的新方法,它是一种无需训练的视频大语言模型(LLM)。SF-LLaVA能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算。这种方法通过为视频LLM设计双流输入(Slow和Fast路径),有效地聚合了采样视频帧的特征。 论文...
阅读全文
直达链接
好
0
不好
0
0
无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算
已关闭评论
优惠
CAS:用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置
AI
推荐人:暴走AI
标签:
CAS
AI
9个月前 (07-24)AI
上海启智研究院、 浙江大学、上海交通大学和清华大学的研究人员推出创新系统“Cross Anything System”(简称CAS),它是一个用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置。这个系统由一个高级推理模块和一个低级控制策略组成,它们共同工作,让机器人能够自主地规划路径并适应各种地形。例...
阅读全文
直达链接
好
0
不好
0
0
CAS:用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置
已关闭评论
优惠
新型视频预训练方法SIGMA:通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容
AI
推荐人:暴走AI
标签:
Sigma
AI
9个月前 (07-24)AI
阿姆斯特丹大学推出一种新型的视频预训练方法,名为SIGMA(Sinkhorn-Guided Masked Video Modeling)。这个方法的核心是通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容。SIGMA方法就像是换了一种学习方式,它让计算机学习如何把视频分成一个个小块,然后教...
阅读全文
直达链接
好
0
不好
0
0
新型视频预训练方法SIGMA:通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容
已关闭评论
优惠
三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述
AI
推荐人:暴走AI
标签:
F-HOI
AI
9个月前 (07-24)AI
北京通用人工智能研究院和 北京大学人工智能研究院的研究人员推出新模型F-HOI,它能够理解和生成与人类与物体交互相关的精细描述。主要是三维人体与物体交互(3D Human-Object Interaction, HOI)的精细语义对齐问题。想象一下,你有一个虚拟助手,能够观察一个人在视频中如何拿起一个瑜伽垫,然后不仅能...
阅读全文
直达链接
好
0
不好
0
0
三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述
已关闭评论
共 604 页
« 第一页
...
«
36
37
38
39
»
...
最后 »
微信二维码
热门
人工智能题材互动电影游戏《底特律:变人》正式上线Steam发售
(709℃)
2D像素冒险游戏《羊皮盾卫士》限时免费领取,永久保存好评像素塔防小品
(1606℃)
大型多模态模型M3:设计灵感来源于俄罗斯套娃,它能够将视觉内容表示为嵌套的视觉标记
(249℃)
漫改RPG游戏《妖精的尾巴》上架Steam开启预购,7月30日正式推出
(741℃)
《第五元素》与《疯狂出租车》的结合!科幻竞速游戏《万里高空出租车》正式发售
(356℃)
小型语言模型Orca-Math:解决小学数学问题方面
(325℃)
我要爆料
我的收藏
顶部
快速登录
账户:
密码:
验证码:3 + 6 =
自动登录
忘记密码?
QQ登录
微博登录
注 册