优惠全新基准测试工具T2V-CompBench：用于评估文本到视频（Text-to-Video, T2V）生成模型的性能

AI

推荐人：暴走AI 标签：T2V-CompBench AI

9个月前 (07-24)AI

香港大学、香港中文大学和华为诺亚方舟实验室的研究人员推出全新基准测试工具T2V-CompBench，它专门用于评估文本到视频（Text-to-Video, T2V）生成模型的性能。T2V模型需要根据这个描述生成一段视频。但T2V-CompBench不仅测试模型能否生成视频，更重要的是测试它是否能够准确地组合多个对象、属... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 “诊断链（CoD）”：解决了大语言模型在医疗诊断领域中可解释性的问题

AI

推荐人：暴走AI 标签：CoD 诊断链 AI

9个月前 (07-24)AI

深圳市大数据研究院和香港中文大学（深圳）的研究人员引入“诊断链”（CoD）的概念，解决了大语言模型在医疗诊断领域中可解释性的问题。CoD将诊断过程转化为一个模仿医生思维流程的诊断链条，从而提供了一条清晰的推理路径。此外，CoD还能输出疾病确信度分布，确保决策过程的透明度。 GitHub：https://github.c... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新游发售手游转型PC！韩国开发商nStarcube旗下海洋动作冒险游戏《游泳少女黛西》登陆Steam 22.1元

STEAM

推荐人：暴走AI 标签：游泳少女黛西 STEAM

9个月前 (07-24)Steam

韩国开发商nStarcube将其手游力作《游泳少女黛西（DAISY THE SWIMMER）》搬上PC平台，在Steam上正式发布。尽管首日评价褒贬不一，但这款海洋动作冒险游戏以其独特的搞笑海边打斗和养眼夏日风情，迅速成为夏季的一道亮丽风景。游戏还特别支持繁体中文字幕与界面，满足中文玩家的需求。海滩上的冒险故事游戏... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠在线工具CachedView：帮助用户快速查找和访问网页的备份或历史快照

工具

推荐人：暴走AI 标签：CachedView 快照工具

9个月前 (07-24)工具

CachedView是一款非常实用的在线工具，它可以帮助用户快速查找和访问网页的备份或历史快照。通过将目标网址输入到CachedView的搜索框中，用户可以立即获取该网页在多个快照服务上的备份，包括但不限于： Google页面快照：Google搜索引擎通常会为每个索引的网页保存一个快照，CachedView可以帮你找到... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Notion离线替代方案？开源离线的个人知识管理工具Eidos ，在一处管理你的所有个人数据

工具

推荐人：暴走AI 标签：Eidos 工具

9个月前 (07-24)在线工具

Eidos 是一个开源的个人数据管理框架，旨在作为一个一站式解决方案，帮助用户管理和组织个人的所有数据。该项目由开发者 Mayneyao 主持，使用 TypeScript 编写，遵循 GNU Affero General Public License v3.0 许可证。Eidos 的主要特点在于它的离线可用性、与大语言... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型文本检索基准测试BRIGHT：用来评估和挑战检索系统在处理复杂查询时的表现

AI

推荐人：暴走AI 标签：BRIGHT AI

9个月前 (07-22)AI

香港大学、普林斯顿大学、华盛顿大学和Google Cloud AI 研究的研究人员推出新型文本检索基准测试BRIGHT，它专门设计用来评估和挑战检索系统在处理复杂查询时的表现。这些查询不仅需要关键词匹配，还需要深入的推理能力来识别相关文档。简单来说，BRIGHT测试的是检索系统是否能够“理解”查询背后的逻辑和上下文，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠多模态大语言模型评估框架MultiTrust

AI

推荐人：暴走AI 标签：MultiTrust AI

9个月前 (07-22)AI

清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说，就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面对各种任务时的准确性、安全性、鲁棒性、公平性和隐私保护能力。项目主页：https://multi-tr... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Streetscapes：通过大规模一致性的街景生成技术，从少量图像中生成连贯的城市街景视图

AI

推荐人：暴走AI 标签：Streetscapes 城市街景视图 AI

9个月前 (07-22)AI

Google 研究和斯坦福大学的研究人员推出Streetscapes，即通过大规模一致性的街景生成技术，从少量图像中生成连贯的城市街景视图。这项技术可以用于从单一视频生成动态场景的三维重建和新视角合成。简单来说，就是利用几张街景图片和一些文本描述，计算机能够自动生成一段连续的、逼真的城市街道视频，展示出街道随着时间和天... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Shape of Motion：从单一视频重建动态场景的四维（4D）结构

AI

推荐人：暴走AI 标签：Shape of Motion AI

9个月前 (07-22)AI

加州大学伯克利分校和 Google 研究的研究人员推出Shape of Motion，从单一视频重建动态场景的四维（4D）结构。这项技术旨在从一段普通的单眼（即从一个视角）视频中恢复出场景的三维（3D）几何结构和随时间变化的运动轨迹。简单来说，就是让计算机能够从一段视频中理解物体的形状和它们是如何移动的。项目主页：h... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 3D重建技术SparseCraft：从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成

AI

推荐人：暴走AI 标签：SparseCraft AI

9个月前 (07-22)AI

来自法国的团队推出一种新颖的3D重建技术，名为SparseCraft。这项技术能够从少量彩色图像中恢复出3D形状和视角依赖的外观，实现高效的3D重建和新视角合成。简单来说，就是通过几张图片来构建一个物体的三维模型，并能在不同视角下生成逼真的图像。例如，你是一名建筑师，需要将一个古老的建筑转换成3D模型以进行翻新设计。使... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠提高自动音频字幕生成（ AAC）的效率

AI

推荐人：暴走AI 标签：AAC AI

9个月前 (07-22)AI

上海交通大学人工智能教育部重点实验室X-LANCE实验室和英国萨里大学视觉、语音和信号处理中心的研究人员发布论文，论文的主题是关于提高自动音频字幕生成（Automated Audio Captioning, AAC）的效率，即如何让计算机更好地理解音频内容并生成相应的文本描述。想象一下，当你在听一段音乐或者演讲，计算机... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Phi-3 Safety Post-Training：调整和优化他们开发的Phi-3系列小型语言模型

AI

推荐人：暴走AI 标签：Phi-3 微软 AI

9个月前 (07-22)AI

微软发布论文，论文的主题是关于如何确保语言模型在实际应用中既安全又符合人类的偏好和安全考虑。具体来说，论文介绍了微软公司如何通过一系列的方法和步骤，来调整和优化他们开发的Phi-3系列小型语言模型（SLMs），使其在各种场景下生成的内容更加安全和负责任。通过这种“破坏-修复”的迭代过程，微软能够显著提高Phi-3模型在... 阅读全文

直达链接好 0 不好 0 已关闭评论