优惠交互式可视化工具TRANSFORMER EXPLAINER：帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型

AI

推荐人：暴走AI 标签：TRANSFORMER EXPLAINER AI

9个月前 (08-10)AI

TRANSFORMER EXPLAINER是一个交互式可视化工具，它旨在帮助非专业人士通过GPT-2模型来学习理解Transformer这一文本生成模型。Transformer是一种在机器学习领域非常流行的神经网络架构，广泛应用于从文本到视觉的多种任务中。但Transformer的内部工作原理对许多人来说还是一个黑箱，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠跨平台开源快速启动工具Kando，多级饼状菜单、拖拽启动

工具

推荐人：暴走AI 标签：Kando 工具

9个月前 (08-09)工具

Kando 是一个跨平台的开源快速启动工具，支持 Windows、macOS、Linux，旨在提供一种非常规、快速且有趣的与计算机互动的方式。用户可以通过 Kando 来启动应用程序、模拟键盘快捷键、打开文件等多种操作。该项目支持鼠标、触控笔或触摸输入，特别适合那些频繁使用指尖与设备交互的用户。尽管如此，对于经常双手置... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠阿里发布新一代数学模型Qwen2-Math

$阿里发布新一代数学模型Qwen2-Math$

AI

推荐人：暴走AI 标签：Qwen2-Math 阿里 AI

9个月前 (08-09)AI

阿里通义千问 Qwen2 家族的新成员 Qwen2-Math，以其强大的数学解题能力，为开源语言模型领域带来了新的突破。以下是对 Qwen2-Math 的简介和性能概述，以及其多语言模型开发计划的介绍。项目主页：https://qwenlm.github.io/zh/blog/qwen2-math GitHub：ht... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠喜加一 GOG平台限时免费领取俯视角动作射击游戏《Intravenous》 0元

GOG

推荐人：暴走AI 标签：Intravenous GOG

9个月前 (08-08)GOG

之前已经在Steam平台限免过的俯视角动作射击游戏《Intravenous》，这次又在GOG平台开启了限免，《Intravenous》是一款于2021年7月27日发布的游戏，原价80元，目前在Steam国区拥有91%的“特别好评”评价。游戏中，玩家将扮演前战士史蒂夫·罗宾斯，为了给兄弟报仇而潜入犯罪组织进行作战。游戏特... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠喜加一本周免费领取《Apex 英雄》的英雄“导线管” ，下周免费游戏将是类银河战士恶魔城类游戏《亡灵诡计：来世》和《战舰世界》一入门包：奥尔巴尼号 0元

Epic Games

推荐人：暴走AI 标签：Apex 英雄亡灵诡计：来世战舰世界 Epic Games

9个月前 (08-08) Epic Games

Epic Games本周要免费送《Apex 英雄》本体、《 Apex 英雄》导线管免费解锁捆绑包，领取时间为8月8日晚上23点到8月15日晚上23点，在此之前免费领取即可永久保留这些作品。下周的免费游戏是类银河战士恶魔城类游戏《亡灵诡计：来世（Death's Gambit: Afterlife）》和《战舰世界》一入门... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠免费在线文字转语音（TTS）工具Luvvoice

工具

推荐人：暴走AI 标签：Luvvoice 工具

9个月前 (08-08)AI

Luvvoice 是一款免费的在线文字转语音（TTS）工具，它利用人工智能技术，特别是深度学习，来生成高质量、接近真实人类声音的语音文件。这类工具对于媒体制作、教育、游戏开发以及为视障人士提供无障碍服务等领域非常有用。以下是 Luvvoice 的一些特点：广泛的语音选择：支持超过 70 种语言和 200 多种不同的语... 阅读全文

直达链接好 0 不好 1 已关闭评论

优惠新型高效Transformer模型AVESFormer：专为实时音视频分割任务而设计

AI

推荐人：暴走AI 标签：AVESFormer AI

9个月前 (08-07)AI

中国科学院大学人工智能学院、中国科学院自动化研究所和中国铁塔股份有限公司的研究人员推出新型高效Transformer模型AVESFormer，它专为实时音视频（Audio-Visual, AV）分割任务而设计。音视频分割是一种多模态任务，目的是在像素级别上区分出视频中与声音源相对应的物体。这项技术在机器人感知、视频监控... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新技术框架ReSyncer：用于创建统一的音频-视觉同步的面部表演者的系统

AI

推荐人：暴走AI 标签：ReSyncer AI

9个月前 (08-07)AI

清华大学、百度公司、中关村实验室和南洋理工大学的研究人员推出新技术框架ReSyncer，它是一个用于创建统一的音频-视觉同步的面部表演者的系统。简单来说，ReSyncer能够根据给定的音频生成口型同步的视频，并且能够进一步传递目标人物的说话风格和身份特征。ReSyncer在不同方面的性能，包括与现有技术的比较、定量和定... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新颖方法omages：用于生成逼真的3D模型和UV贴图，这个过程通过一种称为“对象图像”的表示来实现

推荐人：暴走AI 标签：omages

9个月前 (08-07)AI

西蒙菲莎大学和香港城市大学的研究人员推出新颖方法omages，用于生成逼真的3D模型和UV贴图，这个过程通过一种称为“对象图像”（Object Images）的表示来实现。简单来说，就是将复杂的3D形状转换成64x64像素的2D图像，这样做的好处是可以利用现有的图像生成模型，比如扩散变换器（Diffusion Tran... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型大型多模态模型LLaVA-OneVision：提高计算机视觉任务的性能，特别是在处理单图像、多图像和视频场景时的能力

AI

推荐人：暴走AI 标签：LLaVA-OneVision AI

9个月前 (08-07)AI

这篇论文介绍了一个名为LLaVA-OneVision的新型大型多模态模型（LMMs），它是由多个机构共同开发的，包括字节跳动、南洋理工大学、香港中文大学和香港科技大学。这个模型的核心目标是提高计算机视觉任务的性能，特别是在处理单图像、多图像和视频场景时的能力。例如，你正在使用一个智能助手，你给它发送了一张你在旅行中拍摄... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠评估基准测试MMIU：专门用于测试和评估大型视觉-语言模型在处理多图像任务时的性能

AI

推荐人：暴走AI 标签：MMIU AI

9个月前 (08-07)AI

上海人工智能实验室、上海交通大学、香港大学、商汤科技研究部和清华大学的研究人员推出评估基准测试MMIU（Multimodal Multi-image Understanding），它专门用于测试和评估大型视觉-语言模型（LVLMs）在处理多图像任务时的性能。简单来说，MMIU是一个全面的测试套件，它可以检验这些模型是否... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 ExoViP系统：用于组合视觉推理的验证和探索工具

AI

推荐人：暴走AI 标签：ExoViP AI

9个月前 (08-07)AI

北京国家通用人工智能重点实验室和约翰霍普金斯大学的研究人员推出ExoViP系统，它是一个用于组合视觉推理的验证和探索工具。ExoViP的核心思想是提高复杂视觉任务中人工智能的推理能力，特别是当这些任务需要将复杂的查询转化为一系列可执行的视觉任务时。ExoViP在多个视觉推理任务上的应用，包括视觉问答、图像编辑和视频推理... 阅读全文

直达链接好 0 不好 0 已关闭评论