AI
优惠 Google推出新一代模型Gemini 1.5,具有100万token的上下文理解能力
7个月前 (02-15)AI
Google推出新一代模型Gemini 1.5,该模型在处理能力和跨模态理解上取得显著提升。该模型具有惊人的100万个token的上下文理解能力,成为目前市场上最强大的模型之一。 主要特点: 超强的上下文处理:Gemini 1.5可以处理高达100万个token的连续信息,为大型基础模型设立了最长的上下文窗口记录。 跨... 阅读全文
优惠 能够与操作系统进行交互的智能代理框架OS-Copilot
7个月前 (02-15)GitHub
来自上海人工智能实验室、华东师范大学、普林斯顿大学、香港大学的研究人员推出智能代理框架OS-Copilot,它旨在构建能够与操作系统(OS)中各种元素交互的通用计算机代理。这些代理能够处理网络、代码终端、文件、多媒体以及各种第三方应用程序。OS-COPILOT框架的核心是创建了一个名为FRIDAY的自改进实体代理,用于... 阅读全文
优惠 图像生成模型大比拼GenAI-Arena :看看那个模型生成图片最好看?
7个月前 (02-14)AI
之前给大家介绍过《视觉模型大比拼Vision Arena》,今天再给大家推荐一个AI绘画模型竞技场GenAI-Arena ,这个项目就是借鉴Vision Arena,在竞技场你可以测试并比较不同的图像生成模型(例如,在文本引导的图像生成模型中的LCM、SDXL、SDXL-turbo,以及在文本引导的图像编辑模型中的Ma... 阅读全文
优惠 英伟达推出本地AI聊天机器人「Chat With RTX」,可在 RTX 30 和 40显卡上免费使用
7个月前 (02-14)AI
全球每天有数百万人使用AI聊天机器人,这些机器人由基于NVIDIA GPU的云服务器提供支持。如今,这些创新性的工具搭载NVIDIA RTX,为本地Windows PC用户带来快速、定制化的生成式AI体验。「Chat With RTX」是一款可免费下载的技术演示软件,允许用户根据自己的内容个性化定制聊天机器人。通过搭载... 阅读全文
优惠 基于AI的视频转录工具Podstellar:三分钟内将YouTube视频转化为文字,并生成简洁的摘要或逐字稿
7个月前 (02-14)AI
在这个信息爆炸的时代,我们每天都在与大量的视频内容打交道。有时,我们可能更需要文字版的摘要来快速了解视频内容。Podstellar 是一款基于AI的视频转录工具,它能在短短三分钟内将YouTube视频转化为文字,并生成简洁的摘要或逐字稿。这意味着,用户只需复制YouTube视频的链接,粘贴到Podstellar的相应位... 阅读全文
优惠 Keras-llm-robot Web UI:可离线部署和测试Huggingface网站上的大部分开源模型
7个月前 (02-13)AI
Keras-llm-robot Web UI基础代码继承自 Langchain-Chatchat项目底层架构使用Langchain和Fastchat等开源框架,顶层使用streamlit实现。本项目完全开源,目标是可离线部署和测试Huggingface网站上的大部分开源模型,并且可以通过配置将多个模型组合起来,实现多模... 阅读全文
优惠 你的声音能赚钱?ElevenLabs带你开启声音变现之旅!
标签:AI语音ElevenLabs
AI
7个月前 (02-13)AI
美国AI语音初创公司 ElevenLabs革新配音行业,你的声音也可以赚钱了!现在只需在ElevenLabs旗下的VoiceLab上传30分钟个人音频样本,即可创建并分享您的专属AI声音模型至ElevenLabs的声音库,并在用户使用时获得收益。操作步骤非常简单: 登录VoiceLab页面,上传至少30分钟的高质量音频... 阅读全文
优惠 视觉模型大比拼Vision Arena:看看那个模型准确率最高?
7个月前 (02-12)AI
在科技日新月异的今天,各种视觉语言模型(VLMs)如GPT-4V、Gemini、Llava、Qwen-VL等层出不穷,它们各具特色,各有千秋。但究竟哪个模型更胜一筹呢?一个专为视觉模型打造的竞技场Vision Arena在Hugging Face上线。你可以轻松测试并比较不同的视觉模型。更激动人心的是,你可以同时测试两... 阅读全文