AI

优惠 OpenAI公开AI视频生成模型Sora,可创建长达 60 秒的视频

  • OpenAI公开AI视频生成模型Sora,可创建长达 60 秒的视频
    AI
  • OpenAI公开了AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。以下是介绍: 模型介绍: 功能特点: Sora能够创建包含多个角色、特定运动动作以及细腻主题和背景细节的复杂场景。它不仅能解析文本说明,还能深刻理解这些元素如何在物理... 阅读全文

    优惠 Google推出新一代模型Gemini 1.5,具有100万token的上下文理解能力

  • Google推出新一代模型Gemini 1.5,具有100万token的上下文理解能力
    AI
  • Google推出新一代模型Gemini 1.5,该模型在处理能力和跨模态理解上取得显著提升。该模型具有惊人的100万个token的上下文理解能力,成为目前市场上最强大的模型之一。 主要特点: 超强的上下文处理:Gemini 1.5可以处理高达100万个token的连续信息,为大型基础模型设立了最长的上下文窗口记录。 跨... 阅读全文

    优惠 能够与操作系统进行交互的智能代理框架OS-Copilot

  • 能够与操作系统进行交互的智能代理框架OS-Copilot
    AI
  • 来自上海人工智能实验室、华东师范大学、普林斯顿大学、香港大学的研究人员推出智能代理框架OS-Copilot,它旨在构建能够与操作系统(OS)中各种元素交互的通用计算机代理。这些代理能够处理网络、代码终端、文件、多媒体以及各种第三方应用程序。OS-COPILOT框架的核心是创建了一个名为FRIDAY的自改进实体代理,用于... 阅读全文

    优惠 美国国家生物技术信息中心推出医疗大模型GeneGPT:教授大语言模型回答基因学问题

  • 美国国家生物技术信息中心推出医疗大模型GeneGPT:教授大语言模型回答基因学问题
    AI
  • 美国国家生物技术信息中心(NCBI)开发推出医疗大模型GeneGPT(基因GPT) ,旨在通过结合大语言模型(LLMs)和国家生物技术信息中心(NCBI)的Web API,来提高对生物医学信息的访问效率和准确性。GeneGPT的核心功能是帮助用户通过自然语言处理(NLP)技术,更轻松地解答与基因组学相关的问题。具体来说... 阅读全文

    优惠 AgentKit:快速构建高质量的AI代理应用

  • AgentKit:快速构建高质量的AI代理应用
    AI
  • AgentKit 是由 BCG X 开发的一款 LangChain / FastAPI / Next.js14 工具包,用于构建 Agent。开发人员可以使用 AgentKit 快速构建高质量、可扩展至生产级应用的 Agent 应用。 AgentKit 的主要优势包括: 🚀 快速构建高质量 Agent 应用:模块化、易... 阅读全文

    优惠 图像生成模型大比拼GenAI-Arena :看看那个模型生成图片最好看?

  • 图像生成模型大比拼GenAI-Arena :看看那个模型生成图片最好看?
    AI
  • 之前给大家介绍过《视觉模型大比拼Vision Arena》,今天再给大家推荐一个AI绘画模型竞技场GenAI-Arena ,这个项目就是借鉴Vision Arena,在竞技场你可以测试并比较不同的图像生成模型(例如,在文本引导的图像生成模型中的LCM、SDXL、SDXL-turbo,以及在文本引导的图像编辑模型中的Ma... 阅读全文

    优惠 英伟达推出本地AI聊天机器人「Chat With RTX」,可在 RTX 30 和 40显卡上免费使用

  • 英伟达推出本地AI聊天机器人「Chat With RTX」,可在 RTX 30 和 40显卡上免费使用
    AI
  • 全球每天有数百万人使用AI聊天机器人,这些机器人由基于NVIDIA GPU的云服务器提供支持。如今,这些创新性的工具搭载NVIDIA RTX,为本地Windows PC用户带来快速、定制化的生成式AI体验。「Chat With RTX」是一款可免费下载的技术演示软件,允许用户根据自己的内容个性化定制聊天机器人。通过搭载... 阅读全文

    优惠 基于AI的视频转录工具Podstellar:三分钟内将YouTube视频转化为文字,并生成简洁的摘要或逐字稿

  • 基于AI的视频转录工具Podstellar:三分钟内将YouTube视频转化为文字,并生成简洁的摘要或逐字稿
    AI
  • 在这个信息爆炸的时代,我们每天都在与大量的视频内容打交道。有时,我们可能更需要文字版的摘要来快速了解视频内容。Podstellar 是一款基于AI的视频转录工具,它能在短短三分钟内将YouTube视频转化为文字,并生成简洁的摘要或逐字稿。这意味着,用户只需复制YouTube视频的链接,粘贴到Podstellar的相应位... 阅读全文

    优惠 借助英特尔免费OpenVINO AI插件包,Audacity 现已获得 AI 音频编辑功能

  • 借助英特尔免费OpenVINO AI插件包,Audacity 现已获得 AI 音频编辑功能
    AI
  • 作为一款广受赞誉的跨平台免费开源音频编辑软件Audacity,因其开放源码的特性吸引了全球开发者共同参与改进与创新。近期,英特尔为Audacity用户推出了一款专为音乐编辑和播客制作人打造的免费OpenVINO AI插件包,该插件在Intel的GitHub页面上提供下载,大小约为2GB,并且要求运行环境为64位Wind... 阅读全文

    优惠 Keras-llm-robot Web UI:可离线部署和测试Huggingface网站上的大部分开源模型

  • Keras-llm-robot Web UI:可离线部署和测试Huggingface网站上的大部分开源模型
    AI
  • Keras-llm-robot Web UI基础代码继承自 Langchain-Chatchat项目底层架构使用Langchain和Fastchat等开源框架,顶层使用streamlit实现。本项目完全开源,目标是可离线部署和测试Huggingface网站上的大部分开源模型,并且可以通过配置将多个模型组合起来,实现多模... 阅读全文

    优惠 你的声音能赚钱?ElevenLabs带你开启声音变现之旅!

  • 你的声音能赚钱?ElevenLabs带你开启声音变现之旅!
    AI
  • 美国AI语音初创公司 ElevenLabs革新配音行业,你的声音也可以赚钱了!现在只需在ElevenLabs旗下的VoiceLab上传30分钟个人音频样本,即可创建并分享您的专属AI声音模型至ElevenLabs的声音库,并在用户使用时获得收益。操作步骤非常简单: 登录VoiceLab页面,上传至少30分钟的高质量音频... 阅读全文

    优惠 视觉模型大比拼Vision Arena:看看那个模型准确率最高?

  • 视觉模型大比拼Vision Arena:看看那个模型准确率最高?
    AI
  • 在科技日新月异的今天,各种视觉语言模型(VLMs)如GPT-4V、Gemini、Llava、Qwen-VL等层出不穷,它们各具特色,各有千秋。但究竟哪个模型更胜一筹呢?一个专为视觉模型打造的竞技场Vision Arena在Hugging Face上线。你可以轻松测试并比较不同的视觉模型。更激动人心的是,你可以同时测试两... 阅读全文