微软

优惠 微软推出评估平台WINDOWSAGENTARENA:专门用来测试和提升计算机代理在Windows操作系统中执行多模态任务的能力

  • 微软推出评估平台WINDOWSAGENTARENA:专门用来测试和提升计算机代理在Windows操作系统中执行多模态任务的能力
    AI
  • 微软、卡内基梅隆大学和哥伦比亚大学的研究人员推出评估平台WINDOWSAGENTARENA,它专门用来测试和提升计算机代理(也就是我们通常说的“智能助手”或“机器人”)在Windows操作系统中执行多模态任务的能力。这些任务包括但不限于文本处理、网页浏览、使用各种应用程序等。 项目主页:https://microsof... 阅读全文

    优惠 Phi-3 Safety Post-Training:调整和优化他们开发的Phi-3系列小型语言模型

  • Phi-3 Safety Post-Training:调整和优化他们开发的Phi-3系列小型语言模型
    AI
  • 微软发布论文,论文的主题是关于如何确保语言模型在实际应用中既安全又符合人类的偏好和安全考虑。具体来说,论文介绍了微软公司如何通过一系列的方法和步骤,来调整和优化他们开发的Phi-3系列小型语言模型(SLMs),使其在各种场景下生成的内容更加安全和负责任。通过这种“破坏-修复”的迭代过程,微软能够显著提高Phi-3模型在... 阅读全文

    优惠 微软推出基于知识图谱的检索增强生成(RAG)开源项目GraphRAG

  • 微软推出基于知识图谱的检索增强生成(RAG)开源项目GraphRAG
    AI
  • GraphRAG是由微软推出的一个基于知识图谱的检索增强生成(RAG)技术项目,旨在通过构建知识图谱来增强大语言模型(LLM)在处理复杂查询时的性能。该项目已在GitHub上开源,并迅速获得了广泛的关注和积极的评价。GraphRAG的设计理念是将非结构化的文本数据转换为结构化的图谱形式,使得模型能够更深入地挖掘数据间的... 阅读全文

    优惠 微软推出T-MAC,在边缘设备上高效部署大语言模型

  • 微软推出T-MAC,在边缘设备上高效部署大语言模型
    AI
  • 微软推出T-MAC,在边缘设备上高效部署大语言模型(LLMs)。例如,我们想让智能手机、平板电脑或者家里的智能音箱能够更好地理解我们说的话,并且给出智能的回答,就需要在这些设备上运行一些非常复杂的算法,这些算法就是大型语言模型。但是,这些模型因为非常复杂,所以它们需要很多内存和计算能力,这对于边缘设备来说是个挑战。 论... 阅读全文

    优惠 微软推出全新文本到语音转换系统E2 TTS:非自回归的零样本(zero-shot)文本到语音合成技术

  • 微软推出全新文本到语音转换系统E2 TTS:非自回归的零样本(zero-shot)文本到语音合成技术
    AI
  • 微软推出全新文本到语音转换系统E2 TTS(Embarrassingly Easy Text-to-Speech),这是一种非自回归(non-autoregressive)的零样本(zero-shot)文本到语音合成技术,意味着它能够在没有特定训练数据的情况下,模仿任何人的声音来生成自然听起来的语音。E2 TTS的提出... 阅读全文

    优惠 微软推出LiveSpeech系统:低延迟的零样本TTS合成技术

  • 微软推出LiveSpeech系统:低延迟的零样本TTS合成技术
    AI
  • 微软推出LiveSpeech系统,它是一种低延迟的零样本(zero-shot)文本到语音(Text-to-Speech, TTS)合成技术。零样本意味着系统可以在没有特定说话人数据训练的情况下,模仿任何人的声音来生成语音。这项技术特别适用于需要快速响应的实时或低延迟场景,例如实时翻译、口音转换、语音简化或去除语言不流畅... 阅读全文

    优惠 微软推出电报Copilot:整合 AI 助手于Telegram中

  • 微软推出电报Copilot:整合 AI 助手于Telegram中
    AI
  • 微软在人工智能领域不断创新,去年将Bing AI(现更名为Microsoft Copilot)集成到了Microsoft Edge浏览器中,随后又推出了Suno AI音乐创作功能,用于制作个性化歌曲。确实,Copilot是一个非常实用的AI工具,它采用了OpenAI的GPT-4模型。如果使用频率不高,Copilot无疑... 阅读全文

    优惠 微软PowerToys v0.81.0 新增带 AI 的高级粘贴(Advanced Paste)功能

  • 微软PowerToys v0.81.0 新增带 AI 的高级粘贴(Advanced Paste)功能
    工具
  • PowerToys v0.81.0 新增了一个带 AI 的高级粘贴(Advanced Paste)功能,它可以根据剪贴板内容以及提交给 AI 的提示词来决定最终粘贴的内容,需要 OpenAI API 密钥,还能直接将文本粘贴为 JSON、Markdown、纯文本。@Appinn Advanced Paste 实际上提供... 阅读全文

    优惠 微软Build 2024开发者大会发布Phi-3-vision模型,可在小型设备上运行

  • 微软Build 2024开发者大会发布Phi-3-vision模型,可在小型设备上运行
    AI
  • 在微软Build 2024开发者大会上,微软公布了Phi-3-vision模型,它小巧到足以在手机上执行,同时具备出色的视觉能力,能够理解文字和图片。Phi-3-vision是4月公布的Phi-3模型家族的最新成员,拥有42亿参数,介于Phi-3-mini(3.8亿)和Phi-3-small(7亿)之间。作为Phi-3... 阅读全文

    优惠 微软推出大型信息丰富的网络数据集MS MARCO Web Search

  • 微软推出大型信息丰富的网络数据集MS MARCO Web Search
    AI
  • 微软推出大型信息丰富的网络数据集MS MARCO Web Search,它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试,旨在模拟现实世界中的网页文档和查询分布,为各种类型的下游任务提供丰富的信息,并鼓励在多个研究领域进行创新,例如通用的端到端神经索引器模型、通用嵌入模型,以及使用大型语言模型的下一代信息访... 阅读全文

    优惠 微软发布自动化音频描述生成系统LLM-AD

  • 微软发布自动化音频描述生成系统LLM-AD
    AI
  • 微软发布自动化音频描述(Audio Description,简称AD)生成系统LLM-AD,音频描述是一种为视频内容添加的旁白,用以描述视频中的视觉元素,这对于视觉障碍人士来说尤其重要,因为它帮助他们更好地理解和享受视频内容。通过这种方式,LLM-AD系统能够自动化地生成音频描述,提高视频内容的可访问性,并为视觉障碍人... 阅读全文

    优惠 微软推出TnT-LLM框架:利用大语言模型(LLMs)来进行文本挖掘的工具

  • 微软推出TnT-LLM框架:利用大语言模型(LLMs)来进行文本挖掘的工具
    AI
  • 微软和华盛顿大学的研究团队发布TnT-LLM框架,它是一个利用大语言模型(LLMs)来进行文本挖掘的工具。文本挖掘是指从大量文本数据中提取有用信息和见解的过程,这对于数据分析和应用至关重要。想象一下,你有一个巨大的聊天记录数据库,你想理解用户在对话中的主要意图和讨论的主题。传统的方法是通过人工来标记和分类这些文本,但这... 阅读全文