微软推出大型信息丰富的网络数据集MS MARCO Web Search,它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试,旨在模拟现实世界中的网页文档和查询分布,为各种类型的下游任务提供丰富的信息,并鼓励在多个研究领域进行创新,例如通用的端到端神经索引器模型、通用嵌入模型,以及使用大型语言模型的下一代信息访... 阅读全文
微软亚洲研究院发布论文,探讨在基于Transformer的语言模型(LLMs)中,通过自回归学习机制发展出的规划能力。项目ALPINE(Autoregressive Learning for Planning In NEtworks)旨在理论上调查Transformer模型是否能够通过自回归学习来执行规划任务,并识别其... 阅读全文