MCTSr

优惠 MCTSr算法:将大语言模型与蒙特卡洛树搜索(MCTS)结合起来的创新方法

  • MCTSr算法:将大语言模型与蒙特卡洛树搜索(MCTS)结合起来的创新方法
    AI
  • 复旦大学和上海AI实验室发布MCT Self-Refine(MCTSr)算法,它是一种将大语言模型(LLMs)与蒙特卡洛树搜索(MCTS)结合起来的创新方法,旨在提高解决复杂数学问题的性能。这种方法特别针对大型语言模型在策略性思维和数学推理中的准确性和可靠性问题,通过系统化的探索和启发式自我改进机制,改善了LLMs内部... 阅读全文