GLaDOS Personality Core 项目致力于构建一个真实版本的 GLaDOS,这个项目包含硬件和软件两个部分,旨在创建一个有意识、互动性强、具有实体形态的 GLaDOS。(PS:GLaDOS是著名游戏公司Valve所开发的游戏《传送门(Portal)》及其续作《传送门2(Portal2)》中的一个人工智能角色。)
软件架构
初始目标: 开发一个低延迟平台,使得 GLaDOS 能够在 600 毫秒内响应语音交互。
实现方式:
- 系统持续将数据记录到一个循环缓冲区,等待检测到语音。
- 当确定语音停止(包括检测到正常的暂停)时,会迅速进行转录。
- 转录后的内容会传递给一个本地的大型语言模型(Large Language Model),流式传输的文本会按句子分割。
- 分割后的句子会传递给文本到语音(Text-to-Speech, TTS)系统。这意味着在当前句子播放的同时,可以生成后续句子,从而大幅降低延迟。
子目标:
- 项目的另一个目标是最小化依赖,以便能够在资源受限的硬件上运行。这意味着不使用 PyTorch 或其他大型软件包。
- 为了完全理解系统,移除了大量的重定向,包括提取和重写代码。例如,由于 GLaDOS 仅使用英语,因此重写了围绕 espeak 的包装器,整个文本到语音子系统大约有 500 行代码(LOC),且只有 3 个依赖:numpy、onnxruntime 和 sounddevice。
硬件系统
基础:
- 基于伺服电机和步进电机。
组成部分:
- 提供可3D打印的 STL 文件,用于创建 GLaDOS 的身体。
- GLaDOS 将被赋予一组动画,用以表达自己。
- 视觉系统将使她能够追踪并转向感兴趣的人和物体。
项目意义
这个项目不仅仅是技术上的挑战,也是对人工智能交互性和物理呈现形式的探索。通过创建一个实体的、能够进行复杂交互的 AI,GLaDOS Personality Core 项目试图推动人机交互的界限,并为未来可能的 AI 应用提供灵感。
0条评论