据路透社报道,TikTok 的母公司字节跳动正在筹划开发一个新的 AI 模型,并计划使用华为的昇腾910B 芯片进行训练。这一举动是在美国对先进 AI 芯片出口到中国的限制日益严格之后采取的。
美国出口限制下的应对策略
自 2022 年起,美国对先进 AI 芯片的出口实施了严格监管,促使字节跳动寻找替代方案。为应对这一挑战,字节跳动开始多样化其供应链,并转向本地供应商以满足 AI 芯片需求,从而推动自身技术的发展。
使用昇腾910B 芯片训练大语言模型
根据路透社报道,字节跳动的新项目将主要依赖华为的昇腾910B 芯片来训练一个大型语言模型(LLM)。尽管这些芯片目前主要用于计算密集度较低的任务,如推理,但在昇腾910B 上训练新模型可能会遇到一定困难,因为这通常需要更强大的硬件来处理大量的数据。
芯片供应受限
字节跳动已向华为订购了超过 10 万片昇腾910B 芯片,但截至 2024 年 7 月,仅收到不到 3 万片。这进一步延迟了字节跳动的新模型开发进度。
现有AI产品
- 豆包聊天机器人:字节跳动现有的大语言模型之一,自 2023 年 8 月推出以来,在中国广受欢迎,月活跃用户超过 1000 万。
- 视频生成模型:公司近期发布了两款能够生成视频的新模型,类似于 OpenAI 的 Sora,但尚未面向公众开放。
否认新模型开发
尽管有上述报道,字节跳动已公开否认了所有关于计划新 AI 模型的说法。TikTok 驻华盛顿特区的发言人 Michael Hughes 向路透社表示,“整个前提都是错误的”,并坚称目前没有新模型正在开发中。
继续依赖英伟达芯片
值得注意的是,字节跳动仍然是微软在亚洲最大的英伟达芯片客户,这些芯片可以通过 Azure 平台获得。随着贸易限制持续影响其 AI 发展计划,字节跳动仍在寻找途径推进其技术革新。
0条评论