Google于当日时间周二(5/14)举行的Google I/O开发者大会上,发表了十多项全新或改善的服务与产品,几乎全都围绕着AI,包括推出新的文字生成视频模型 Veo,第六代的Google Cloud TPU──Trillium,开源视觉语言模型PaliGemma,于Gemini模型家族增添Gemini 1.5 Flash,以及于搜寻中整合AI Overviews,于Google Photo中嵌入Ask Photos with Gemini等。
Trillium TPU:性能飞跃
Google的第六代云端张量处理单元(TPU)——Trillium,运算速度是前代的4.7倍,能效提高了67%。这一突破将为AI模型训练和高性能计算任务提供强大支持。
Gemini 1.5 Flash:更高效的AI模型
Google的Gemini模型家族新增了Gemini 1.5 Flash,它在保持高效的同时,特别优化了处理大规模数据的能力,为开发者提供了更快的API体验。
Veo:文字到视频的魔术师
Google的新模型Veo能够将文字描述转化为高清视频,支持多种风格,让视频创作变得触手可及。
PaliGemma:视觉信息的翻译家
开源的视觉语言模型PaliGemma能够将图像信息转化为文字,支持多种视觉语言任务,为资源受限的设备带来AI的力量。
AI Overviews与Ask Photos with Gemini:搜索与相册的智能升级
Google将AI技术整合到搜索服务和Google Photos中,AI Overviews帮助用户快速找到全面的信息,而Ask Photos with Gemini则让照片检索变得更加智能和简单。
这些新服务和产品将在不久的将来逐步推出,部分功能目前处于封闭预览阶段,我们拭目以待,看看它们如何改变我们的世界。
0条评论