谷歌多模态大模型,文本图像视频音频全能,与谷歌生态深度协同
谷歌自研新一代模型,支持长上下文理解与复杂推理,可处理图文视频混合输入,在科研、英文创作、逻辑分析上表现突出,能无缝调用谷歌搜索与 Workspace 工具,适合专业场景。
Δ