【Google I/O 2023】Google Bard 全面开放不用等！转用 PaLM2 模型，并揭晓新 Gemini 基础模型

Google I/O 发表会揭露了许多 AI 带来的功能升级，其中包括 Gmail 的新功能，Maps 的升级导航系统，以及 Google Photo 的 Magic Editor。此外，Google 也进一步介绍了 AI 技术应用的准则，包括教育知识、增强创造力、促进创意以及承担责任。

Google Maps 今年将开始支援 15 个城市的鸟瞰立体导航功能，另外 Google Photos 继魔术橡皮擦後，预计今年会上线 Magic Editor，可以直接让阴天变晴天，人物也能一键移动位置，甚至被边框切掉，没拍到的部分也可以补上。

在 LLM 工具方面，Google Bard，已经学习 20 多种程式语言，包括 Excel 公式，并支援 Google 服务和夥伴的外挂。在 Colab 也可以直接使用 Bard 辅助编写程式，预计从 Python 开始支援，并且支援黑暗模式。生成的结果可以一键导入到 Gmail。

Bard 也支援一系列的 Google apps 和第三方服务。搜寻方面，透过与 Bard 结合，使用者可以输入自然语言查询并提供相关图片、替自己的照片生成叙述并提供答案，例如推荐学系并将对应的学校标注在地图上，还能将学系推荐结果整理成表格，并透过指令新增栏位。Bard 也支援第三方服务，例如 Adobe Firefly，可以直接用文字生成图像。

Bard 也正式宣布结束等候清单机制，开放给超过 180 个地区使用，并将支援更多语言，包括日文与韩文，接下来还有超过 40 种语言的支援正在路上，也包括中文。

AI 模型方面，Google 现在已释出预览版的 PaLM2 多模态模型。而 Google Bard 也将转用 PaLM2。PaLM2 模型由小到大名称为 Gecko、Otter、Bison、Unicorn，其中最小的 Gecko 轻量到可以在本地装置执行。PaLM2 强调推理能力，能够算数学和多任务执行，并在 100 多种语言上训练，能够产生更细致的结果。会中范例展示了 PaLM2 解释一段程式码命且用韩文加上注释。另外还有针对医药领域的 Med-PaLM2，还能辨识医学影像，比如 X 光片的解读，帮助医生诊断参考。

另外，Google 提到 Gemini 基础模型，由日前合并的 Google Brain 和 DeepMind 合作研发，具有多模型架构，在推理和数学能力上更强，适合记忆和规划能力。此模型生产的内容加入可以被辨识机制，包括 AI 浮水印和 metadata 等。

Google I/O 发表会带来了许多 AI 技术应用，转用 PaLM2 的 Bard 功能也将更加多元化和细致化。

核稿编辑：Jocelyn

Related Posts