【Google I/O 2023】Google Bard 全面开放不用等!转用 PaLM2 模型,并揭晓新 Gemini 基础模型

Google I\/O 发表一系列 AI 功能,旗下的 ChatGPT 挑战者 Google Bard 也转用 PaLM2 模型并更完整结合 Google 软体生态系。

Google I/O 发表会揭露了许多 AI 带来的功能升级,其中包括 Gmail 的新功能,Maps 的升级导航系统,以及 Google Photo 的 Magic Editor。此外,Google 也进一步介绍了 AI 技术应用的准则,包括教育知识、增强创造力、促进创意以及承担责任。

Google Maps 今年将开始支援 15 个城市的鸟瞰立体导航功能,另外 Google Photos 继魔术橡皮擦後,预计今年会上线 Magic Editor,可以直接让阴天变晴天,人物也能一键移动位置,甚至被边框切掉,没拍到的部分也可以补上。

在 LLM 工具方面,Google Bard,已经学习 20 多种程式语言,包括 Excel 公式 ,并支援 Google 服务和夥伴的外挂。在 Colab 也可以直接使用 Bard 辅助编写程式,预计从 Python 开始支援,并且支援黑暗模式。生成的结果可以一键导入到 Gmail。

Bard 也支援一系列的 Google apps 和第三方服务。搜寻方面,透过与 Bard 结合,使用者可以输入自然语言查询并提供相关图片、替自己的照片生成叙述并提供答案,例如推荐学系并将对应的学校标注在地图上,还能将学系推荐结果整理成表格,并透过指令新增栏位。Bard 也支援第三方服务,例如 Adobe Firefly,可以直接用文字生成图像。

Bard 也正式宣布结束等候清单机制,开放给超过 180 个地区使用,并将支援更多语言,包括日文与韩文,接下来还有超过 40 种语言的支援正在路上,也包括中文。

AI 模型方面,Google 现在已释出预览版的 PaLM2 多模态模型。而 Google Bard 也将转用 PaLM2。PaLM2 模型由小到大名称为 Gecko、Otter、Bison、Unicorn,其中最小的 Gecko 轻量到可以在本地装置执行。PaLM2 强调推理能力,能够算数学和多任务执行,并在 100 多种语言上训练,能够产生更细致的结果。会中范例展示了 PaLM2 解释一段程式码命且用韩文加上注释。另外还有针对医药领域的 Med-PaLM2,还能辨识医学影像,比如 X 光片的解读,帮助医生诊断参考。

另外,Google 提到 Gemini 基础模型,由日前合并的 Google Brain 和 DeepMind 合作研发,具有多模型架构,在推理和数学能力上更强,适合记忆和规划能力。此模型生产的内容加入可以被辨识机制,包括 AI 浮水印和 metadata 等。

Google I/O 发表会带来了许多 AI 技术应用,转用 PaLM2 的 Bard 功能也将更加多元化和细致化。

核稿编辑:Jocelyn

红海pro怎么用

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
最旧
最新 最多投票
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x