AI趋势周报第213期：HuggingFace开源聊天机器人，犹如ChatGPT复制版

HuggingFace

重点新闻(0421～0427)

HuggingFace ChatGPT HuggingChat

HuggingFace开源聊天机器人HuggingChat，号称媲美ChatGPT

知名AI新创暨开源社群HuggingFace刚开源一款聊天机器人HuggingChat，一般使用者可拿来对话、写程式、写电子邮件甚至是饶舌歌词，开发者则能用开源程式码来打造更多应用，或用HuggingFace的API来串接第三方App。

这款聊天机器人采用Open Assistant开源助理专案的模型，该专案是由德国一间非营利组织LAION发起，该组织因建立文字转图像AI模型Stable Diffusion的训练资料而闻名。Open Assistant的目的要提供可在通用硬体上执行的对话式AI，且要能根据个人需求来个人化回答。目前，Open Assistant模型以Meta的大型语言模型LLaLM为基础来运行，但长期计画是要采用各类大型语言模型，来提供更强大的对话功能。（详全文）

CancerGPT 癌症协同作用

美国大学联手打造CancerGPT，可良好预测癌症药物协同作用

美国德州大学、麻州大学阿默斯特分校以及德州大学健康科学中心联手打造一款大型语言模型CancerGPT，拥有1.24亿参数，可预测一组组药物在特定人体组织中的协同作用（Synergy），甚至其少样本预测的能力，可比具1,750亿参数的GPT-3。

进一步来说，长年的实验证明，多种药物组合比单一药物的治疗还有效，特别是对癌症、神经系统失调等疾病。但要找出合适的药物组合，仍是一大挑战。监於目前的药物研究侧重於预测药物协同作用，美国几所大学研究团队决定采用大型语言模型，利用模型已具备的科学知识，再透过小样本训练，来预测药物协同作用。经测试，团队发现，CancerGPT即使在零样本条件下，也能获得相当高的准确性，替通用生物医学AI埋下伏笔。（详全文）

Google Bard 除错

Google Bard也能帮写程式码和除错了

Google持续强化聊天机器人Bard，最近宣布Bard可协助开发者撰写程式码和除错了。今年3月，Google才以预览版开放美、英少数用户申请试用Bard，现在，除了草拟文章、邀请函、整理会议待办事项、解答使用者提问功能外，还新添开发辅助功能，像是生成程式码、为程式码除错及提供解释的能力。

Google表示，Bard支援C++、Go、Java、Javascript、Python和Typescript等20多种程式语言。开发者可将Python程式码汇出到线上Python编辑器Google Colab，不需复制贴上。此外，Bard还可协助Google Sheets试算表的函式撰写，甚至在程式除错部分，还能更正自己撰写的程式码。（详全文）

李长荣化工污水处理

台湾老字号化工厂靠AI每日多处理3倍污水量

成立将近60年的李长荣化工，近日揭露如何用AI提高制程中水回收效率，达到年省437万公吨工厂用水，相当於1,750座奥运池。李长荣化工以生产医疗、工业及家庭用品常用的聚丙烯、甲醇、溶剂和热可塑性橡胶为主，在制程中，许多环节都需要消耗大量的水资源。为了节水，他们很早就导入MBR废水处理系统，来在制程中重复使用。

不过，工厂制程废水处理，得靠一群生长在⽣物净化池里的活性菌种，来处理污水中的微⽣物。为让养菌更容易，李长荣化工IT团队打造一套AI驯养控制系统，可根据菌种曝气池中的环境数据，如溶氧值，来掌握菌种的活动状态、决定何时该曝气，以此提高水中含氧量，让菌种的活动力维持在最佳状态，提高污水处理的品质。他们也发现，导入这套系统後，制程污水处理效率大幅提升，从2021年每天平均处理3,661立方公尺，到2023年的每日11,866立方公尺排放量，迄今更可做到年省437万公吨的工厂用水。（详全文）

资安生成式AI 情资分析

Google也用生成式AI强化自家资安解决方案了

Google更新自家安全解决方案，在Security AI Workbench、VirusTotal Code Insight和Mandiant Breach Analytics for Chronicle等三大资安服务中整合大型语言模型Sec-PaLM，来新添情资分析等功能。

比如在Security AI Workbench平台中，Sec-PaLM就用来提供威胁态势、Mandiant漏洞、恶意软体、威胁指标和威胁参与者基本资料等讯息。再来，用户可申请使用安全解决方案VirusTotal Code Insight预览，来享有Sec-PaLM加持的恶意脚本行为分析和解释功能。而Mandiant Breach Analytics for Chronicle也整合Sec-PaLM，让用户不需要学习新语法，就能用自然语言搜寻安全事件，并进一步分析搜寻结果，或快速建立扫描任务。

不只如此，Google安全指挥中心也用Sec-PaLM，来将复杂的攻击图转换为人类可读的攻击解释，说明可能受影响的资产和建议解方，同时还能对安全、法遵和隐私生成风险摘要。（详全文）

莫德纳量子电脑新药发现

莫德纳药厂要用生成式AI和量子运算来探索新药

美国莫德纳药厂（Moderna）日前宣布要用IBM的生成式AI和量子运算技术，来加强mRNA研究与药物开发。进一步来说，莫德纳将使用IBM的基础模型MoLFormer，来预测化学分子属性，帮助研究团队了解mRNA药物的特性。

其中，MoLFormer是一个大型化学语言模型，可根据小型分子的活动来训练。团队希望透过该模型，来最佳化保护mRNA的脂质奈米粒，并用生成式AI来改良配方，设计出最安全有效的mRNA药物。同时，莫德纳也将加入IBM量子加速器计画和IBM量子网路，来使用IBM量子运算系统进行生技研究。（详全文）

通用AI DeepMind Google

Google整并AI研发部门，专攻通用AI

Google执行长Sundar Pichai宣布合并Alphabet子公司DeepMind和Google研究院的Google Brain部门，成立新事业群Google DeepMind，全力发展AI技术。这个新事业群，将由DeepMind执行长Demis Hassabis掌舵，将带头开发负责任通用型AI系统，而Google Brain领导人Jeff Dean则升为Google研究院及DeepMind首席科学家，负责带领关键AI技术专案，如多模态AI模型开发。

此外，Google DeepMind将整合Google Brain和DeepMind的AI研发成果，包括AlphaGo、Transformer、文字表示模型word2vec、音讯波形深度生成模型WaveNet、蛋白质结构预测模型AlphaFold、序列到序列模型、蒸馏技术、深度强化学习、分散式系统及TensorFlow、JAX等用於表徵、训练及部署大型ML模型的软体框架。（详全文）

Stability AI 生成式AI 大型语言模型

Stability AI开源数十亿参数LLM模型，虽小但高效能

AI新创公司Stability AI最近开源可生成文字和程式码的大型语言模型（LLM）StableLM，包括30亿参数和70亿参数版本的模型，之後还会新添150亿和650亿参数的版本。Stability AI表示，StableLM作为基础模型，可产生文字和程式码，衍生多种应用，证实小模型只要经适当训练，也能高效能产出。

StableLM的训练资料来自The Pile的最新实验性资料集，内容含1.5兆个token，资料集相当丰富。也因此，即使StableLM模型只有30亿到70亿个参数，但能在对话和写程式任务上能提供极高效能。此外，Stability AI也将开源经指令微调的研究模型，这组模型将使用近日开源的5个聊天机器人的综合资料集来训练，包括Alpaca、GPT4AII、Dolly、ShareGPT和HH等。（详全文）

图片来源／德州大学、Google

摄影 / 余至浩

AI近期新闻

1. Meta开源可以把素描变成动画的AI专案Animated Drawings

2. Amazon推出云端AI模型平台Bedrock、大型语言模型Titan

资料来源：iThome整理，2023年4月

Related Posts