IBM 使用基础模型和生成式 AI 展示开创性的 AI 研究
人工智能(AI)在行业变革和科学研究方面发挥了重要作用。在 AI 研究中取得惊人进步的一个领域是基础模型和生成式 AI,这使得计算机能够根据输入数据生成原始内容。
最近,OpenAI 通过免费提供最先进的生成式 Transformer 模型:ChatGPT,展示了 AI 令人印象深刻的能力。此举引起了媒体的广泛关注,并在用户中引起了兴奋,凸显了 AI 的巨大潜力。
面对 OpenAI 的 GPT-3 模型的颠覆性影响,谷歌和微软公布了各自搜索引擎的 AI 集成计划。OpenAI 对 AI 实用而强大能力的展示,无疑会提升公众对未来更先进 AI 产品的期待和需求。OpenAI 的举动引发了行业领域有史以来最快、最重大的颠覆之一。
人的生命是最重要的。在这篇文章中,作者通过研究 AI 在创造新抗生素和其他科学 AI 工具方面的实际应用,阐明了 AI 拯救生命的潜力。基础模型和生成式 AI 的创新使用能够增加收入、优化流程并简化知识的创造和积累,但它也有可能挽救全世界数百万人的生命。本次讨论旨在提高人们对 AI 拯救生命潜力的重要性的认识,并强调在这些领域扩大其开发和部署的必要性。
从简单的算法到突破性的进步
AI 在 20 世纪 50 年代的开端相当简单。它解决了为特定任务设计的简单算法和数学模型。很久以后,在 20 世纪 90 年代,AI 研究经历了向机器学习算法的重大转变,机器学习算法使计算机能够通过分析数据模式并将这些知识转移到新的应用程序来提高性能。这种转变带来了该领域的众多突破,包括深度学习算法的开发,这些算法彻底改变了计算机视觉和自然语言处理 (NLP) 等领域。这些进步带来了更多新成就,进一步拓展了 AI 的潜力。
如今,AI 研究人员通过开发新的算法和模型来解决日益复杂的任务,不断突破边界。AI 和模型的大小继续以前所未有的速度发展,产生更像人类的反应,并扩大它可以执行的任务范围。在 NLP、计算机视觉和机器人技术等领域仍在不断取得突破和应用。尽管存在局限性和挑战,但AI已被证明是跨越众多行业和领域的变革力量,包括医疗保健、金融、交通和教育。
IBM 发明大师的尖端 AI 研究
IBM 拥有世界上最大、资金最充足的 AI 研究项目之一,作者最近与 IBM Research 的主要研究人员兼经理 Payel Das 博士讨论了她的项目,她也是 IBM 的发明大师。
作为 Trustworthy AI 部门的成员和 IBM Research 的生成式 AI 负责人,Das 博士目前专注于开发新的算法、方法和工具,以开发从基础模型创建的生成式 AI 系统。
她的团队还致力于使用合成数据使 AI 模型更值得信赖,并确保下游 AI 应用程序的公平性和稳健性。
合成数据的力量及其如何推动 AI 发展
在这个数据驱动的时代,合成数据已成为测试和训练 AI 模型不可或缺的工具。这种计算机生成的信息的生产成本效益高,带有自动标签,并且避免了与在真实世界数据上训练深度学习模型相关的许多道德、后勤和隐私方面的挑战。
合成数据对于业务应用程序至关重要,因为它可以在真实数据稀缺或不足时提供解决方案。合成数据的主要优势之一是它能够大量生成,使其成为训练 AI 模型的理想选择。此外,可以将合成数据设计为包含各种变体和示例,从而提高模型的泛化性和可用性。这些属性使合成数据成为推动 AI 及其实际应用的不可或缺的工具。
至关重要的是,生成的合成数据必须遵守用户定义的控制,以确保其达到预期目的并将潜在风险降至最低。所需的具体控制取决于预期的应用和期望的结果。确保合成数据与这些控制保持一致对于保证其在实际应用中的有效性和安全性至关重要。
用通用表示模型改变未来
Transformer 已被广泛用于许多不同的应用程序,并被证明对处理复杂数据非常有效,例如自然语言。
第一个 AI 模型使用前馈神经网络,它在非序列数据建模方面非常有效。但是,它们不具备处理顺序数据的能力。为了克服这一限制,循环神经网络 (RNN) 在 20 世纪 90 年代被开发出来,但直到 21 世纪 10 年左右才得到广泛应用。
这一技术突破扩展了 AI 处理顺序数据的能力,并为该领域的进一步发展铺平了道路。然后是另一种称为 Transformer 的 AI 模型,从根本上提高了 AI 能力。
Transformer 首次出现在 2017 年谷歌的一篇研究论文中,该论文提出了一种新型的神经网络架构。Transformer 还结合了自我注意机制,使模型能够专注于输入的相关部分并做出更准确的预测。
自注意力机制是将 Transformer 与其他编码器-解码器架构区分开来的定义特征。这种机制被证明在自然语言处理中特别有用,因为它使模型能够掌握句子中单词之间的关系并识别长期依赖关系。Transformer 根据其与任务的相关性,通过为序列中的每个元素分配权重来实现这一点。这样,该模型可以优先考虑输入中最关键的部分,从而产生更多的上下文感知和明智的预测或决策。自注意力机制的集成极大地提高了 AI 模型在自然语言处理方面的能力。
根据 Das 博士的说法,近年来,RNN 已经不再是自然语言处理任务的主要架构。RNN 可能难以训练并且可能会遇到梯度消失问题,这使得学习语言数据中的长期依赖性变得具有挑战性。相比之下,transformer 已被证明可以更有效地在各种自然语言处理任务上实现最先进的结果。
释放基础模型的力量
使用大规模数据和自我监督技术训练的模型可以产生不特定于任何特定任务的通用表示。然后可以在各种其他应用程序中使用此表示,而无需进一步调整。
这些模型被称为「基础模型」,这是斯坦福大学在 2021 年的一篇研究论文中创造的一个术语。当今的许多基础模型都采用了 Transformer 架构,并已证明在广泛的自然语言处理 (NLP) 任务中具有通用性。这是由于他们对大量数据集进行了预训练,从而生成了强大的机器学习模型,可以进行部署。基础模型的使用极大地影响和改进了 NLP 领域。
论文地址:https://arxiv.org/abs/2108.07258
Das 博士和 IBM 研究团队参与了大量具有基础模型和生成 AI 的 AI 研究。
上图显示了如何使用文本作为输入数据,使用基础模型为不同领域构建模型。他们可能使用也可能不使用 Transformer 架构。在图形的左侧,显示了一个大型语言模型,它逐步将字母映射到单词、句子,最后映射到语言。
图形右侧的插图描绘了一个化学 Transformer 模型,它将原子连接到分子和化学。通过将生物或化学分子表示为文本,可以应用相同的概念来构建生物学或其他相关领域的基础模型。
需要注意的是,Transformer 架构可以适应多种领域,只要输入数据可以用文本形式表达即可。这种多功能性使 Transformer 架构成为在许多领域创建机器学习模型的宝贵工具。
借助生成式 AI 突破创造力的界限
生成模型能够为各种应用程序创建新的和独特的图像、音频或文本。这些模型还使 AI 系统能够更有效地处理复杂数据,并为在广泛的应用中使用 AI 开辟了新的可能性。
基础模型可以作为创建生成模型的强大基础,因为它们能够处理大量数据并从中学习。通过调整这些模型的参数以专注于特定任务,例如生成图像或文本,可以创建新的生成式 AI 模型,在特定领域内生成独特的内容。
Dall.E2 by OpenAIDELL E2
例如,如果目标是为艺术开发一个生成式 AI 模型,则将首先在大量艺术图像上训练一个预训练的基础模型。成功训练后,它可以用来制作新颖的原创艺术作品。上面是一个由名为 Dall.E2 的 AI 程序创建的艺术示例,以响应要求它生成 AI 所感知的人脸彩绘肖像的提示。
克服生成式 AI 中的小数据挑战
基础模型的影响远远超出 NLP。
「当我们第一次开始研究生成式 AI 时,」Das 博士说,「我们突然想到,我们的一个问题是从小数据中学习任何特定领域或任何特定行业的应用程序。」
生成式 AI 模型需要大量数据才能准确学习和生成新的相似数据。在处理小数据集时,这些模型的性能和实用性可能会受到限制。Das 博士认识到这一挑战,并了解迁移学习和数据增强等技术可以帮助提高他们在这些情况下的表现。
尽管小数据集对生成 AI 模型带来了挑战,但对于上图中的每个领域,企业中都存在大量未标记的数据。这些数据提供了训练自定义基础模型的机会,从而能够解决以前认为无法解决的问题。这与 IBM Research 专注于通过生成 AI 探索新的 AI 功能并突破 AI 科学的界限相一致。
广泛的生成 AI 研究
IBM 在图中所示的每个领域都做出了重大贡献。他们的工作如此广泛,很难在一篇文章中涵盖他们的所有成就。
使用生成式 AI 合成抗菌剂
AI 有可能彻底改变各个领域并加速科学进步。例如,Das 博士和她的研究团队利用 AI 开发创新的抗菌药物来对抗致命的耐药细菌。
与超级细菌的斗争
抗生素在 20 世纪 40 年代首次用于治疗严重感染。从那时起,抗生素挽救了数百万人的生命并改变了现代医学。然而,疾病预防控制中心估计,每年约有 4700 万次抗生素治疗用于不需要抗生素的感染。
抗生素的过度使用是一个严重的问题,因为它会导致由大肠杆菌和葡萄球菌等常见细菌以及 MRSA 等更危险和罕见的细菌引起的抗生素耐药性感染的发展。这些耐药性感染难以治疗,并可能导致严重后果,如败血症、器官功能障碍和死亡。
当传统的抗生素不再能够有效杀死细菌时,治疗和控制感染就变得更加困难甚至不可能。这些具有抗生素抗性的细菌(通常称为超级细菌)可以迅速传播并导致严重感染,尤其是在医院和其他医疗机构中。超级细菌也存在于环境、食物和物体表面,而且它们可以在人与人之间传播。
这是一个严重的全球健康问题。全世界每年有 700,000 人死于耐药性疾病;到 2050 年,这一数字预计将增加到每年 1000 万人死亡。
细菌如何战胜抗生素
细菌和病毒通过激活使抗生素失效的先天防御策略转变为超级细菌。这些防御机制可能涉及保护细菌并使它们能够逃脱或抵消对其存在的危险的物理、化学或生物过程。这些过程可能会产生使抗生素失活的酶,改变细菌细胞壁,使生物体对药物的反应降低,或者允许细菌从其他对抗生素具有固有免疫力的细菌获得遗传信息。
使用 AI 简化药物开发
创造一种新的抗菌药物的传统方法是一项漫长而昂贵的工作,通常需要很多年和大量资金才能在市场上买到。但 AI 的最新进展正在彻底改变药物发现和开发过程。
通过利用 AI 生成和评估众多可能的候选药物的能力,研究人员可以迅速查明最有希望的选择并将精力集中在这些选择上。这简化了药物开发过程,减少了所涉及的时间和成本,并导致以更快的速度生产更有效的抗菌药物。
研究团队提出的用于加速抗菌设计的 AI 驱动方法的概述和 48 天时间表。(来源:IBM Research,Accelerating Antimicrobial Discovery with Controllable Deep Generative Models and Molecular Dynamics. Nature Biomed. Eng., March 2021.)
在 Das 博士和她在 IBM 的团队以及其他组织的协作努力下,他们进行了一项研究,以找到解决抗菌素耐药性问题的创新解决方案。该研究利用 AI 合成和评估 20 种独特的抗菌肽设计,这些设计选自 90,000 个序列库。
AI 模型是专门为对抗抗生素耐药性而设计的,结合了对广谱功效和低毒性的控制,并减缓了耐药性的出现。这种方法旨在创造有效的解决方案,不仅可以对抗耐药细菌,还可以最大限度地降低有害副作用的风险,并防止进一步产生耐药性。
该团队针对各种革兰氏阴性和革兰氏阳性细菌测试了这些设计,从而确定了六种成功的候选药物。在小鼠模型和试管中进一步评估了这些候选物的毒性。
AI 驱动的成功
Das 博士对该设计的成功表示兴奋,并指出它体现了下一代候选药物所期望的许多广受欢迎的特性。随附的插图概述了使用 AI 加速抗菌设计过程的计划和预计持续时间,只需一个半月即可完成,比需要数年的传统方法要快得多。
使用 AI 加速新抗菌药物的发现已被证明可以改变游戏规则,提供明显的好处,例如更快的速度和更低的费用。此外,AI 模型通过将研究人员的注意力引向最有希望的线索,提供了一种更简化的方法。此外,生成式 AI 使科学家能够设计出与现有药物相比具有独特功能和更高功效的创新药物化合物。
IBM 的研究人员利用生成式 AI 的力量来简化新型抗菌药物的开发。此外,他们还使用 AI 创建了有价值的工具,例如 MolFormer 和 MolGPT,用于预测化学分子的特性,这些化学分子在药物发现和材料设计等各个领域都发挥着至关重要的作用。
结束
生成式 AI 已经引起了各行各业的关注,包括音乐、艺术、医疗保健和制药,成为 AI 近来最激动人心的进步之一。尽管存在局限性和挑战,AI 仍在继续展示其彻底改变不同领域的潜力。
它能够迅速创造和测试针对抗生素耐药细菌和其他病原体的救命药物,这证明了它的重要性和前景。
随着最近围绕 OpenAI 的 GPT-3 试验的热议以及谷歌和微软的后续开发,在未来,很可能不仅会看到 AI 产品的激增,预计还会出现进一步的中断。有些可能微不足道,但希望有许多具有有意义的 AI 集成,这将有利于市场。
参考内容:https://www.forbes.com/sites/moorinsights/2023/02/13/ibm-demonstrates-groundbreaking-artificial-intelligence-research-using-foundational-models-and-generative-ai/?sh=30f991ad750d
- 上一篇:基于深度学习算法的雷达回波短临预报 2023/2/19
- 下一篇:“数”说新时代气象发展成就 2023/2/18