中心论点

  • 泛化对于深度学习至关重要,以确保新数据的准确预测。 零样本学习通过允许人工智能使用现有知识在没有标记数据的情况下对新的或未知的类做出准确的预测来帮助实现这一目标。
  • 零样本学习模仿人类学习和处理数据的方式。 通过提供额外的语义信息,预训练的模型可以准确地识别新类别,就像人类可以通过了解其属性来学习识别空心吉他一样。
  • 零样本学习通过提高泛化性和可扩展性、减少过度拟合并提高成本效益来改进人工智能。 它使模型能够在更大的数据集上进行训练,通过迁移学习获得更多知识,获得更好的上下文理解,并减少对大规模标记数据的需求。 随着人工智能的进步,零样本学习在应对各个领域的复杂挑战时将变得更加重要。

深度学习的最大目标之一是训练获得广义知识的模型。 泛化至关重要,因为它可以确保模型学习有意义的模式,并在面对新的或未知的数据时能够做出准确的预测或决策。 训练此类模型通常需要大量标记数据。 然而,此类数据可能成本高昂、劳动密集型,有时甚至是不可能的。

为了弥补这一差距,实施了零样本学习,允许人工智能在缺乏标记数据的情况下利用其现有知识做出相当准确的预测。

什么是零样本学习?

零样本学习是一种特殊类型的迁移学习技术。 重点是通过简单地提供描述新类详细信息的附加信息,使用预先训练的模型来识别新的或从未见过的类。

通过利用模型对特定主题的一般知识并提供用于搜索它们的附加语义,它应该能够相当准确地确定它应该识别哪个主题。

假设我们需要识别斑马。 然而,我们没有可以识别此类动物的模型。 因此,我们训练一个现有的模型来识别马,并告诉模型带有黑白条纹的马是斑马。 如果我们通过提供斑马和马的图像来开始推断模型,那么模型很有可能正确识别每种动物。

与许多深度学习技术一样,零样本学习模仿人类学习和处理数据的方式。 众所周知,人类天生就是零样本学习者。 如果您必须在音乐商店寻找空心吉他,您可能会很难找到它。 但如果我告诉你,空心琴体基本上就是一把一侧或两侧都有 F 形孔的吉他,你可能会立即找到一把。

对于现实世界的示例,我们将使用来自开源 LLM 托管网站 Hugging Face 的零样本分类应用程序,并使用 Clip-Vit-Large 模型。

这张照片显示了绑在高脚椅上的杂货袋中面包的图像。 由于该模型是在大型图像数据集上进行训练的,因此该模型可能能够识别照片中的任何对象,例如例如面包、杂货、椅子和安全带。

现在我们希望模型使用以前未见过的类对图像进行分类。 在这种情况下,新颖或不熟悉的课程将是“放松面包”、“安全面包”、“坐着面包”、“驾驶杂货”和“安全杂货”。

请注意,我们有意使用不寻常的、不可见的类和图像来演示图像上零样本分类的有效性。

模型导出后,能够以大约 80% 的置信度对图像进行最合适的分类是“安全面包”。 这可能是因为该模型认为高脚椅更多的是为了安全,而不是坐着、放松或驾驶。

令人印象深刻! 就我个人而言,我同意该模型的性能。 但模型究竟是如何得出这样的输出的呢? 以下是零样本学习如何工作的总体概述。

零样本学习如何运作

零样本学习可以帮助预训练模型识别新类别,而无需提供标记数据。 最简单的形式是,零样本学习分三个步骤进行:

1. 准备工作

零样本学习从准备三种类型的数据开始

  • 所见班级: 用于训练预训练模型的数据。 该模型提供了已经见过的类。 零样本学习的最佳模型是在与模型要识别的新类别密切相关的类别上训练的模型。
  • 隐形/罗马级: 模型训练期间从未使用过的数据。 您必须自己管理这些数据,因为您无法从模型中获取它。
  • 语义/辅助数据: 可以帮助模型识别新类别的附加数据位。 这可以通过单词、短语、单词嵌入或类名来完成。

2. 语义映射

下一步是映射不可见类的特征。 这是通过创建词嵌入并创建将不可见类的属性或特征与所提供的辅助数据相关联的语义图来完成的。 人工智能迁移学习显着加快了这一过程,因为与隐形类相关的许多属性已经被映射。

3. 结论

推理是使用模型来生成预测或输出。 在零样本图像分类中,为给定的图像输入生成词嵌入,然后绘制图表并与辅助数据进行比较。 安全级别取决于输入和所提供的辅助数据之间的相似性。

零样本学习如何改进人工智能

零样本学习通过解决多项机器学习挑战来改进人工智能模型,包括:

  • 改进的泛化: 通过减少对标记数据的依赖,可以在更大的数据集上训练模型,提高泛化能力并使模型更加稳健和可靠。 随着模型变得更加复杂和通用,模型甚至有可能学习常识而不是分析信息的典型方法。
  • 可扩展性: 模型可以持续训练并通过迁移学习获得更多知识。 公司和独立研究人员可以不断改进他们的模型,使其在未来变得更加强大。
  • 减少过度拟合的机会: 当模型在不包含足够多样性来表示所有可能输入的小数据集上进行训练时,可能会发生过度拟合。 通过零样本学习来训练模型,通过训练模型更好地了解主题的上下文,可以减少过度拟合的机会。
  • 性价比: 提供大量标记数据可能需要时间和资源。 使用零样本迁移学习,可以用更少的时间和标记数据来训练鲁棒模型。

随着人工智能的进步,零样本学习等技术将变得更加重要。

零样本学习的未来

零样本学习已成为机器学习的重要组成部分。 它允许模型无需显式训练即可识别和分类新类别。 随着模型架构、基于属性的方法和多模态集成的不断发展,零样本学习可以极大地帮助模型更加适应机器人、医疗保健和计算机视觉领域的复杂挑战。