- 定义与背景
- 可解释性人工智能(Explainable AI,XAI)是人工智能领域的一个重要分支,旨在使人工智能模型(尤其是复杂的深度学习模型)的决策过程和结果能够被人类理解。随着深度学习模型在各种复杂任务(如图像识别、自然语言处理等)中取得巨大成功,这些模型往往是复杂的黑盒模型,例如深度神经网络具有大量的参数和复杂的层次结构,很难直观地理解它们是如何做出决策的。而在许多关键领域,如医疗、金融、法律等,仅仅知道模型的输出结果是不够的,还需要理解模型为什么做出这样的决策,这就催生了XAI的发展。
- 主要方法
- 特征重要性方法:这种方法用于衡量输入特征对于模型决策的相对重要性。例如,在一个预测...
作者文章归档:course
异常检测-
异常检测(Anomaly Detection)是数据挖掘和机器学习领域中的一个重要任务,用于识别数据集中不符合预期模式或行为的数据点。以下是详细介绍:
一、基本概念
- 定义
- 异常检测旨在发现那些与正常数据模式显著不同的数据实例。这些异常点可能是由于系统故障、欺诈行为、网络攻击、数据录入错误等多种原因导致的。例如,在信用卡交易数据中,一笔异常大的交易或者在非寻常地点进行的交易可能是信用卡被盗刷的迹象;在工业生产过程中,设备的某个传感器读数突然偏离正常范围,可能表示设备出现故障。
- 正常数据与异常数据的对比
- 正常数据通常遵循一定的分布规律或模式。以人体体温为例,正常人体温一般在36 - 37摄...
生成对抗网络-
- 定义
-
生成对抗网络(Generative Adversarial Network,简称GAN)是一种深度学习架构,由生成器(Generator)和判别器(Discriminator)两个相互对抗的神经网络组成。生成器的目的是生成尽可能逼真的数据,以“欺骗”判别器;判别器的任务是区分输入的数据是来自真实数据集还是由生成器生成的,通过这种对抗的方式,两个网络不断地进行训练并提升性能。
-
网络结构和工作原理
- 生成器(Generator)
- 生成器通常是一个由神经网络构建的函数,它接收一个随机噪声向量(通常是低维的)作为输入,通过一系列的神经网络层(如全连接层、反卷积层等,在图像生成任务中...
MECE-麦肯锡
- MECE原则的起源与在麦肯锡的地位
MECE(Mutually Exclusive, Collectively Exhaustive)即相互独立、完全穷尽,是麦肯锡思维过程的一条基本准则。它是麦肯锡顾问在解决复杂商业问题时的核心工具之一,帮助团队梳理混乱的问题,构建清晰的思维架构,确保分析全面且有条理。这一原则已经深深融入麦肯锡的咨询文化之中,成为麦肯锡方法论的重要标志。
-
相互独立(Mutually Exclusive)的具体应用和案例
-
企业战略中的业务单元划分:在分析大型企业的业务组合时,麦肯锡顾问会运用MECE原则来划分业务单元。例如,一家跨国企业经营多种业务,包括电子产...
基础模型-
定义
- Foundation model(基础模型)是一种大规模的机器学习模型,它通过在海量的数据上进行训练,通常采用自监督学习或半监督学习的方式,从而能够适应广泛的下游任务 。
特点
- 涌现性:由于训练数据未经过人工明确标注,模型会涌现出一些未被预先设定的特性和能力。例如,一个在大规模语言数据集上训练的模型,可能会自行学会生成故事或进行算术运算,而无需明确编程让其具备这些功能.
- 同质化:指在许多领域中都使用相同的方法,这虽然能带来强大的进步,但也存在“单点故障”的可能性。比如,很多基础模型都基于相似的架构和训练方式,一旦这种架构或训练方式存在缺陷,可能会影响到多个应用领域.
常见类...
下游任务-
- 定义
- 在机器学习和自然语言处理等领域,“downstream tasks”(下游任务)是相对于“pre - training”(预训练)而言的。预训练是在大规模通用数据上对模型进行初步训练,学习通用的知识和模式。而下游任务是指在预训练模型的基础上,针对特定的应用场景和具体的目标进行的任务,这些任务通常数据规模较小,并且有明确的、具体的输出要求。
-
例如,在自然语言处理中,预训练语言模型(如BERT)在大规模文本数据上学习语言知识后,文本分类、情感分析、命名实体识别等具体应用就是下游任务。
-
下游任务的类型(以自然语言处理为例)
- 文本分类(Text Classification)
- 任...
预训练-
- 定义
- “pre - train”(预训练)在机器学习和自然语言处理等领域是一种重要的训练策略。它是指在大规模的通用数据上先对模型进行初步训练,使模型学习到数据中的一般特征和模式,得到一个具有一定泛化能力的初始模型状态。
-
例如,在自然语言处理中,预训练语言模型可以在大量的文本语料(如互联网文本、书籍、新闻等)上进行训练,这个过程中模型学习到词汇的语义、语法结构、句子之间的关系等知识。
-
预训练的方法和技术
- 无监督学习方法
- 自监督学习(Self - supervised Learning):这是预训练中常用的方法。模型通过自己预测输入数据的一部分来进行学习。例如,在语言模型的预训练中...
标量-
在数学及相关领域中,“scalar”通常指“标量”,以下是关于标量的详细介绍:
1. 定义
- 标量是只有大小,没有方向的量。与之相对的是向量(vector),向量既有大小又有方向。例如,常见的温度、质量、时间、长度等物理量都是标量。像室内的温度是25摄氏度,这里的“25摄氏度”仅体现了数值大小,不存在方向的概念,所以温度就是一个标量;再比如一个物体的质量是5千克,“5千克”同样只是一个表示多少的数值,属于标量范畴。
2. 与向量的区别
- 几何表示差异:
- 向量在几何上通常用有向线段来表示,线段的长度表示向量的大小(模长),箭头所指的方向表示向量的方向。比如在平面直角坐标系中,向量可以用坐...
李沐-深度学习-在线课程官网
这是动手学深度学习在线课程的相关介绍,课程于2021年3月20日开始,预计7月结束,内容涵盖深度学习基础、卷积神经网络、计算机视觉、循环神经网络、自然语言处理等方面,具有以下特点:
-
课程背景与特点
-
背景:深度学习发展迅速但模型复杂,本课程从零开始教授,只需基础Python编程和数学知识。
-
特点:讲述模型算法同时用PyTorch实现细节,含四次课程竞赛,内容紧靠《动手学深度学习》第二版,被近200所大学采用。
-
讲师与参与方式
-
讲师:AWS资深首席科学家、美国卡内基梅隆大学计算机系博士李沐。
-
参与方式:无需注册或缴费,直播时...
动手学深度学习
动手学深度学习是一种强调通过实践来深入理解和掌握深度学习知识与技能的学习方式,其核心在于将理论学习与实际操作紧密结合,使学习者能够在实践中真正理解深度学习模型的原理、算法以及应用场景。
核心要点
- 实践导向:不仅仅是理论知识的学习,更注重让学习者亲自上手操作,实现深度学习模型,从而加深对概念的理解。例如在课程中会教授如何用代码实现各种深度学习算法,像线性回归、卷积神经网络等模型的从零开始构建,让学习者明白模型内部的运行机制。
- 涵盖广泛内容:包括深度学习基础、多种类型的神经网络(如卷积神经网络、循环神经网络、注意力机制等)以及在计算机视觉和自然语言处理等领域的应用。以课程安排为例,从基础的...