- 定义
- 审计框架(Audit Framework):是一套用于系统地规划、执行、监督和报告审计工作的结构化体系。它包括一系列的政策、程序、方法和标准,目的是确保审计过程的科学性、公正性和有效性。在传统审计领域,主要用于财务审计等方面,检查财务报表是否真实、准确地反映了企业的财务状况。
-
机器学习(Machine Learning):是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在数据挖掘、自然语言处理、图像识别等众多领域有广泛应用。
- ...
作者文章归档:course
多类别指标
- 定义和背景
-
在多类别分类问题(如将图像分为多个不同的物体类别、文本分类到多个主题类别等)中,需要使用特定的评估指标来衡量模型的性能,这些指标被称为多类别指标(Multi - Class Metrics)。与二分类问题不同,多分类问题的评估更为复杂,因为涉及到多个类别之间的混淆情况。
-
常见的多类别指标
- 宏平均(Macro - averaging)
- 计算方法:先分别计算每个类别的评估指标(如精确率、召回率、F1 - score),然后对这些类别指标求算术平均值。例如,对于一个三分类问题,类别为(A)、(B)、(C),分别计算出类别(A)的精确率(P_A)、类别(B)的精确率(P_B...
数据增强-
- 基本概念
-
数据增强(Data Augmentation)是一种在数据层面进行操作的技术,主要用于扩充数据集。在机器学习和深度学习的模型训练过程中,数据的数量和质量对模型的性能有着至关重要的影响。数据增强通过对原始数据进行一系列变换,生成新的、与原始数据相似的数据样本,从而增加数据的多样性和规模。
-
在计算机视觉中的应用
- 几何变换
- 旋转(Rotation):将图像围绕一个中心点按照一定的角度进行旋转。例如,对于一个手写数字识别任务,把数字图像进行不同角度(如0 - 30度、30 - 60度等)的旋转,生成新的图像样本。这样可以让模型学会识别处于不同倾斜角度的数字,增强模型的鲁棒性。...
混淆矩阵-
- 定义
- 混淆矩阵(Confusion Matrix)是在机器学习和统计学的分类问题中,用于评估分类模型性能的一种工具。它是一个表格,展示了分类模型预测结果和实际真实标签之间的比较情况。
-
对于一个二分类问题,混淆矩阵是一个(2\times2)的矩阵,包含真正例(True Positive,TP)、假正例(False Positive,FP)、真反例(True Negative,TN)和假反例(False Negative,FN)这四个元素。例如,在判断一封邮件是否为垃圾邮件的任务中,如果模型正确地将垃圾邮件预测为垃圾邮件,这就是一个真正例;如果将正常邮件错误地预测为垃圾邮件,就是假正例。...
F1 - score-
- F1 - score的定义与意义
- F1 - score是精确率(Precision)和召回率(Recall)的调和平均数,用于综合评估分类模型的性能。在分类任务中,精确率和召回率往往存在一种权衡关系,单独使用其中一个指标可能无法全面衡量模型的好坏。F1 - score能够平衡这种权衡,提供一个更全面的评估指标。
-
其计算公式为(F1 = 2\times\frac{Precision\times Recall}{Precision + Recall})。例如,在信息检索任务中,精确率关注的是检索出的结果中有多少是真正相关的,召回率关注的是所有相关的内容中有多少被检索出来了。F1 - sc...
逻辑函数-
- 定义
- Sigmoid函数,也称为逻辑函数(Logistic Function),其数学表达式为(y = \frac{1}{1 + e^{-x}}),其中(e)是自然常数(约为(2.71828)),(x)是自变量。
-
这个函数的定义域是((-\infty,+\infty)),值域是((0,1))。例如,当(x = 0)时,(y=\frac{1}{1 + e^{0}}=\frac{1}{2});当(x\to+\infty)时,(y\to1);当(x\to-\infty)时,(y\to0)。
-
函数性质
- 单调性:Sigmoid函数是单调递增函数。这意味着当(x)的值增加时,(y)的值也会...
函数集-
- 定义
- 函数集(Function Set)是指一组具有某种共同性质或用于特定目的的函数的集合。这些函数可以是数学函数、编程语言中的函数或者机器学习模型中的函数族。
-
例如,在数学中,所有的多项式函数构成一个函数集。一个(n)次多项式函数的一般形式为(y = a_0 + a_1x + a_2x^2+\cdots+a_nx^n),其中(a_0,a_1,\cdots,a_n)是系数,所有这样的多项式函数(无论(n)取何值,系数如何取值)组成了多项式函数集。
-
分类
- 按函数类型分类
- 线性函数集:包括所有形如(y = mx + b)的函数,其中(m)是斜率,(b)是截距。例如(y = 2x +...
伯努利分布-
- 定义
- 伯努利分布(Bernoulli Distribution)是一种离散型概率分布,它用于描述只有两种可能结果的随机试验。这两种结果通常被标记为(0)和(1),例如成功((1))和失败((0))。
-
设(X)是服从伯努利分布的随机变量,(p)表示一次试验中结果为(1)(成功)的概率,那么(X)的概率质量函数(PMF)为(P(X = k)=p^{k}(1 - p)^{1 - k}),其中(k = 0,1)。
-
示例
- 抛硬币是典型的伯努利分布例子。设正面朝上为成功((X = 1)),反面朝上为失败((X = 0))。如果硬币是公平的,那么正面朝上的概率(p=\frac{1}{2})。...
线性边界-
-
含义解释 当说“the boundary is linear”时,意思是边界呈现线性的形态。从几何角度来讲,线性边界通常可以用直线方程来描述,比如在二维平面中可以表示为 (y = mx + c)(其中 (m) 是斜率,(c) 是截距)这样的形式,在更高维度空间也有相应的线性表达式来刻画。
-
常见场景举例
- 区域划分场景: 在地图上对不同地块进行划分时,可能存在线性边界的情况。例如,在规划一个农业园区,其中两块不同种植作物的区域之间用栅栏隔开,而这个栅栏所在的直线就构成了两块区域之间的线性边界。如果以坐标来表示位置,假设其中一块区域 (A) 在直线 (y = 2x + 1) 的一侧,...
后验概率-贝叶斯
后验概率(Posterior Probability) 是贝叶斯统计中的一个核心概念,表示在观察到新的数据或证据后,对某个假设或事件概率的更新。以下是其关键内容的详细解释:
1. 定义
后验概率是指在观察到数据 ( D ) 后,假设 ( H ) 成立的概率,记作 ( P(H|D) )。
2. 贝叶斯定理
后验概率通过 贝叶斯定理 计算,将后验概率与先验概率和数据的似然联系起来:
[ P(H|D) = \frac{P(D|H) \cdot P(H)}{P(D)} ]
其中: - ( P(H|D) ):后验概率(在观察到数据 ( D ) 后,假设 ( H ) 成立的概率)。 - ( P(...