分类目录归档：人工智能

矩阵分解-

376 views

矩阵分解是将一个矩阵表示为几个更简单的矩阵的乘积的过程。这在数学和计算机科学中是一个重要的概念，因为它可以简化许多矩阵运算，如求解线性方程组、计算矩阵的逆、以及进行特征值分析等。常见的矩阵分解方法包括：

LU分解：将一个矩阵分解为一个下三角矩阵（L）和一个上三角矩阵（U）的乘积。这种分解对于求解线性方程组非常有用。 QR分解：将一个矩阵分解为一个正交矩阵（Q）和一个上三角矩阵（R）的乘积。这种分解在最小二乘问题和特征值问题中非常有用。奇异值分解（SVD）：将一个矩阵分解为一个正交矩阵（U）、一个对角矩阵（Σ）和另一个正交矩阵（V）的乘积。这种分解在数据压缩、信号处理和统计学中非常有用...

AutoML-视频文字

374 views

AutoML（Automated Machine Learning）旨在通过自动化机器学习流程中的关键步骤，降低技术门槛并提升效率。其核心知识体系涵盖以下核心模块：

一、AutoML核心架构

AutoML Architecture （注：此处可插入典型AutoML系统架构图）

1. 自动化数据预处理

数据清洗增强：自动处理缺失值（插值/删除）、异常检测（Isolation Forest）、数据增强（SMOTE过采样）
特征工程自动化：通过遗传编程自动生成高阶特征组合（如乘除运算），特征选择（LASSO正则化）
类型自动识别：智能识别时间序列、文本（TF-IDF）、图像（自动维度匹配）

2. 智能模型选择

元学习系统：构...

大模型微调-视频文字-

339 views

大模型微调（Fine-tuning）是迁移学习的一种重要技术，其核心思想是在预训练模型（Pre-trained Model）的基础上，通过特定任务的数据对模型参数进行进一步调整，使其适配下游任务。以下是其原理的概述：

1. 预训练阶段

目标：利用大规模无标注数据（如文本、图像等）训练模型，学习通用的特征表示。
方法：常见的预训练任务包括：
自回归语言建模（如GPT系列）：预测下一个词。
自编码语言建模（如BERT）：通过掩码预测（Masked Language Modeling）学习上下文表示。
对比学习（如CLIP）：学习跨模态的语义对齐。
输出：模型具备对输入数据的通用理解能力（...

自动微分

414 views

Automatic differentiation（自动微分）是一种在计算机科学和数学领域中用于高效计算函数导数的技术，以下是关于它的详细介绍：

定义

自动微分是一种能够自动计算函数导数的方法，它基于计算机程序对函数表达式的解析和计算，利用链式法则等数学原理，将复杂函数的求导过程分解为一系列基本操作的求导组合，从而实现对函数导数的快速、准确计算。

原理

正向累积：从自变量开始，按照函数的计算顺序，依次计算每个中间变量的导数，并将这些导数信息逐步累积，最终得到目标函数对自变量的导数。例如，对于函数(y = f(g(x)))，先计算(g(x))关于(x)的导数(g'(x))，再计算(f(u...

结构化剪枝

363 views

结构化剪枝也是模型剪枝技术中的一种，和非结构化剪枝相对应，以下是关于它的具体介绍：

定义

结构化剪枝是一种在神经网络模型压缩中，以特定结构为单位对模型进行剪枝的方法。它不是像非结构化剪枝那样针对单个参数进行操作，而是对模型中的具有一定结构的组件，如卷积核、通道、神经元等进行整体删除或调整，从而在减少模型复杂度的同时，尽量保持模型的性能。

实现方式

卷积核剪枝：在卷积神经网络中，卷积核是提取特征的关键组件。卷积核剪枝就是根据一定的标准，直接删除整个卷积核。例如，可以计算每个卷积核的重要性得分，这个得分可以基于卷积核的参数幅度、对特征提取的贡献等因素来确定。然后，将得分低于某个阈值的卷积核...

非结构化剪枝

351 views

非结构化剪枝是模型压缩和优化领域中的一种重要技术，以下是关于它的详细介绍：

定义

非结构化剪枝是一种对神经网络模型进行剪枝的方法，它不依赖于特定的结构或模式，而是直接对模型中的参数进行操作。通过去除神经网络中对模型性能影响较小的连接或参数，以达到减少模型存储需求、降低计算量和提高推理速度等目的，同时尽量保持模型的准确性。

实现方式

基于幅度的剪枝：这是一种最常见的非结构化剪枝方法。其核心思想是根据参数的绝对值大小来决定是否剪枝。通常会设定一个阈值，将绝对值小于该阈值的参数直接设置为零。例如，在一个卷积神经网络中，对于卷积层的权重参数，会遍历每个参数，若其绝对值小于给定阈值，如0.01，...

神经架构搜索

323 views

神经架构搜索（Neural Architecture Search，NAS）是一种用于自动化搜索神经网络架构的技术，以下从其背景、方法、应用场景等方面进行详细介绍：

背景

随着深度学习在图像识别、语音识别、自然语言处理等诸多领域取得巨大成功，神经网络的架构设计变得越来越重要。传统的神经网络架构设计主要依赖于人工经验，需要大量的专业知识和时间成本。NAS旨在通过自动化的方式搜索出最优的神经网络架构，减少人工设计的工作量，提高模型的性能和效率。

方法

搜索空间：定义了所有可能的神经网络架构的集合，包括网络的层数、每层的神经元数量、连接方式、激活函数等。例如，在图像识别中，搜索空间可能包含不...

模型压缩技术

331 views

模型压缩技术是一系列旨在减小深度学习模型体积、降低计算/存储开销、提升推理效率的技术，同时尽可能保持模型性能（如准确率）。这些技术对于在资源受限的设备（如手机、嵌入式设备）上部署模型至关重要，尤其在自然语言处理（NLP）、计算机视觉（CV）等领域广泛应用。以下是主要技术及其原理：

1. 量化（Quantization）

原理：将高精度浮点数（如32位浮点）转换为低精度数值（如8位整数），减少模型存储和计算开销。
类型：
静态量化：离线校准量化参数。
动态量化：运行时动态调整量化范围。
量化感知训练（QAT）：在训练中模拟量化误差，提升压缩后模型性能。
优点：简单高效，硬件支持广泛（如...

知识蒸馏-V2

418 views

知识蒸馏（Knowledge Distillation）是一种在深度学习领域中广泛应用的技术，旨在将复杂模型（教师模型）的知识传递给简单模型（学生模型），以提高学生模型的性能同时降低其复杂度。以下是对知识蒸馏的详细介绍：

一、知识蒸馏的背景和意义

随着深度学习的发展，深度神经网络在许多任务中取得了巨大的成功。然而，这些复杂的模型通常需要大量的计算资源和存储空间，难以在资源受限的设备上部署，如智能手机、嵌入式传感器节点等。知识蒸馏应运而生，为解决这一问题提供了一种有效的途径。通过知识蒸馏，可以将大型教师模型的知识迁移到小型学生模型中，使得学生模型在保持较小规模的同时，能够获得接近甚至超越大...

收敛理论

401 views

收敛理论是数学分析的核心内容之一，涉及多个分支，涵盖数列、函数、级数、泛函空间、概率论及数值分析等领域。以下是其核心要点和分类：

1. 数列收敛

定义：数列 ({a_n}) 收敛于极限 (L)，当且仅当对任意 (\varepsilon > 0)，存在 (N) 使得当 (n > N) 时，(|a_n - L| < \varepsilon)。
柯西准则：数列收敛当且仅当它是柯西序列（即任意两项的差随下标增大而任意小）。
实数完备性：实数空间中，柯西序列必收敛，这是分析学的基础。

2. 函数收敛

点态收敛：对每个 (x)，函数序列 ({f_n(x)}) 收敛到 (f...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

矩阵分解-

AutoML-视频文字

一、AutoML核心架构

1. 自动化数据预处理

2. 智能模型选择

大模型微调-视频文字-

1. 预训练阶段

自动微分

定义

原理

结构化剪枝

定义

实现方式

非结构化剪枝

定义

实现方式

神经架构搜索

背景

方法

模型压缩技术

1. 量化（Quantization）

知识蒸馏-V2

收敛理论

1. 数列收敛

2. 函数收敛