分类目录归档：基础设施

卷积

315 views

Convolution（卷积）

一、定义

在数学和信号处理、图像处理以及深度学习等领域，卷积是一种重要的运算。从数学角度看，对于两个函数（比如函数(f(x))和(g(x))），它们的卷积定义为一个积分运算，得到一个新的函数。在离散形式下，对于两个离散序列（如(x[n])和(h[n])），卷积是一种加权求和的运算。在实际应用中，以图像处理为例，卷积操作通过一个小的滤波器（也称为卷积核）在图像上滑动，对图像的每个像素及其邻域进行加权求和，从而得到一个新的图像（特征图），这个过程可以提取图像中的各种特征。

二、数学原理

（一）连续卷积

公式表示
对于两个连续函数(f(x))和(g(x))，它...

最大池化

323 views

Max Pooling（最大池化）

一、定义

最大池化是一种在卷积神经网络（CNN）和其他深度学习架构中广泛使用的下采样技术。它的主要目的是对输入数据（通常是特征图）进行降维处理，同时保留数据中的最重要（最显著）的特征信息。

二、工作原理

（一）基本操作

窗口划分
假设我们有一个二维的特征图（例如，由卷积层输出的图像特征表示），最大池化操作会在这个特征图上滑动一个固定大小的窗口。这个窗口的大小是预先定义的，常见的有(2\times2)、(3\times3)等。例如，对于一个(4\times4)的特征图，使用(2\times2)的池化窗口，那么这个窗口会在特征图上滑动，每次覆盖(2\ti...

滤波器检测

350 views

Filter Detect（滤波器检测）

一、定义

“Filter Detect”可以从两个方面来理解。一方面，它可以指滤波器（Filter）的检测，即对信号处理过程中所使用的滤波器进行性能、特性以及工作状态的检测。另一方面，它也可能涉及到利用滤波器来进行检测（Detect）的操作，例如在信号处理、图像处理或者数据分析中，通过特定的滤波器来检测信号中的某些特征、成分或者异常情况。

二、滤波器检测（对滤波器本身的检测）

（一）频率响应检测

基本原理
滤波器的频率响应是其最重要的特性之一。它描述了滤波器对不同频率成分的信号的处理方式。通过向滤波器输入包含各种频率成分的测试信号（如正弦波信号...

AI from zero to hero-2025课程大纲

2071 views

以下是一个关于“AI from zero to hero”一年的视频课程大纲：

第一季度：基础构建（第 1 - 3 个月）

第 1 个月：
- 人工智能概述：历史、应用领域、发展趋势
- Python 编程基础：语法、数据类型、控制结构、函数
第 2 个月：
- Python 数据分析库：Numpy、Pandas 数据处理与分析
- 数据可视化：Matplotlib、Seaborn 绘制图表
第 3 个月：
- 数学基础：线性代数、概率论与数理统计复习
- 机器学习基础概念：监督学习、无监督学习、模型评估指标

第二季度：机器学习深入（第 4 - 6 个月）

第 4 个月：
- 线性回归模型：原理、...

自注意力

336 views

自注意力（Self-Attention）是一种在深度学习中用于处理序列数据的机制，尤其在自然语言处理（NLP）领域的Transformer架构中得到了广泛应用。以下是关于自注意力的详细介绍：

基本原理

输入表示：将输入序列中的每个元素表示为一个向量，这些向量组成一个矩阵作为自注意力机制的输入。例如，对于一个句子，每个单词可以被表示为一个词向量。
计算注意力分数：对于序列中的每个元素，通过计算它与其他所有元素之间的相似度来确定其对其他元素的关注程度，得到注意力分数。这个相似度通常通过点积或其他函数来计算，然后经过一个 softmax 函数进行归一化，确保所有注意力分数之和为1。
加权求和...

正余弦编码

356 views

正余弦编码（Sinusoidal Positional Encoding）是一种在深度学习中用于向模型提供位置信息的技术，以下是更详细的介绍：

背景

在处理序列数据如自然语言文本、时间序列等时，模型需要理解数据中元素的位置顺序关系。传统的神经网络如循环神经网络（RNN）可以通过其循环结构隐式地学习位置信息，但对于一些基于注意力机制的模型如Transformer，由于其并行计算的特性，需要显式地将位置信息编码后输入模型，正余弦编码就是为满足这一需求而提出的。

原理

生成位置编码向量：对于一个长度为(L)的序列，正余弦编码为序列中的每个位置(pos)（(0 \leq pos \leq ...

前馈网络-

340 views

前馈网络（Feedforward Network）是一种最基本的人工神经网络类型，以下是关于它的详细介绍：

基本结构

神经元与节点：前馈网络由多个神经元组成，这些神经元按照不同的层次排列，形成输入层、隐藏层和输出层。相邻层的神经元之间通过有向权重连接，而同一层的神经元之间没有连接。
信息传递方向：信息从输入层开始，依次通过隐藏层，最后传递到输出层，在这个过程中，信息只能单向流动，不存在反向的反馈连接，这也是它被称为前馈网络的原因。

工作原理

输入层接收数据：将外部数据输入到网络中，这些数据可以是图像、文本、音频等各种形式的信息，输入层的每个神经元对应输入数据的一个特征或维度。
隐藏...

拼接-

348 views

在深度学习中，concat通常指的是concatenate（拼接）操作，它是一种将多个张量（Tensor）在指定维度上进行连接的操作，在许多深度学习框架中都有相应的实现，如PyTorch中的torch.cat()函数和TensorFlow中的tf.concat()函数。以下是对concat的详细介绍：

基本原理

维度扩展：concat操作沿着指定的维度将多个张量连接在一起，形成一个新的张量。这个新张量在除了连接维度之外的其他维度上的形状与输入张量相同，而在连接维度上的大小是所有输入张量在该维度上大小的总和。

操作示例

以PyTorch为例

import torch

# 定义两个...

层归一化

340 views

层归一化（Layer Normalization，简称LN）是一种深度学习中的归一化技术，常用于神经网络中，以下是对其详细介绍：

基本概念

归一化的必要性：在神经网络训练过程中，随着网络层数的增加，各层的输入分布会发生变化，这可能导致模型训练困难，出现梯度消失或梯度爆炸等问题。归一化技术通过对神经网络每层的输入进行归一化处理，使输入数据的分布更加稳定，从而加速模型训练并提高模型的泛化能力。
层归一化原理：与批归一化（Batch Normalization）不同，层归一化是对神经网络中每一层的所有神经元的输入进行归一化，而不是对一个批次的数据进行归一化。它计算每一层输入的均值和方差，然后...

多头注意力

346 views

多头注意力（Multi-Head Attention）是一种在深度学习领域，特别是自然语言处理（NLP）中广泛应用的注意力机制技术，以下是对其详细介绍：

基本原理

注意力机制基础：注意力机制本质上是一种对输入序列中不同位置的信息进行加权求和的方法，旨在让模型能够聚焦于输入序列中与当前任务最相关的部分。在自然语言处理中，它可以帮助模型理解文本中不同单词或短语的重要性。
多头并行计算：多头注意力通过并行地执行多个不同的注意力头（Attention Head）来扩展注意力机制的能力。每个注意力头都有自己的一组可学习参数，能够从不同的表示子空间中学习到输入序列的不同特征，然后将这些特征组合起来...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

卷积

Convolution（卷积）

一、定义

二、数学原理

（一）连续卷积

最大池化

Max Pooling（最大池化）

一、定义

二、工作原理

（一）基本操作

滤波器检测

Filter Detect（滤波器检测）

一、定义

二、滤波器检测（对滤波器本身的检测）

（一）频率响应检测

AI from zero to hero-2025课程大纲

自注意力

基本原理

正余弦编码

背景

原理

前馈网络-

基本结构

工作原理

拼接-

基本原理

操作示例

层归一化

基本概念

多头注意力

基本原理