分类目录归档：自研课程

AutoGluon：原理、架构与应用场景-视频文字

419 views

AutoGluon：原理、架构与应用场景

一、引言

在当今快速发展的机器学习领域，自动化机器学习（AutoML）逐渐成为研究热点。AutoGluon 是一款开源的自动机器学习框架，旨在帮助用户更轻松地构建和优化机器学习模型，尤其适合初学者和希望快速迭代模型的开发者。它通过自动化的特征工程、模型选择、超参数调优等流程，极大地简化了机器学习的复杂性，同时也能为专家提供强大的工具来提升现有模型和数据管道的性能。

二、AutoGluon 的原理

（一）自动化特征工程

AutoGluon 会自动对输入数据进行特征分析和处理。它能够识别数据中的缺失值、异常值，并进行填充和修正。同时，它会根据数据类型...

KV Cache-视频文字

246 views

KV Cache（键值缓存）是Transformer架构中优化大语言模型（LLM）推理性能的核心技术，尤其在自回归生成任务中表现突出。以下是关于KV Cache的详细解析：

1. KV Cache的核心作用

KV Cache通过缓存注意力机制中的Key和Value矩阵，避免重复计算历史token的中间结果，从而显著提升推理效率。
- 加速推理：在自回归生成过程中，每一步仅需计算当前新token的Query，而Key和Value从缓存中复用，计算量从与序列长度平方相关（O(n²)）降至线性（O(n)）。
- 降低计算资源消耗：实验表明，开启KV Cache后，生成1000个token的耗...

RLHF-文字视频

320 views

基于人类反馈的强化学习（Reinforcement Learning from Human Feedback, RLHF）的全面分析，涵盖原理、架构、关键过程和应用场景：

一、原理

RLHF 的核心目标是通过人类偏好信号优化AI模型的行为，解决传统强化学习（RL）中奖励函数难以设计的难题。其原理可分解为： 1. 人类偏好建模
将人类对模型输出的主观评价（如A回复优于B）转化为可量化的奖励信号。 2. 策略优化
基于奖励信号，通过强化学习算法（如PPO、DPO）调整模型策略，使其输出更符合人类价值观。

理论依据：
- Bradley-Terry模型：将成对偏好转化为概率分布，...

AutoML-视频文字

288 views

AutoML（Automated Machine Learning）旨在通过自动化机器学习流程中的关键步骤，降低技术门槛并提升效率。其核心知识体系涵盖以下核心模块：

一、AutoML核心架构

AutoML Architecture （注：此处可插入典型AutoML系统架构图）

1. 自动化数据预处理

数据清洗增强：自动处理缺失值（插值/删除）、异常检测（Isolation Forest）、数据增强（SMOTE过采样）
特征工程自动化：通过遗传编程自动生成高阶特征组合（如乘除运算），特征选择（LASSO正则化）
类型自动识别：智能识别时间序列、文本（TF-IDF）、图像（自动维度匹配）

2. 智能模型选择

元学习系统：构...

大模型微调-视频文字-

269 views

大模型微调（Fine-tuning）是迁移学习的一种重要技术，其核心思想是在预训练模型（Pre-trained Model）的基础上，通过特定任务的数据对模型参数进行进一步调整，使其适配下游任务。以下是其原理的概述：

1. 预训练阶段

目标：利用大规模无标注数据（如文本、图像等）训练模型，学习通用的特征表示。
方法：常见的预训练任务包括：
自回归语言建模（如GPT系列）：预测下一个词。
自编码语言建模（如BERT）：通过掩码预测（Masked Language Modeling）学习上下文表示。
对比学习（如CLIP）：学习跨模态的语义对齐。
输出：模型具备对输入数据的通用理解能力（...

BERT架构-V0-视频文字

234 views

BERT（Bidirectional Encoder Representations from Transformers）是Google于2018年提出的预训练语言模型，通过双向上下文建模显著提升了自然语言处理任务的性能。以下是对BERT架构的详细解析：

1. 核心架构

BERT基于Transformer的编码器（Encoder）构建，核心是多层自注意力机制（Self-Attention）和前馈神经网络（Feed-Forward Network）的堆叠。

1.1 Transformer编码器层

自注意力机制（Self-Attention）：
每个词通过Query、Key、Valu...

贝叶斯原理概述-视频文字

265 views

贝叶斯原理概述

贝叶斯原理（Bayes' Theorem）是统计学与概率论中极具影响力的理论框架，其核心思想在于通过动态更新认知，将主观经验与客观数据相结合，从而实现对不确定性的量化与优化。这一理论由18世纪英国数学家托马斯·贝叶斯提出，后经拉普拉斯等人发展完善，逐渐成为现代数据分析、人工智能及决策科学的基础工具。贝叶斯方法不仅提供了一种数学工具，更体现了一种认知哲学：人类对世界的理解本质上是概率化的、可迭代的，且永远处于被新证据修正的过程中。

贝叶斯思想的哲学内核

贝叶斯原理的突破性在于其对“概率”的重新定义。传统频率学派将概率视为长期重复事件中发生的频率，强调客观性与经验性；而贝叶...

蒙特卡洛方法的原理-视频文字

306 views

蒙特卡洛方法的原理

蒙特卡洛方法是一种通过随机性解决确定性问题的计算策略，其核心是“用大量随机实验的统计结果逼近真实答案”。它不依赖复杂的数学推导，而是通过模拟现实中的随机过程，用概率和统计规律找到问题的解。以下是其核心原理的通俗解析：

1. 核心思想：随机实验替代精确计算

许多复杂问题（如高维积分、最优决策、概率预测）难以用传统数学工具直接求解。蒙特卡洛方法另辟蹊径：
- 将问题转化为概率模型：例如，计算圆的面积可转化为“随机撒点落在圆内的概率”。
- 用随机实验模拟可能性：通过生成大量随机样本（如抛硬币、随机路径、虚拟场景），模拟所有可能的情况。
- 统计结果逼近真实解：根据“大...

程序化交易架构概述-视频文字

254 views

在程序化交易的背景下，架构设计是至关重要的一环，它决定了交易系统的稳定性、效率和执行速度。程序化交易涉及通过算法自动执行交易指令，以便实现更高效和更快速的市场响应。在学术领域中，程序化交易架构一般分为以下几个关键组成部分：

1. 数据采集层

数据采集层是程序化交易架构的基础，它负责从各个数据源获取实时和历史市场数据（如股票价格、订单簿、市场深度等）。这些数据为交易算法提供了必要的输入。

数据源：包括证券交易所API、数据供应商（如Bloomberg、Reuters）、以及其他市场数据提供商。
数据处理：需要进行清洗、标准化和存储，以便后续使用。常见的处理方法包括对缺失值的填补、异常值的...

知识蒸馏：原理、概述与分类-视频文字

245 views

知识蒸馏：原理、概述与分类

一、引言

随着深度学习技术的飞速发展，神经网络模型的规模和复杂性不断增加。大型深度学习模型，如卷积神经网络（CNN）、循环神经网络（RNN）和自注意力模型（Transformer），在多个任务上取得了显著的成功。然而，这些模型通常需要大量的计算资源和内存，这使得它们在实际应用中难以部署，尤其是在边缘设备或资源受限的环境中。为了缓解这一问题，知识蒸馏（Knowledge Distillation, KD）作为一种模型压缩技术应运而生，通过从复杂模型向简化模型传递知识，帮助实现高效、轻量化的模型。

知识蒸馏的核心思想是通过将大模型（教师模型）所学习到的知识迁移到小...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

AutoGluon：原理、架构与应用场景-视频文字

AutoGluon：原理、架构与应用场景

一、引言

二、AutoGluon 的原理

（一）自动化特征工程

KV Cache-视频文字

1. KV Cache的核心作用

RLHF-文字视频

一、原理

AutoML-视频文字

一、AutoML核心架构

1. 自动化数据预处理

2. 智能模型选择

大模型微调-视频文字-

1. 预训练阶段

BERT架构-V0-视频文字

1. 核心架构

1.1 Transformer编码器层

贝叶斯原理概述-视频文字

贝叶斯原理概述

贝叶斯思想的哲学内核

蒙特卡洛方法的原理-视频文字

蒙特卡洛方法的原理

1. 核心思想：随机实验替代精确计算

程序化交易架构概述-视频文字

1. 数据采集层

知识蒸馏：原理、概述与分类-视频文字

知识蒸馏：原理、概述与分类

一、引言