分类目录归档：基础设施

BERT架构-V0-视频文字

215 views

BERT（Bidirectional Encoder Representations from Transformers）是Google于2018年提出的预训练语言模型，通过双向上下文建模显著提升了自然语言处理任务的性能。以下是对BERT架构的详细解析：

1. 核心架构

BERT基于Transformer的编码器（Encoder）构建，核心是多层自注意力机制（Self-Attention）和前馈神经网络（Feed-Forward Network）的堆叠。

1.1 Transformer编码器层

自注意力机制（Self-Attention）：
每个词通过Query、Key、Valu...

贝叶斯原理概述-V0

259 views

贝叶斯原理概述

贝叶斯原理（Bayes' Theorem）是概率论与统计学中一个核心理论，由18世纪英国数学家托马斯·贝叶斯提出。它以动态更新认知的哲学为基础，通过整合先验知识与新证据，实现对事件概率的迭代优化。贝叶斯方法在机器学习、医学诊断、金融预测等领域广泛应用，成为现代数据分析的重要工具。

贝叶斯定理的数学表达

贝叶斯定理的数学形式简洁而深刻：

[ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} ]

其中： - ( P(A|B) ) 是后验概率（Posterior Probability），即在观察到事件B后，事件A发生的概率； - ( P(B|A...

贝叶斯原理概述-视频文字

246 views

贝叶斯原理概述

贝叶斯原理（Bayes' Theorem）是统计学与概率论中极具影响力的理论框架，其核心思想在于通过动态更新认知，将主观经验与客观数据相结合，从而实现对不确定性的量化与优化。这一理论由18世纪英国数学家托马斯·贝叶斯提出，后经拉普拉斯等人发展完善，逐渐成为现代数据分析、人工智能及决策科学的基础工具。贝叶斯方法不仅提供了一种数学工具，更体现了一种认知哲学：人类对世界的理解本质上是概率化的、可迭代的，且永远处于被新证据修正的过程中。

贝叶斯思想的哲学内核

贝叶斯原理的突破性在于其对“概率”的重新定义。传统频率学派将概率视为长期重复事件中发生的频率，强调客观性与经验性；而贝叶...

开源大模型

274 views

开源大模型是指其源代码和架构对公众开放，可自由使用、修改和分发的大型语言模型。以下是一些比较知名的开源大模型：

Tülu 3 405B 发布背景：由美国西雅图的非营利研究机构艾伦人工智能研究所（Ai2）于2025年1月发布。该模型基于Meta的llama-3.1-405B，拥有4050亿参数。训练方法：采用精心策划的数据选择和合成，通过监督微调（SFT）等方法提升性能。此外，还使用了强化学习与可验证奖励（RLVR）框架，使模型在数学推理等任务上表现出色。性能表现：与DeepSeek v3和OpenAI的GPT-4o相当，甚至在某些关键领域超越了它们。

DeepSeek 系列 Deep...

蒙特卡洛方法的原理-视频文字

288 views

蒙特卡洛方法的原理

蒙特卡洛方法是一种通过随机性解决确定性问题的计算策略，其核心是“用大量随机实验的统计结果逼近真实答案”。它不依赖复杂的数学推导，而是通过模拟现实中的随机过程，用概率和统计规律找到问题的解。以下是其核心原理的通俗解析：

1. 核心思想：随机实验替代精确计算

许多复杂问题（如高维积分、最优决策、概率预测）难以用传统数学工具直接求解。蒙特卡洛方法另辟蹊径：
- 将问题转化为概率模型：例如，计算圆的面积可转化为“随机撒点落在圆内的概率”。
- 用随机实验模拟可能性：通过生成大量随机样本（如抛硬币、随机路径、虚拟场景），模拟所有可能的情况。
- 统计结果逼近真实解：根据“大...

蒙特卡洛方法-V0

286 views

蒙特卡洛方法（Monte Carlo Method）是一种基于随机采样和统计规律的数值计算方法，其核心是通过生成大量随机样本，利用概率统计规律来近似求解复杂数学问题。以下是其核心原理的详细解析：

1. 核心思想

蒙特卡洛方法的本质是“用随机性解决确定性问题”，通过以下步骤实现： 1. 将问题转化为概率模型：将待求解的问题（如积分、优化、概率分布等）映射到一个可通过随机实验模拟的统计模型。 2. 生成大量随机样本：通过随机数生成器或采样技术，模拟问题的可能状态或路径。 3. 统计结果逼近真实解：利用大数定律（Law of Large Numbers）和中心极限定理（Central Lim...

Mac时间机器

336 views

Mac时间机器（Time Machine）是苹果公司为Mac操作系统设计的一款强大的备份工具。以下是关于它的详细介绍：

功能特点

自动备份：能自动备份Mac上不属于macOS安装的文件，如App、音乐、照片和文稿等。默认会进行过去24小时的每小时备份、过去一个月的每日备份以及过去所有月份的每周备份。
本地快照：在使用Apple文件系统（APFS）的磁盘上，还会每小时创建本地快照，可存储最多24小时或直到磁盘空间不足，即使未连接备份磁盘也可恢复文件的先前版本。
全量与增量备份结合：首次备份是全量备份，之后是增量备份，只备份自上次备份以来有变动的文件，节省备份时间和存储空间。
易于恢复：提...

程序化交易架构概述-视频文字

235 views

在程序化交易的背景下，架构设计是至关重要的一环，它决定了交易系统的稳定性、效率和执行速度。程序化交易涉及通过算法自动执行交易指令，以便实现更高效和更快速的市场响应。在学术领域中，程序化交易架构一般分为以下几个关键组成部分：

1. 数据采集层

数据采集层是程序化交易架构的基础，它负责从各个数据源获取实时和历史市场数据（如股票价格、订单簿、市场深度等）。这些数据为交易算法提供了必要的输入。

数据源：包括证券交易所API、数据供应商（如Bloomberg、Reuters）、以及其他市场数据提供商。
数据处理：需要进行清洗、标准化和存储，以便后续使用。常见的处理方法包括对缺失值的填补、异常值的...

最佳决策路径-MDP

266 views

MDP（马尔科夫决策过程，Markov Decision Process）是用来建模决策过程的数学框架。最佳决策顺序通常指的是在给定的MDP环境中，如何选择一系列动作以最大化长期的回报。MDP主要由以下几个元素组成：

状态空间 (S)：所有可能的状态集合。
动作空间 (A)：所有可能的动作集合。
状态转移概率 (P)：在某个状态下，采取某个动作后转移到另一个状态的概率。
奖励函数 (R)：在某个状态下采取某个动作所获得的奖励。
折扣因子 (γ)：用来权衡即时奖励与未来奖励的因子。

最佳决策顺序的目标是确定一个策略（policy），即在每个状态下选择的动作序列，以最大化从当前状态到终止...

知识蒸馏：原理、概述与分类-视频文字

224 views

知识蒸馏：原理、概述与分类

一、引言

随着深度学习技术的飞速发展，神经网络模型的规模和复杂性不断增加。大型深度学习模型，如卷积神经网络（CNN）、循环神经网络（RNN）和自注意力模型（Transformer），在多个任务上取得了显著的成功。然而，这些模型通常需要大量的计算资源和内存，这使得它们在实际应用中难以部署，尤其是在边缘设备或资源受限的环境中。为了缓解这一问题，知识蒸馏（Knowledge Distillation, KD）作为一种模型压缩技术应运而生，通过从复杂模型向简化模型传递知识，帮助实现高效、轻量化的模型。

知识蒸馏的核心思想是通过将大模型（教师模型）所学习到的知识迁移到小...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

BERT架构-V0-视频文字

1. 核心架构

1.1 Transformer编码器层

贝叶斯原理概述-V0

贝叶斯原理概述

贝叶斯定理的数学表达

贝叶斯原理概述-视频文字

贝叶斯原理概述

贝叶斯思想的哲学内核

开源大模型

蒙特卡洛方法的原理-视频文字

蒙特卡洛方法的原理

1. 核心思想：随机实验替代精确计算

蒙特卡洛方法-V0

1. 核心思想

Mac时间机器

功能特点

程序化交易架构概述-视频文字

1. 数据采集层

最佳决策路径-MDP

知识蒸馏：原理、概述与分类-视频文字

知识蒸馏：原理、概述与分类

一、引言