分类目录归档：基础设施

Spacetimeformer-时间序列预测模型-03004-V01

126 views

Spacetimeformer：时空预测的新范式

在天气预报、交通流量预测、电力负荷分析等领域，我们常常面对的不再是孤立的时间点数据，而是同时蕴含时间变化与空间关联的复杂信息流。传统时间序列模型（如LSTM）擅长捕捉时间依赖，却难以有效建模空间位置间的相互影响；而纯空间模型又容易忽略动态演变过程。Spacetimeformer模型应运而生，其核心突破在于将Transformer的强大能力创新性地应用于统一建模时空维度，开辟了预测复杂时空现象的新路径。

一、核心思想：时空一体化的注意力网络

Spacetimeformer 的核心在于它看待数据的方式发生了根本转变：

化时空为序列： 模型摒...

DeepAR-时间序列预测模型-03003-V01

135 views

DeepAR：面向未来的智能时间序列预测引擎

在当今数据驱动的世界中，时间序列预测扮演着关键角色：零售商需要精准预测商品需求以优化库存，能源公司必须预判电力负荷来平衡电网，金融机构则依靠股价预测规避风险。然而，面对复杂多变、具有季节性和不确定性的真实数据，传统方法常显得力不从心。亚马逊科学家团队开发的DeepAR模型，正是为解决这些挑战而生，它融合了深度学习的力量与概率思维，显著提升了预测的准确性与实用性。

一、 DeepAR是什么？超越点预测的智能框架

DeepAR 本质上是一种基于深度学习的概率时间序列预测模型。其核心突破在于摒弃了传统模型仅输出单一“点预测值”的局限（如“明天销量预...

self-llm-开源大模型食用指南

140 views

这个仓库名为 self-llm，是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的大模型教程项目。以下是对该仓库的详细介绍：

项目概述

本项目旨在为更多普通学生、研究者提供开源大模型的全流程指导，简化开源大模型的部署、使用和应用流程，让开源、自由的大模型更好地融入普通学习者的生活。其主要内容涵盖环境配置、本地部署、高效微调等技能的教学。

项目主要内容

开源 LLM 环境配置指南：基于 Linux 平台，针对不同模型要求提供详细的环境配置步骤。
主流开源 LLM 部署使用教程：包括国内外主流的开源 LLM，如 LLaMA、ChatGLM、InternLM 等。
开源 LLM ...

HowToCreateHomunculus-从零开始学习构建智能对话系统

110 views

这个仓库名为 HowToCreateHomunculus，主要聚焦于基于深度学习的对话系统的实现与探索，包含了从简单对话系统到结合数据库和知识图谱的对话系统等多个不同复杂度的项目，为构建对话系统提供了丰富的实践案例和理论指导。以下是对该仓库的详细介绍：

项目概述

项目源于对构建与人类无异的对话系统的向往，受《钢之炼金术师》中瓶中小人角色启发而开展。旨在探索基于深度学习的对话系统的构建方法，并记录学习过程，目前网上缺乏统一鲜明的路线，此项目可作为学习参考。

前置知识

具备编程基础，推荐同时掌握 tensorflow 和 pytorch。
本项目基于 NLPBeginner 开发，可先大致...

N-BEATS-时间序列预测模型-03002

179 views

N-BEATS：面向时间序列预测的纯深度学习模型

在时间序列预测领域，N-BEATS（Neural Basis Expansion Analysis for Time Series）模型于2019年由Element AI的研究团队提出，以其独特的纯深度学习架构、优异的预测性能和良好的可解释性，迅速成为该领域的明星模型。它摒弃了传统模型中的复杂特征工程或特定领域知识依赖，仅使用全连接层（MLP）构建，展现了深度神经网络在时间序列预测中的强大潜力。

核心设计理念与创新

完全深度学习架构：
- N-BEATS 彻底摆脱了传统时间序列模型（如 ARIMA、指数平滑）或混合模型（如结合 LSTM...

docker 镜像导出-

143 views

在Docker中，导出镜像通常用于将镜像保存到文件，以便在其他环境中导入使用。以下是导出镜像的两种常见方法：

方法一：使用`docker save`导出镜像

docker save命令用于将一个或多个镜像打包为一个tar文件，保留镜像的所有层和元数据。

步骤： 1. 查看本地镜像列表
bash docker images 找到需要导出的镜像的REPOSITORY和TAG（或IMAGE ID）。

导出镜像到tar文件
bash docker save -o <输出文件名.tar> <镜像名:标签> # 示例： docker save -o...

cron-定时任务命令

152 views

在 Linux 系统中，查看定时任务（cron jobs）是一项常见的系统管理操作。以下是几种查看和管理系统定时任务的方法：

1. 查看当前用户的定时任务

要查看当前登录用户的定时任务，可以使用以下命令：

crontab -l

这将列出当前用户的所有定时任务。如果没有任何任务，会显示 no crontab for <username>。

2. 查看其他用户的定时任务

如果需要查看其他用户的定时任务，需要有足够的权限（通常是 root 权限）：

sudo crontab -u <username> -l

例如，查看用户 john 的定时任务：

sudo cr...

策略梯度上升-RL

106 views

Policy Gradient Ascent（策略梯度上升）是强化学习中直接优化策略参数的一类方法，核心思想是通过梯度上升调整策略网络的参数，使得智能体在环境中获得的期望累积回报最大化。它属于策略梯度（Policy Gradient）算法家族，适用于连续或高维动作空间场景（如机器人控制）。

核心思想：直接优化策略

与价值函数方法（如Q-learning，通过估计“状态-动作价值”间接优化策略）不同，策略梯度方法直接对策略参数$\theta$（如神经网络权重）进行优化。策略$\pi_\theta(a|s)$表示在状态$s$下选择动作$a$的概率（随机策略）或确定动作（确定性策略）。目标是最...

策略网络-RL

115 views

在强化学习（Reinforcement Learning, RL）中，策略网络（Policy Network）是直接输出智能体（Agent）动作策略的神经网络模型，是策略梯度（Policy Gradient）类算法（如REINFORCE、PPO、TRPO等）的核心组件。其核心作用是将环境状态映射到动作的概率分布（或确定性动作），指导智能体在不同状态下做出决策。

策略网络的核心特点

输入：通常是环境的状态（State），可以是图像（如像素矩阵）、数值向量（如机器人关节角度）等。
输出：
对于离散动作空间：输出各动作的概率分布（通过Softmax激活函数），例如动作空间为3时，输出...

时间差分学习-RL

115 views

时间差分学习（Temporal Difference Learning, TD Learning）是强化学习（Reinforcement Learning, RL）中的核心方法之一，它巧妙结合了动态规划（Dynamic Programming, DP）和蒙特卡洛（Monte Carlo, MC）方法的优点，能够在无需完全知晓环境模型的情况下，通过采样交互数据在线更新值函数。以下从核心概念、算法原理、优势对比及应用场景等方面展开概述：

一、TD学习的核心思想

自举（Bootstrapping）与采样的结合
自举：利用当前已有的值函数估计来更新其他状态的值（类似DP，基于后续状态的估计...

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

Spacetimeformer-时间序列预测模型-03004-V01

Spacetimeformer：时空预测的新范式

DeepAR-时间序列预测模型-03003-V01

DeepAR：面向未来的智能时间序列预测引擎

一、 DeepAR是什么？超越点预测的智能框架

self-llm-开源大模型食用指南

项目概述

项目主要内容

HowToCreateHomunculus-从零开始学习构建智能对话系统

项目概述

前置知识

N-BEATS-时间序列预测模型-03002

N-BEATS：面向时间序列预测的纯深度学习模型

核心设计理念与创新

docker 镜像导出-

方法一：使用`docker save`导出镜像

cron-定时任务命令

1. 查看当前用户的定时任务

2. 查看其他用户的定时任务

策略梯度上升-RL

核心思想：直接优化策略

策略网络-RL

策略网络的核心特点

时间差分学习-RL

一、TD学习的核心思想

Spacetimeformer：时空预测的新范式

DeepAR：面向未来的智能时间序列预测引擎

一、 DeepAR是什么？超越点预测的智能框架

项目概述

项目主要内容

项目概述

前置知识

N-BEATS：面向时间序列预测的纯深度学习模型

核心设计理念与创新

方法一：使用docker save导出镜像

1. 查看当前用户的定时任务

2. 查看其他用户的定时任务

核心思想：直接优化策略

策略网络的核心特点

一、TD学习的核心思想

方法一：使用`docker save`导出镜像