集成学习实战-高塔姆-Books
集成学习基础知识
集成方法: 炒作还是福音
基本集成方法
同质并行集成:Bagging法和随机森林
异质并行集成: 结合强学习起
顺序集成: 自适应提升
顺序集成: 梯度提升
顺序集成: 牛顿提升
集成之外: 将集成方法应用于你的数据
学习连续和计数标签
学习分类特征
集成学习可解释性
Python预测之美-数据分析与算法实战
预测入门
认识预测
什么是预测
占卜术
神秘的地动仪
科学预测
预测的原则
前沿技术
大数据与预测
大数据预测的特点
人工智能与预测
热工智能预测的特点
典型预测案例
Python 预测初步
数据预处理
建立模型
预测及误差分析
预测方法论
预测流程
确定主题
收集数据
选择方法
分析规律
建立模型
评估效果
发布模型
指导原则
界定问题
判断预测法
外推预测法
因果预测法
探索规律
相关分析
自相关分析
偏相关分析
简单相关分析
互相相关分析
典型相关分析
因果分析
什么是因果推断
因果推断的方法
时序因果推断
聚类分析
关联规则挖掘
Apriori 算法
Eclat 算法
序列模式挖...
精通API架构-设计,运维与演进-Books
导论
设计,构建和测试API
设计 构建和规范API
API 接口测试
API 流量管理
API 网关:入口流量管理
服务网格: 服务间流量管理
API 运维与安全
部署和发布API
运维安全性: API 的威胁建模
API 身份验证和授权
实用API 的演进架构
将应用程序重新设计为API 驱动的架构
实用API 基础设施向云平台演进
总结
预测中国A股下一个交易日的全天5分钟级别的价格-V02
1. 数据收集与处理
1.1 数据源
- 基础数据:A股的历史交易数据,包括
开盘价、收盘价、最高价、最低价、成交量等,可以使用Tushare或Akshare等API进行获取。 - 数据频率:需要5分钟级别的OHLCV数据。这意味着每5分钟会有一次更新的数据点。
- 市场情绪与资金流向:除了价格数据,情绪数据(新闻、社交媒体)和资金流向(主力资金、行业资金等)是非常重要的。可以通过
舆情分析、热度分析以及资金流向来增加模型的预测能力。
1.2 数据清理与预处理
- 缺失值与异常值处理:金融数据常常存在缺失或异常,需要使用插值法、均值填充、异常值检测(如IQR、Z-Score)等技术来处理。
- 时间序列...
预测中国A股下一个交易日的全天5分钟级别的价格-V01
要预测中国A股下一个交易日的全天5分钟级别的价格,基本上需要以下几个步骤来构建模型和实现方案:
1. 数据收集与准备
- 历史数据:获取A股的历史价格数据,最好是高频数据(如5分钟级别的OHLCV数据:开盘价、最高价、最低价、收盘价和成交量)。可以通过
akshare、tushare等API来获取。 - 数据清理:处理缺失值,去除异常值,确保数据的质量。时间序列数据需要对齐,确保没有错过任何一个时间点。
-
特征工程:为模型构建相关特征,例如:
-
技术指标:移动平均线(MA)、相对强弱指数(RSI)、MACD等。
- 成交量特征:成交量与成交价的比值。
- 资金流向:主力资金的流入流出情况。
- 行业数据...
申万一级行业-
申万一级行业是申银万国证券对行业的划分方法,从投资管理角度出发,同时考虑实际研究需要,将上市公司划分为31个一级行业、124个二级行业和395个三级行业。以下是对申万一级行业的具体介绍:
上游资源行业
- 石油石化:包括油气开采、炼化等环节,是能源和化工产品的重要来源。该行业具有强周期性,受国际油价、地缘政治等因素影响较大,代表公司有中国石油、中国石化等。
- 煤炭:主要从事煤炭开采与加工,为电力、钢铁等行业提供基础能源。煤炭行业的发展与宏观经济形势密切相关,需求波动较大,代表公司有中国神华、陕西煤业等。
- 有色金属:涵盖金属矿石开采、冶炼及能源金属如锂、钴等的生产。有色金属价格波动频繁,受全球...
时间序列预测-数据量大小-预测方式选择
在实际深度学习时序预测中,“数据量小/大”没有绝对标准,但有一些经验参考:
数据量小:
通常指样本数低于几千条(如<2000~3000),或者训练集天数少于1年(A股5分钟数据一天48条,1年约1万条)。 特征维度多时,样本数/特征数比值低于10~20,也算偏小。 小数据下,复杂模型(如一次性多步Seq2Seq)容易过拟合,递归单步预测更稳健。 数据量大:
样本数达到几万条以上(如>10000~20000),或训练集覆盖2年以上。 特征维度不多时,样本数/特征数比值高于50~100。 大数据下,一次性多步预测模型能学到更复杂的时序关系,效果更好。 预测步数(序列长度):
短步...
windows-激活虚拟环境
PS D:\01-sourceCode\02-AICDA\predict-price-model> Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser PS D:\01-sourceCode\02-AICDA\predict-price-model> ..venv\Scripts\Activate.ps1
中国A股市场5分钟级别数据预测系统设计文档
中国A股市场5分钟级别数据预测系统设计文档
1. 项目概述
1.1 目标
使用深度学习模型(LSTM/Transformer)基于过去24个交易日的5分钟级别历史数据,预测下一个交易日全天的5分钟级别市场数据(48个时间点)
1.2 核心挑战
- 超长序列预测(输入6912点 → 输出48点)
- 中国A股特有市场规则(涨跌停、T+1、交易时段)
- 高频数据噪声与市场突发事件影响
- 散户主导市场的情绪化波动
1.3 适用范围
- 沪深300成分股及指数ETF(510300等)
- 交易日正常开市时段(9:30-11:30, 13:00-15:00)
- 非极端行情时期(避免熔断、股灾等异常情况)