作者文章归档:course

DeepSeek-V3 Technical Report-论文


这篇论文是关于DeepSeek-V3的技术报告,介绍了该混合专家(MoE)语言模型在架构、训练、评估等方面的创新与优化,展示其超越开源模型、接近闭源模型的性能优势及高效低成本的训练特点。

  1. 模型概述:DeepSeek-V3是671B参数的MoE语言模型,每个token激活37B参数。采用MLA和DeepSeekMoE架构,创新提出无辅助损失的负载均衡策略和多token预测训练目标,在14.8万亿高质量token上预训练,经监督微调(SFT)和强化学习(RL)后,性能优异且训练成本低,模型检查点开源。
  2. 模型架构:基于Transformer框架,采用MLA和DeepSeekMoE。MLA通过...

Read more

解锁PCA:高维数据降维的神奇密码


什么是 PCA

在如今这个数据爆炸的时代,我们所接触的数据维度越来越高。就拿图像数据来说,一张普通的彩色图片,若分辨率为 1920×1080,每个像素点由 RGB 三个颜色通道表示,那么这张图片的数据维度就高达 1920×1080×3,这是一个极其庞大的数字 。在生物信息学领域,基因表达数据中常常包含成千上万个基因的表达量,维度同样高得惊人。高维度数据虽然包含了丰富的信息,但也带来了诸多问题,比如计算量大幅增加,模型训练时间变长,还容易出现过拟合现象,就像一辆装满了过多货物的卡车,行驶起来既缓慢又不稳定。

主成分分析(Principal Component Analysis,简称 PCA...

Read more

主成分分析(PCA)及其在特征选择中的作用-V0


主成分分析(PCA)及其在特征选择中的作用

引言

在数据科学的众多应用中,特征选择是一项至关重要的技术,它直接影响到模型的性能、可解释性以及计算效率。随着数据集维度的不断增加,传统的特征选择方法逐渐暴露出高维数据处理上的不足。主成分分析(PCA)作为一种降维技术,通过将高维数据映射到低维空间,减少特征空间的复杂度,同时保留原始数据中的大部分信息,成为了特征选择中的一种重要工具。本文将详细探讨PCA在特征选择中的作用,涵盖其基本原理、数学推导、具体应用以及实际中的优势和挑战。

1. PCA的基本原理

主成分分析(PCA)是一种统计技术,旨在通过线性变换将数据从原始的特征空间映射到一个新的空...

Read more

统计套利


统计套利(Statistical Arbitrage)是一种基于数学和统计方法的量化交易策略,旨在通过识别和利用金融资产价格之间的短期偏离来获取收益。其核心思想是,资产价格之间的历史关系会在未来重现,当价格偏离历史关系时,可以通过买入低估资产、卖出高估资产来获利。

统计套利的基本原理

  1. 均值回归:假设资产价格或价差会围绕其历史均值波动,当价格偏离均值时,会回归到均值水平。
  2. 配对交易:选择两个或多个相关性高的资产,构建价差(Spread),当价差偏离历史均值时进行交易。
  3. 统计模型:利用时间序列分析、协整关系、主成分分析(PCA)等统计方法,识别资产之间的关系。

统计套利的常见策略

  1. 配...

Read more

QuantPedia-量化百科


QuantPedia是LLMQuant社区下的团队,运营的网页为量化从业者和求职者提供丰富资源,主要涵盖量化知识文档、AI聊天机器人和一对一求职辅导服务三方面内容。

  1. 量化百科文档:精心收集国内外最新量化知识,提供双语版本,内容包含金融和量化术语、策略代码、面试题等。资料来源于公开渠道,如专业投资和金融新闻网站、LinkedIn用户分享;还提取了私有数据库的信息,如专有题库和策略代码库。获取的新信息会实时更新到AI聊天机器人。
  2. AI聊天机器人:开发的QuantPedia.ai基于最新AI模型,方便用户以聊天方式获取量化知识。用户能上传题目获取答案,也可询问国内外顶级对冲基金和投资银行的面...

Read more

主成分分析 (PCA) 原理概述-视频文字


好的,Scribe!我会在原有内容的基础上扩展,确保达到约600字。✨🖋️


主成分分析 (PCA) 原理概述

主成分分析(Principal Component Analysis,PCA)是一种常用于数据降维的技术,其主要目的是在尽量保留数据中大部分变异性的基础上,减少数据的维度。这对于高维数据(例如图像、基因表达数据等)尤其重要,因为降维能够提高数据处理效率,并有助于可视化和分析。PCA广泛应用于机器学习、统计学、图像处理、自然语言处理等领域。

1. 数据中心化

PCA的第一步是对数据进行中心化。即对于每个特征维度,减去其均值。为什么要这样做呢?因为数据的均值可能会引起偏移,导致在分...

Read more

幻方量化-模型


幻方量化在其量化投资与AI技术中主要使用了DeepSeek系列模型,特别是DeepSeek-V3DeepSeekMoE模型。以下是具体分析:

1. DeepSeek-V3:核心量化投资模型

  • 性能与定位
    DeepSeek-V3是幻方量化自主研发的大模型,其性能对标国际顶尖闭源模型如GPT-4o和Claude-3.5-Sonnet,在英语、数学、代码、多语言任务等多项评测中表现优异。该模型还被用于高频交易决策、风险管理及多模态数据分析,帮助幻方量化快速捕捉市场波动并优化投资策略。

  • 技术特点

  • 高效低成本:训练成本仅为557.6万美元(基于H800 GPU租用价格),约为GP...

Read more

make.com-无代码/低代码自动化工具-网站池


以下是 Make.com 官网内容的清晰结构化总结:


1. 平台概述

  • 定位: 一款领先的无代码/低代码自动化工具,帮助用户构建复杂的工作流程(Scenario),连接不同应用程序和服务。
  • 前身: 原名为 Integromat,后更名为 Make.com,强调其“构建自动化”的核心功能。
  • 核心价值: 通过可视化界面简化跨系统集成,提升企业及个人的工作效率。

2. 核心功能

  1. 可视化工作流构建器
  2. 通过拖放模块(Apps、Actions)设计自动化流程,无需编程。
  3. 支持条件逻辑(if/else)、循环、数据过滤等高级操作。
  4. 海量应用集成
  5. 连接 1,000+ 应用(如 Googl...

Read more

智能投顾平台-原理架构-视频文字


智能投顾平台(Robo-Advisor)的核心原理是通过算法模型、数据分析和自动化流程为投资者提供个性化的投资建议和管理服务。以下是智能投顾平台的基本原理和技术架构:

1. 智能投顾的原理

智能投顾平台的核心原理包括: - 数据分析:平台收集大量的市场数据、用户风险偏好、投资目标等信息,使用机器学习和统计模型分析这些数据。 - 投资策略:根据用户的风险承受能力、投资期限、预期收益等,智能投顾平台会通过资产配置和投资组合优化等方法制定个性化的投资策略。 - 自动化决策:平台自动执行投资决策,包括资产配置、再平衡等,确保投资组合与用户目标保持一致。 - 持续监控与调整:智能投顾平台会定期监控...

Read more