- 定义
- 你说的可能是“最大似然估计(Maximum Likelihood Estimation,MLE)”。最大似然估计是一种在统计学中广泛使用的参数估计方法。给定一个概率模型(如正态分布、伯努利分布等)和一组观测数据,其目标是找到模型参数的值,使得观测数据出现的概率(即似然函数)最大。
-
从直观上理解,假设我们有一个包含(n)个独立同分布(i.i.d)样本(x_1,x_2,\cdots,x_n)的数据集,这些样本来自某个概率分布(f(x|\theta)),其中(\theta)是待估计的参数(可以是一个或多个参数)。似然函数(L(\theta|x_1,x_2,\cdots,x_n))定义...
作者文章归档:course
协方差矩阵
- 定义与概念
- 协方差矩阵(Covariance Matrix)是一个方阵,用于描述多个随机变量之间的协方差关系。对于一个包含(n)个随机变量(X_1,X_2,\cdots,X_n)的随机向量(\mathbf{X}=(X_1,X_2,\cdots,X_n)^T),其协方差矩阵(\Sigma)的元素(\sigma_{ij})定义为(\sigma_{ij}=Cov(X_i,X_j)=E[(X_i - \mu_i)(X_j - \mu_j)]),其中(E[\cdot])表示数学期望,(\mu_i = E[X_i])和(\mu_j = E[X_j])分别是(X_i)和(X_j)的均值。
-
从直观上...
高斯分布-
- 定义
-
高斯分布(Gaussian Distribution),也称为正态分布(Normal Distribution),是一种非常重要的概率分布。它的概率密度函数(probability density function,PDF)是一个钟形曲线,其数学表达式为: [ f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x - \mu)^2}{2\sigma^2}} ] 其中,(\mu)是均值(mean),它决定了分布的中心位置;(\sigma)是标准差(standard deviation),它决定了分布的宽度或离散程度。(\pi\approx3.1...
概率
- 概率的定义
- 概率是用于衡量某个事件发生可能性大小的数值。它的值介于0和1之间,其中0表示事件完全不可能发生,1表示事件肯定会发生。例如,掷一枚均匀的硬币,正面朝上的概率是0.5,因为在理想情况下,正面和反面出现的机会是均等的。
-
从数学角度更严格地讲,概率是基于样本空间(Sample Space)定义的。样本空间是一个实验所有可能结果的集合。例如,掷骰子的样本空间是({1,2,3,4,5,6}),而某个事件(如掷出偶数)是样本空间的一个子集(这里是({2,4,6})),这个事件的概率就是该子集元素个数与样本空间元素个数的比值(在这个例子中是(3/6 = 0.5))。
-
概率的计算方法...
先验分布-贝叶斯统计学
- 定义与概念
- 先验分布是贝叶斯统计学中的一个关键概念。它代表了在获取新的数据(观测值)之前,我们对未知参数的一种信念或假设的概率分布。简单来说,就是在看到实验数据之前,根据以往的经验、理论知识或者主观判断,对模型参数可能取值的一种概率描述。
- 例如,在估计一个人群的平均身高时,在还没有实际测量任何人的身高之前,我们可能基于已有的常识(如该人群所属种族的一般身高范围)假设平均身高服从一个正态分布,这个正态分布就是先验分布。其参数(如均值和方差)反映了我们最初的信念强度和不确定性程度。
- 先验分布的类型
- 无信息先验(Non - Informative Prior)
- 这种先验分布尽可能少地包含关于...
分类-监督学习
- 定义
-
在机器学习和数据挖掘等领域,分类(Classification)是一种监督学习(Supervised Learning)任务。它的目标是根据已知类别标签的训练数据构建一个模型,使得该模型能够对新的、未标记的数据进行类别预测。简单来说,就是将数据划分到不同的类别中。
-
常见的分类算法
- 决策树(Decision Tree)
- 决策树是一种基于树结构的分类方法。它通过对特征进行一系列的测试来划分数据。例如,在一个判断水果是苹果还是橙子的分类问题中,决策树可能首先根据形状特征进行划分,如果形状是圆形,再根据颜色进一步划分。内部节点表示特征测试,分支表示测试的结果,叶节点表示类别。决策...
正则化-AI
正则化(Regularization)是一种在机器学习和统计学中用于防止过拟合的技术,通过向模型引入额外的信息或约束来提高模型在未见数据上的泛化能力。以下是几种常见的正则化方法:
1. L1 正则化(Lasso 回归)
- 在损失函数中加入模型权重的绝对值之和作为惩罚项。
- 公式:( \text{损失函数} + \lambda \sum_{i=1}^{n} |w_i| )
- 特点:倾向于将一些权重压缩到零,从而实现特征选择,适合高维数据。
2. L2 正则化(岭回归)
- 在损失函数中加入模型权重的平方和作为惩罚项。
- 公式:( \text{损失函数} + \lambda \sum_{i=1...
讯飞星火-App
讯飞星火是科大讯飞于2023年5月6日发布的认知智能大模型,具有以下特点和优势:
核心能力
- 文本生成:能够根据不同的主题和要求,生成高质量的文本内容,如新闻稿、故事、文案等,并且可以对生成的文本进行修改和优化.
- 语言理解:具备多层次跨语种的语言理解功能,包括语法检查、要素抽取、语篇归整、文本摘要、情感分析以及多语言翻译等,能够准确理解不同语境下的语义.
- 知识问答:可以回答各类问题,涵盖生活知识、工作技能、医学知识、历史人文等众多领域,为用户提供全面且准确的信息支持.
- 逻辑推理:基于思维链的推理能力,能够执行科学推理、常识推理等复杂任务,确保逻辑严谨性和推理准确性.
- 数学能力:支持多题型...
TalkAI 练口语-App
TalkAI 练口语是一款借助人工智能技术辅助提升口语能力的工具,在语言学习领域发挥重要作用。
多元练习模式优势
- 提供丰富场景对话模拟,涵盖日常交流、商务洽谈、旅游出行等多领域。学习者依自身需求与水平选择场景,如在商务谈判场景练习专业词汇、正式句式与谈判技巧;旅游场景中掌握问路、购票、点餐等实用表达及文化背景知识,积累真实语境用语经验,提升语言应用灵活性与精准度,培养自然语感与反应速度。
- 智能语音评测精准反馈发音问题,从音素、音节、重音、语调等多维度分析。如学习者“th”发音不准,系统精准定位并给出改进建议,依评测数据生成个性化学习路径,推送针对性发音练习材料,如相似发音对比练习、绕口...
天翼云
天翼云是中国电信旗下的云计算服务提供商,以下是关于天翼云的一些常见信息:
产品与服务
- 云主机:天翼云提供多种类型的云主机,包括通用型、计算型、内存型、存储型、高性能型等,以满足不同用户的业务需求。例如,通用型云主机适用于一般的网站搭建、企业应用部署等场景;计算型云主机则更适合对CPU计算能力要求较高的应用,如数据处理、高性能计算等 。
- 云存储:提供对象存储、块存储等多种存储服务,可用于存储用户的数据、文件、图片、视频等各类信息,满足企业和个人的数据存储需求。
- 云数据库:支持关系型数据库(如 MySQL、SQL Server、PostgreSQL等)和非关系型数据库(如 Redis、Mo...