分类目录归档:基础设施

数据基础-AI


数学是人工智能(AI)的基石,许多核心算法和方法都依赖于数学理论和技巧。以下是 AI 领域中常用的数学基础及其具体应用:


1. 线性代数(Linear Algebra)

线性代数是 AI 中用于表示和操作数据的关键工具,特别是在深度学习和机器学习中。

核心概念

  • 向量和矩阵:用于存储和操作数据,如模型权重、输入特征。
  • 矩阵乘法:在神经网络中用于线性变换。
  • 特征值与特征向量:在降维算法(如 PCA)中用于捕捉主要变化方向。
  • 范数(Norm):衡量向量或矩阵的大小,用于正则化(L1 和 L2 范数)。

应用

  • 神经网络的权重更新和计算。
  • 图像数据的表示和操作。
  • 高维数据的降维处理。

...

Read more

自然语言处理-AI


自然语言处理(Natural Language Processing, NLP) 是人工智能的一个子领域,涉及计算机与人类语言的交互。NLP的目标是让计算机理解、解释、生成和回应人类语言,从而实现自动化的语言任务。它广泛应用于语音识别、文本分析、机器翻译、聊天机器人、情感分析等多个领域。


1. 自然语言处理的核心任务

(1) 语音识别(Speech Recognition)

  • 功能:将语音信号转化为文本。
  • 应用:语音助手(如 Siri、Google Assistant)、语音翻译、自动转录等。

(2) 语义理解(Semantic Understanding)

  • 功能:理解文本的意义和...

Read more

计算机视觉-AI


计算机视觉(Computer Vision, CV) 是人工智能的一个重要分支,旨在使计算机能够从数字图像或视频中提取、分析和理解信息,模拟人类视觉系统的功能。计算机视觉涉及多种技术,包括图像处理、模式识别、机器学习等,广泛应用于自动驾驶、医疗影像、视频监控、工业检测等领域。


1. 计算机视觉的核心任务

(1) 图像分类(Image Classification)

  • 功能:对图像进行分类,判断图像属于哪一类。
  • 应用:图像识别(如猫狗分类、人脸识别等)。

(2) 物体检测(Object Detection)

  • 功能:在图像中识别出物体并定位其位置,通常以边框框出物体。
  • 应用:自动驾驶中...

Read more

人工智能AI基础


人工智能(AI)基础 是理解和开发智能系统的核心学科,它涉及计算机科学、数学、统计学、神经科学等多个领域。人工智能的目标是让计算机模拟、延伸或增强人类的智能行为,包括学习、推理、感知、决策和语言理解等能力。以下是人工智能的一些基础概念和知识。


1. 人工智能的定义

人工智能指的是让计算机或机器人执行通常需要人类智能的任务的技术。这些任务包括图像识别、语音识别、自然语言理解、机器翻译、决策制定等。人工智能通过算法、数据、计算力来模拟或模仿人类的认知功能。


2. 人工智能的主要分支

(1) 机器学习(Machine Learning, ML)

  • 定义:机器学习是人工智能的一个子领域,旨在...

Read more

AI 赋能前的评估


在将人工智能(AI)赋能到某个领域或系统之前,进行充分的评估是非常重要的。这个评估不仅能够帮助组织了解AI技术的潜力和应用范围,还能预见可能面临的挑战,并制定相应的应对策略。以下是AI赋能前的评估的一些关键要素:


1. 业务需求与目标评估

(1) 目标明确性

  • 问题:首先需要明确业务或项目的核心目标是什么,是否确实需要AI技术来解决问题。
  • 评估内容
  • 识别和定义业务问题(如提高效率、减少成本、提升用户体验等)。
  • 确定AI技术是否能够有效帮助实现这些目标。

(2) 期望效果

  • 问题:AI实施后的预期成果和效益是什么?是否符合业务需求和目标?
  • 评估内容
  • 确定AI应用的具体期望效果,例如...

Read more

百度智云


百度智能云提供持续创新的产品与服务,主要包括以下方面:

优惠活动

  • 11.11超省季:云服务器低至99元/年,千帆大模型低至6.8折;新人福利有云服务器/域名/AI作画/文字识别/人脸/语音等低至1元;主会场千帆大模型首购18元起,组合购买低至2.8折,还有人脸识别、文字识别5.5折秒杀等。
  • 620续费优惠专场:云服务器续费低至2折,流量存储低至5折。
  • 0828组合购活动:组合购买低至5折。

产品服务

  1. 人工智能
    • 千帆ModelBuilder:ERNIE 4.0 Turbo面向企业用户全面开放,全场景覆盖,低门槛使用,新用户免费体验百万Tokens调用。
    • 千帆AppBuilder:提供...

Read more

swarm-AI


Swarm 是 OpenAI 开发的一个实验性教育框架,旨在支持多代理(multi-agent)协作,通过任务的上下文交换、责任转移和工具的高效使用来完成复杂任务。它关注于可扩展性和简单性,适合需要多回合交互的应用场景。

主要特点:

  1. 多代理设计
    每个代理(agent)都有独立的指令和功能,可以根据需要将任务交接给其他代理。例如,一个代理专注于英文对话,而另一个代理专注于西班牙语,可以根据需求进行任务分配。

  2. 工具集成能力
    代理可以调用工具或功能(例如执行外部操作),并将结果整合到任务流程中。

  3. 上下文管理
    开发者可以在交互过程中传递和更新上下文变量,从而支...

Read more

向量数据库


向量数据库是一种专门用于存储和管理向量数据的数据库,通常用于处理高维数据,广泛应用于机器学习、自然语言处理(NLP)、计算机视觉和推荐系统等领域。

在机器学习和人工智能的上下文中,向量是数据点的数学表示形式,每个数据点被映射到一个多维空间(通常称为“嵌入”)。这些向量表示诸如词语、图像或用户行为等内容,可以通过相似度度量(如余弦相似度、欧几里得距离或点积)进行比较。

向量数据库的主要特点:

  1. 高维数据存储:向量数据库针对高维数据的存储和搜索进行了优化。
  2. 高效相似度搜索:支持高效的最近邻搜索,能够快速找到与查询向量最相似的项,常用的算法有k近邻(k-NN)近似最近邻(ANN)HNSW(...

Read more

AI应用开发堆栈


模型开发

基础模型

  • 数据体系
  • 数据集/语料
  • 标注系统
  • 管线系统

  • 模型体系

  • 深度
  • 参数
  • 模态
  • Token

  • 集群体系

  • 多卡并行
  • RDMA带宽
  • 基于以太网/HPC的通讯调度

  • 训练体系

  • 指令调试
  • 正则化/Epoch优化等

  • 对齐体系

  • 自然语言
  • 代码
  • 价值观/安全

  • 评估体系

  • 系统化的工程体系
  • 性能
  • 成本
  • 多维度优化

  • 垂直/领域模型

  • 基于已有大模型

    • 知识蒸馏
    • 微调或提示
    • PEFT
  • 领域数据集

  • 语言学知识/知识图谱
  • API工具和服务

  • 多模态/扩散模型

  • 数据系统
    • 标注数据集
  • 模型系统
  • 可扩展Transformer
  • U-Net等结...

Read more

股价预测智能体-Agent-AI


股价预测智能体(Stock Price Prediction Agent)

股价预测智能体 是一种使用人工智能(AI)、机器学习(ML)、大数据分析和自然语言处理(NLP)等技术,自动化地分析股市数据、新闻、社交媒体、公司财报等信息,预测股票价格走势的智能系统。股价预测智能体的目标是帮助投资者、交易员或金融机构作出更为精准的投资决策,尽量减少风险和提高回报。

股价预测本质上是一个复杂的时间序列预测问题,由于股市波动性强,受到各种因素的影响,准确预测股价是一个极具挑战的任务。然而,通过运用先进的机器学习技术和大量的历史数据,股价预测智能体可以为投资者提供有价值的预测信息。

股价预测智能体的...

Read more