分类目录归档:基础设施

计算任务-ML


在机器学习领域,“计算任务”是指在处理ML workload过程中涉及的各种需要进行计算操作的具体工作,以下是详细介绍:

数据预处理计算任务

  • 数据清洗:去除数据中的噪声、重复数据、缺失值等,可能需要编写代码来识别和处理这些问题。例如,使用Python的pandas库中的drop_duplicates函数去除重复行,使用fillna方法填充缺失值等。
  • 数据标准化与归一化:将数据的特征缩放到特定的范围,如将数据归一化到[0, 1]区间或标准化为均值为0、方差为1的分布。常见的方法有Min-Max归一化和Z-Score标准化,需要进行相应的数学运算。
  • 数据编码:对于分类数据,需要将其转换为计...

Read more

工作负载-ML


“ML workload”指的是机器学习(Machine Learning)工作负载,即运行机器学习任务所需要的计算资源、数据处理量以及模型训练和推理等操作的综合需求,以下是具体介绍:

主要特点

  • 计算密集型:通常需要大量的计算资源来进行数据处理、模型训练和优化。例如,深度神经网络的训练可能需要在多个GPU或TPU上并行计算,以加快训练速度。
  • 数据依赖性强:数据是机器学习的核心,ML workload对数据的质量、数量和多样性有很高要求。大规模的数据集需要高效的存储和读取机制,同时数据的预处理和标注工作也会增加工作负载。
  • 模型复杂度高:随着技术的发展,机器学习模型越来越复杂,如Trans...

Read more

无监督文本摘要


  1. 定义与概念
  2. 无监督文本摘要(Unsupervised Summarization)是一种自然语言处理任务,旨在在没有人工标注的摘要数据(如没有给定摘要样本作为训练参考)的情况下,自动从文本中提取或生成摘要。它主要依赖文本自身的特征,如词频、句子位置、语义相似性等来确定文本的关键内容,从而生成简洁、能够代表原文主要思想的摘要。

  3. 主要方法

  4. 基于统计的方法
    • 词频统计法:这种方法基于一个简单的假设,即文本中出现频率高的词往往是重要的词。例如,在一篇新闻报道中,反复出现的人名、地名、事件名称等高频词可能是关键信息。通过计算词频,选取包含高频词的句子来构成摘要。不过,这种方法的局限性在于,...

Read more

Text as representation


  1. 定义与概念

    • “Text as representation”指的是将文本作为一种数据表示形式,利用文本的内容、结构、语法、语义等方面来传达信息、描述对象或者体现某种特征。文本本身可以是自然语言文本,如文章、句子、短语等,也可以是经过特定格式化、编码后的文本形式,例如用特定符号表示的代码文本等。它旨在通过文字的组织来构建一种能够被计算机或人类理解、分析、处理的表达形式。
  2. 在不同领域的应用及体现

    • 自然语言处理(NLP)

      • 文本分类任务:文本被当作一种表示来区分不同的类别。例如在新闻分类中,一篇新闻报道的文本内容就是其表示,模型会根据文本中包含的词汇、语句结构、语义信息等来判断...

Read more

离散表示-


  1. 定义与概念
  2. 离散表示(Discrete Representation)是一种将数据或信息表示为离散值的方式。与连续表示(如实数范围内的数值)相对,离散表示的取值是有限个或者可数无穷个孤立的值。例如,在数字电路中,信号只有0和1两种状态,这就是一种离散表示;在自然语言处理中,词汇表中的单词可以看作是离散的符号,每个单词就是一个离散的表示单元。

  3. 在不同领域的应用及示例

  4. 自然语言处理
    • 单词表示:单词是自然语言处理中最基本的离散表示单元。词汇表可以看作是一个离散集合,每个单词在这个集合中有一个唯一的索引或标识符。例如,在一个简单的文本分类任务中,文本首先被分割成单词,这些单词就以离散的...

Read more

语音转换


  1. 定义与基本原理
  2. 定义:语音转换(Voice Conversion)是一种音频处理技术,其目的是在保留语音内容(如所说的字词)的基础上,改变语音的音色、语调、语速等属性。例如,将一个人的语音转换为另一个人具有相似内容但不同音色的语音,或者改变语音的情感色彩,如从平淡的语气转换为欢快的语气。
  3. 基本原理:语音转换通常基于对语音信号的声学特征分析和合成。首先,从原始语音信号中提取出声学特征,如基频(Fundamental Frequency,F0)、梅尔频率倒谱系数(Mel - Frequency Cepstral Coefficients,MFCC)、谐波结构等。这些特征可以描述语音的音高...

Read more

表现包含不同信息


  1. 含义解释
  2. 当表示(representation)包含不同方面的信息时,是指这种表示能够综合地捕捉到事物多个维度的特征。以图像为例,一个良好的图像表示不仅包含物体的形状信息,还可能包含颜色、纹理、位置等不同方面的内容。在自然语言处理中,文本的表示可能涵盖词汇语义、语法结构、情感倾向等多个方面的信息。

  3. 在不同领域的体现

  4. 计算机视觉
    • 图像分类任务:在图像分类模型中,图像的表示需要包含足够的信息来区分不同的类别。例如,对于一个猫狗分类器,图像表示需要包含猫和狗在外形(如身体轮廓、四肢形态)、面部特征(如眼睛形状、耳朵位置)、毛发纹理等不同方面的差异信息。像卷积神经网络(CNN)通过卷积...

Read more

特征解缠


  1. 定义与重要性
  2. 定义:Feature disentanglement(特征解缠)是一种在机器学习和数据分析中非常重要的概念。它旨在将数据中的复杂特征表示分解为多个独立、可解释的部分。例如,在图像数据中,将对象的形状、颜色、纹理等不同特征分离出来,使得每个部分都能清晰地代表一个特定的属性。
  3. 重要性:通过特征解缠,可以更好地理解数据的内在结构。对于生成模型来说,能够生成更具可控性的样本。比如在生成人脸图像时,如果实现了特征解缠,就可以单独控制面部表情、发型、肤色等特征。在可解释性方面,解缠后的特征有助于解释模型的决策过程,因为可以明确每个特征对最终结果的贡献。

  4. 实现方法

  5. 基于变分自编...

Read more

iShot-Mac-截图工具


iShot app是一款适用于Mac的功能强大的截图贴图录屏录音OCR翻译取色标注工具 。以下是对其的详细介绍:

功能特点

  1. 丰富的截图方式
    • 基本截图:支持区域截图、窗口截图,可框选或智能识别窗口进行截图,并能自定义截图快捷键。
    • 特殊截图:有多窗口截图功能,按下截图快捷键加Shift键,点选多个窗口即可;延时全屏截图方便截取不易选取的窗口,且支持倒计时声音播放;还能快速截图上一次框选截图的区域或直接截图当前鼠标下的窗口。
    • 特色截图:支持长截图,选择滚动截图区域后按“S”快捷键并向上滑动截图区域即可开始,长度不限且自动滚动;带壳截图可为全屏截图配上Mac外壳模型。
  2. 便捷的截图编辑与管...

Read more

自动编码器-ML


  1. 定义与基本原理
  2. 自动编码器(Auto - Encoder)是一种无监督学习的神经网络架构。它主要由两部分组成:编码器(Encoder)和解码器(Decoder)。
  3. 基本原理是,编码器将输入数据进行压缩,把高维的输入数据映射到一个低维的潜在空间(Latent Space),得到一个紧凑的表示,这个表示被称为编码(Code)。然后解码器将这个编码再映射回原始数据空间,尝试重构出与原始输入相似的输出。例如,对于一张图像,编码器会把图像的像素信息等转换为一个低维的向量,解码器再根据这个向量生成一张新的图像,目标是让这张新图像尽可能接近原始图像。

  4. 网络结构

  5. 编码器:通常是一个由多个全连接...

Read more