分类目录归档：基础设施

长文本摘要总结-AI

267 views

大语言模型（LLM）在长文本摘要总结方面的应用通常包括对长文档的提取性总结和抽象性总结。以下是这两种方法的解释及其在LLM中的实现方式：

1. 提取性总结（Extractive Summarization）

定义：提取性总结是从原始长文本中直接提取关键句子或段落，重新组织并形成简洁的总结。这种方法不改变原文的内容，而是选择最能代表原文的句子。
过程：
- LLM通过识别文本中的重要信息来提取出关键词或关键句子。
- 这些句子被直接用作总结的一部分，保留原文中的信息而不进行修改。
优点：
- 保持原文的准确性。
- 处理速度较快，因为只需从原文中提取内容。
缺点：
- 可能导致不连贯的总结，因为提取...

LLM类型-AI

220 views

在大语言模型（LLM）领域，“Base LLM”和“Instruction-tuned LLM”指的是不同类型的模型版本，它们的训练方式和应用场景有所不同：

1. Base LLM (基础语言模型)

定义：Base LLM是指未经特别调整的原始大语言模型，通常是通过大量文本数据进行训练的，目标是让模型理解和生成语言。这个模型已经学会了如何根据上下文生成语言，但它并没有经过特别的微调来执行特定的任务。
特点：
- 训练方式：通过大规模的无监督学习训练，通常会使用大量的互联网文本数据。
- 能力：能够生成通用的自然语言文本、回答问题、翻译语言等。
- 用途：适用于各种自然语言处理任务，但在特定任务上的...

FAQ-提示词工程Prompt Engineering

221 views

要精通提示词工程，以下是你可以考虑提出的几个重要问题，这些问题将帮助你系统地理解和掌握提示词的设计与优化：

1. 基础概念和原则

什么是提示词工程（Prompt Engineering）？它如何影响语言模型的输出？
如何理解语言模型对提示的反应机制？它是如何生成回应的？
什么样的提示能够确保模型生成高质量、精确的输出？

2. 提示设计的基本技巧

如何创建简洁且高效的提示，以避免过于宽泛或模糊的回应？
提示中需要包含哪些关键信息来确保模型理解并有效回应？
如何在提示中控制输出的长度、风格和语气？
如何通过实例来引导模型生成特定风格或格式的内容？

3. 复杂任务的提示设计

对于复杂...

隐马尔可夫模型

245 views

隐马尔可夫模型（Hidden Markov Model，HMM） 是一种统计模型，用于描述一个由隐含的马尔可夫过程生成的可观测数据序列。HMM 是基于马尔可夫链的概念，但在标准马尔可夫模型中，状态是直接可观测的，而在 HMM 中，状态是隐含的（即不可见的），而我们只能通过某些观测（即可观测的输出）来推测当前的隐状态。

一、HMM 的基本组成部分

隐马尔可夫模型有三个主要部分：

状态空间（State Space）：
HMM 由一组隐状态组成，假设这个状态空间是有限的，且这些隐状态是不可观测的。
状态之间具有马尔可夫性质，即每个状态仅依赖于前一个状态，满足“无记忆”性质。
观测空间...

Socks5-网络协议

317 views

Socks5 是一种网络协议，属于 SOCKS（Socket Secure） 协议的第五版。它是一种通用的代理协议，用于在客户端与服务器之间转发网络流量，能够代理任何类型的流量（如 HTTP、FTP、SMTP 等），不仅局限于特定的应用协议。

一、SOCKS5 的特点

协议级代理：
SOCKS5 工作在会话层（第 5 层）和传输层（第 4 层）之间，能够代理任意应用协议的数据包。
与 HTTP 代理不同，它不修改数据包，仅转发流量。
支持身份验证：
SOCKS5 可以支持无验证、用户名/密码验证、GSS-API 等方式，增强了安全性。
支持 UDP 和 TCP：
除...

ufw-命令-ubuntu

253 views

在 Ubuntu 上查看防火墙规则的命令取决于所使用的防火墙管理工具。以下是常用工具的查看方法：

一、使用 `ufw`（Uncomplicated Firewall）

Ubuntu 默认的防火墙工具是 ufw。查看规则的方法如下：

查看防火墙状态 bash sudo ufw status 输出示例： ``` Status: active

To Action From -- ------ ---- 22/tcp ...

关键字-机器学习领域

221 views

以下是机器学习领域中的主要关键字分类及其简要解释，涵盖基础理论、算法、技术和应用领域等：

一、基础概念

数据：训练集、验证集、测试集、特征、标签
模型：参数、超参数、假设空间
目标函数：损失函数（MSE、Cross-Entropy）、正则化项
优化：梯度下降法、学习率、优化器

二、算法类型

1. 监督学习

回归：线性回归、岭回归、LASSO
分类：逻辑回归、支持向量机（SVM）、k-近邻（k-NN）
树模型：决策树、随机森林、梯度提升树（GBDT、XGBoost、LightGBM、CatBoost）

2. 无监督学习

聚类：k-Means、DBSCAN、层次聚类
降维：主成...

梯度消失和梯度爆炸-问题解释

252 views

梯度消失和梯度爆炸是深度神经网络训练中常见的问题，尤其在较深的网络或循环神经网络（RNN）中表现明显。这些问题会导致模型难以收敛或出现不稳定性。以下是这两个问题的详解，包括其成因、影响及应对策略。

一、梯度消失问题

1. 问题描述

梯度消失是指在反向传播过程中，梯度逐层变小，最终接近于零。这使得靠近输入层的权重更新几乎停止，导致模型无法有效训练。

2. 成因

激活函数的性质：
Sigmoid 和 Tanh 激活函数在接近饱和区时（输入值绝对值较大），导数趋近于零。
在反向传播中，梯度是通过链式法则逐层相乘的，若每层梯度小于 1，最终梯度会指数级衰减。
网络深度：
网络越深，梯...

机器学习知识体系-AI

254 views

构建机器学习知识体系是理解和掌握机器学习的核心过程。以下是一个较为系统的知识体系框架，可以帮助你全面学习和应用机器学习。

一、基础知识

1. 数学基础

线性代数
矩阵、向量
矩阵分解（SVD、PCA 等）
特征值与特征向量
概率与统计
概率分布（正态分布、指数分布等）
贝叶斯定理
最大似然估计与贝叶斯估计
微积分
导数与梯度
多元函数的偏导数
梯度下降法
优化理论
凸优化
拉格朗日乘子法

2. 编程基础

Python（推荐）、R、Julia 等
数据处理库（Pandas、NumPy、SciPy）
可视化工具（Matplotlib、Seaborn）

3. ...

Dock位置调整-Mac

328 views

是的，macOS 中关于 Dock（程序坞）的位置设置确实位于 系统设置 > 桌面与程序坞（早期版本叫“Dock”）。以下是具体操作步骤：

打开 系统设置（点击苹果图标 > 系统设置）。
在侧边栏中找到并点击 桌面与程序坞。
在 Dock 的位置 部分，你可以选择：
屏幕左侧
屏幕底部
屏幕右侧

选择 屏幕左侧，Dock 就会移动到屏幕的左边。

注意：
- 这个设置只影响 Dock 的位置，macOS 的菜单栏依旧固定在屏幕顶部，无法移动到屏幕左边。
- 如果需要调整 Dock 的大小、自动隐藏等，也可以在同一设置界面中完成。

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

长文本摘要总结-AI

1. 提取性总结（Extractive Summarization）

LLM类型-AI

1. Base LLM (基础语言模型)

FAQ-提示词工程Prompt Engineering

1. 基础概念和原则

2. 提示设计的基本技巧

3. 复杂任务的提示设计

隐马尔可夫模型

一、HMM 的基本组成部分

Socks5-网络协议

一、SOCKS5 的特点

ufw-命令-ubuntu

一、使用 `ufw`（Uncomplicated Firewall）

关键字-机器学习领域

一、基础概念

二、算法类型

1. 监督学习

2. 无监督学习

梯度消失和梯度爆炸-问题解释

一、梯度消失问题

1. 问题描述

2. 成因

机器学习知识体系-AI

一、基础知识

1. 数学基础

2. 编程基础

3. ...

Dock位置调整-Mac

1. 提取性总结（Extractive Summarization）

1. Base LLM (基础语言模型)

1. 基础概念和原则

2. 提示设计的基本技巧

3. 复杂任务的提示设计

一、HMM 的基本组成部分

一、SOCKS5 的特点

一、使用 ufw（Uncomplicated Firewall）

一、基础概念

二、算法类型

1. 监督学习

2. 无监督学习

一、梯度消失问题

1. 问题描述

2. 成因

一、基础知识

1. 数学基础

2. 编程基础

3. ...

一、使用 `ufw`（Uncomplicated Firewall）