The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities- 论文

52 views

这篇文档是一份全面的大语言模型（LLM）微调指南，用通俗的话来说，核心就是教大家“怎么把现成的大模型（比如GPT、LLaMA）改成自己需要的样子”，从基础原理到实际操作都讲透了。

一、先搞懂核心概念：什么是LLM微调？

现成的大模型（比如GPT-3、LLaMA）已经学了海量通用知识，但面对具体场景（比如医疗问诊、金融分析）可能不够用。微调就像是“针对性补课”——用小范围的专属数据（比如医疗病历、金融报告），让大模型在不忘记原有知识的前提下，精准适配特定任务或领域，不用从零训练，省钱又高效。

二、微调的完整流程：七步走就能搞定

文档里给了一个清晰的“七阶段流程”，一步步教你做： 1. 准备...

Cognitive Architectures for Language Agents-论文

63 views

这篇论文核心是提出CoALA（语言智能体认知架构） 框架，为基于大语言模型（LLM）的语言智能体提供统一的设计与分类标准，同时结合认知科学和符号人工智能的历史经验，为通用语言智能体的发展指明方向。

研究背景与动机

语言智能体是一类以LLM为核心、能与世界交互的AI系统，已在机器人控制、网页操作等领域取得实证成功，但缺乏统一框架整合现有研究，不同系统的术语、设计思路零散，难以对比和迭代。
传统认知架构（如Soar）和产生式系统的理念可迁移到LLM领域：LLM本质是概率性的字符串改写系统，与产生式系统存在天然相似性，而认知架构的控制逻辑能弥补LLM在记忆管理、决策规划上的不足。

核心理论...

专知-专业可信的知识分发-网站池

62 views

专业可信的知识分发

官网

2026-01-ONE-Tasks-目标与计划

93 views

01月目标

过去十天-重复出现的Stock

趋势识别与预测

是否有主力
主力意图-正在做什么-未来大概率做什么
趋势周期-
全量预测分析报告

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

资金模型-7d-30d

7d- 量化与超短线策略

参考一个月的资金情况

30d-短线-持股周期-1月

市值小于60或者100亿
统计预测准确率-页面展示过去30天，预测值与真实值的-两条价格曲线
任务全景-检测页面-查看数据质量与完整性-
增加新功能-5分钟预测能够预测未来两天的5分钟行情数据

2026-01-05--11

作业平台

任务全自动化

分析平...

2025-12-ONE-Tasks-目标与计划

78 views

12月目标

题材逻辑- AI分析热点

过去十天-重复出现的Stock

趋势识别与预测

是否有主力
主力意图-正在做什么-未来大概率做什么
趋势周期-

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

资金模型-7d-30d

7d- 量化与超短线策略

参考一个月的资金情况

30d-短线-持股周期-1月

市值小于60或者100亿
统计预测准确率-页面展示过去30天，预测值与真实值的-两条价格曲线
任务全景-检测页面-查看数据质量与完整性-
增加新功能-5分钟预测能够预测未来两天的5分钟行情数据

2025-12-25--31

作业平台

任务全自动化

弱监督学习实用指南-Books

71 views

弱监督介绍

使用 Snorkel 框架深入数据编程

标记行为

使用Snokel 标记的数据集进行文本分类

使用Snokel 标注的数据集进行图像分类

扩展性和分布式训练

国家为什么会破产-Books

72 views

博弈论-每个人都可以成为决策高手--Books

65 views

皇帝内经-Books

80 views

简单的逻辑学-Books

69 views

从零构建开源智能系统

构建专属智能系统，AI赋能加速成为领域专家。

The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities- 论文

一、先搞懂核心概念：什么是LLM微调？

二、微调的完整流程：七步走就能搞定

Cognitive Architectures for Language Agents-论文

研究背景与动机

核心理论...

专知-专业可信的知识分发-网站池

2026-01-ONE-Tasks-目标与计划

01月目标

过去十天-重复出现的Stock

趋势识别与预测

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

2026-01-05--11

作业平台

分析平...

2025-12-ONE-Tasks-目标与计划

12月目标

题材逻辑- AI分析热点

过去十天-重复出现的Stock

趋势识别与预测

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

2025-12-25--31

作业平台

弱监督学习实用指南-Books

弱监督介绍

使用 Snorkel 框架深入数据编程

标记行为

使用Snokel 标记的数据集进行文本分类

使用Snokel 标注的数据集进行图像分类

扩展性和分布式训练

国家为什么会破产-Books

博弈论-每个人都可以成为决策高手--Books

皇帝内经-Books

简单的逻辑学-Books

一、先搞懂核心概念：什么是LLM微调？

二、微调的完整流程：七步走就能搞定

研究背景与动机

核心理论...

01月 目标

过去十天-重复出现的Stock

趋势识别与预测

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

2026-01-05--11

作业平台

分析平...

12月 目标

题材逻辑- AI分析热点

过去十天-重复出现的Stock

趋势识别与预测

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

2025-12-25--31

作业平台

弱监督介绍

使用 Snorkel 框架深入数据编程

标记行为

使用Snokel 标记的数据集进行文本分类

使用Snokel 标注的数据集进行图像分类

扩展性和分布式训练

01月目标

12月目标