The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs: An Exhaustive Review of Technologies, Research, Best Practices, Applied Research Challenges and Opportunities- 论文


这篇文档是一份全面的大语言模型(LLM)微调指南,用通俗的话来说,核心就是教大家“怎么把现成的大模型(比如GPT、LLaMA)改成自己需要的样子”,从基础原理到实际操作都讲透了。

一、先搞懂核心概念:什么是LLM微调?

现成的大模型(比如GPT-3、LLaMA)已经学了海量通用知识,但面对具体场景(比如医疗问诊、金融分析)可能不够用。微调就像是“针对性补课”——用小范围的专属数据(比如医疗病历、金融报告),让大模型在不忘记原有知识的前提下,精准适配特定任务或领域,不用从零训练,省钱又高效。

二、微调的完整流程:七步走就能搞定

文档里给了一个清晰的“七阶段流程”,一步步教你做: 1. 准备...

Read more

Cognitive Architectures for Language Agents-论文


这篇论文核心是提出CoALA(语言智能体认知架构) 框架,为基于大语言模型(LLM)的语言智能体提供统一的设计与分类标准,同时结合认知科学和符号人工智能的历史经验,为通用语言智能体的发展指明方向。

研究背景与动机

  • 语言智能体是一类以LLM为核心、能与世界交互的AI系统,已在机器人控制、网页操作等领域取得实证成功,但缺乏统一框架整合现有研究,不同系统的术语、设计思路零散,难以对比和迭代。
  • 传统认知架构(如Soar)和产生式系统的理念可迁移到LLM领域:LLM本质是概率性的字符串改写系统,与产生式系统存在天然相似性,而认知架构的控制逻辑能弥补LLM在记忆管理、决策规划上的不足。

核心理论...

Read more

2026-01-ONE-Tasks-目标与计划


01月 目标

过去十天-重复出现的Stock

趋势识别与预测

  • 是否有主力
  • 主力意图-正在做什么-未来大概率做什么
  • 趋势周期-
  • 全量预测分析报告

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

  • 资金模型-7d-30d

7d- 量化与超短线策略

参考一个月的资金情况

30d-短线-持股周期-1月

  • 市值 小于60或者100亿

  • 统计预测准确率-页面展示过去30天,预测值与真实值的-两条价格曲线

  • 任务全景-检测页面-查看数据质量与完整性-
  • 增加新功能-5分钟预测能够预测未来两天的5分钟行情数据

2026-01-05--11

作业平台

  • 任务全自动化

分析平...

Read more

2025-12-ONE-Tasks-目标与计划


12月 目标

题材逻辑- AI分析热点

过去十天-重复出现的Stock

趋势识别与预测

  • 是否有主力
  • 主力意图-正在做什么-未来大概率做什么
  • 趋势周期-

单只股票能够做全量模型的分析与预测

真实与预测双线可视化

  • 资金模型-7d-30d

7d- 量化与超短线策略

参考一个月的资金情况

30d-短线-持股周期-1月

  • 市值 小于60或者100亿

  • 统计预测准确率-页面展示过去30天,预测值与真实值的-两条价格曲线

  • 任务全景-检测页面-查看数据质量与完整性-
  • 增加新功能-5分钟预测能够预测未来两天的5分钟行情数据

2025-12-25--31

作业平台

  • 任务全自动化
  • ...

Read more