该网页主要聚焦人工智能领域的最新动态,涵盖技术进展、企业融资、应用探索以及伦理问题等多方面内容。具体如下: 1. 技术进展 - OpenAI正式发布Sora,结束此前的demo片段和谜题猜测,成为完整视频生成产品。 - 谷歌推出Gemini 2.0 Flash模型,全面转向Agent,支持多模态输入输出,免费开放使用。 - 田渊栋团队论文揭示连续思维链在LLM推理中的优势,开启新范式。 - UCLA教授用三个月调教AI,将用于生成2025年冬季比较文学课程教科书、作业并提供助教服务。 2. 企业融资 - 智能影像先锋品牌「hohem浩瀚」获超亿元B...
分类目录归档:解决方案
自动思维链
- 基本概念
-
自动思维链(Auto - CoT)是一种新兴的自然语言处理技术,用于提升语言模型在复杂推理任务中的性能。它的核心思想是自动生成一系列连贯的思维步骤,即思维链(Chain - of - Thought,CoT),以帮助语言模型更好地解决需要推理的问题。思维链就像是解决问题的路线图,引导语言模型从问题出发,通过逐步推理得出答案。
-
自动生成思维链的流程
- 问题分解与示例抽取:首先,Auto - CoT会对大量的训练问题进行分析。对于每个问题,它尝试找到合适的推理示例。这些示例可以从已有的高质量问答数据、学术文献、教程等多种渠道获取。例如,在数学问题领域,从数学教材中的例题及其...
CodeFuse-ChatBot-开源的AI智能助手
CodeFuse-ChatBot是一款开源的AI智能助手,专注于软件开发生命周期,通过多种技术和功能提升开发运维效率,具有丰富的特性、便捷的使用方式和活跃的更新维护。 1. 项目概述 - 开发团队与目标:由蚂蚁CodeFuse团队开发,旨在简化和优化软件开发生命周期各环节,结合Multi - Agent协同调度机制,集成多种工具库、代码库、知识库和沙盒环境,助力DevOps领域任务处理。 - 更新记录 - 2024.01.29:开放可配置化的multi - agent框架codefuse - muAgent。 - 2023.12.26:基于...
Jira Service Management-高速服务管理的软件
Jira Service Management是一款借助AI助力团队实现高速服务管理的软件,具有多方面优势,能满足不同规模团队需求,涵盖多种功能与应用场景,并提供丰富资源和集成能力。 1. 产品价值主张 - 助力企业在数字化服务快速发展中,通过将开发(Dev)、IT和业务团队整合于一个AI驱动的平台,提升服务交付速度和质量,实现卓越服务。 2. 主要功能特性 - IT支持功能 - 轻松搭建服务台,集中管理请求,利用AI自动化支持交互,提高效率。 - 高速服务管理优势 - 加速开发与运维协作,增强团队间协作,有效管理风险,同时赋能所有...
codefuse-devops-eval-codefuse-devops-eval
codefuse-devops-eval是针对DevOps/AIOps领域大语言模型的评估基准项目,提供了丰富的测试数据和评估方法,用于衡量模型在该领域的能力和表现。 1. 项目概述 - 目的:为DevOps领域的基础模型提供全面评估套件,帮助开发者跟踪模型进展、分析优缺点。 - 内容:包含与DevOps相关的问题和练习,涵盖AIOps、ToolLearning等方面,目前有7486道多项选择题,涉及8个大类。 2. 更新记录 - 2023.12.27:添加1509个ToolLearning样本,涵盖59个领域的239个工具类别,发布相关评估排行榜。 - ...
devops 工具集
- 版本控制工具
- Git
- 概述:目前最流行的分布式版本控制系统。它允许开发团队对代码的版本进行管理,记录代码的变更历史,包括谁在何时修改了什么内容。
- 功能特点:
- 分支管理功能强大,方便开发人员同时在多个功能分支上工作,如开发新功能、修复bug等,而不会相互干扰。例如,一个开发团队可以为每个新功能创建一个单独的分支,在分支上进行开发和测试,完成后再合并到主分支。
- 支持分布式工作流程,每个开发人员都可以在本地拥有完整的代码仓库副本。这意味着即使在没有网络连接的情况下,开发人员也可以在本地提交代码变更,之后再将这些变更推送到远程仓库。
-
Subversion(SVN)
- 概述:集中式版本控制...
ModelScope-开源社区推动人工智能发展的平台
ModelScope是一个通过开源社区推动人工智能发展的平台,涵盖多种功能,包括提供丰富的模型、支持多种任务、拥有模型训练和评估工具、具备展示空间等,旨在帮助用户快速开发和应用人工智能技术。 1. 平台功能概述 - 模型与任务支持:提供多种类型的模型,如InternVL2_5 - 78B、Llama - 3.3 - 70B - Instruct、Qwen系列等,涵盖计算机视觉、自然语言处理、语音、多模态、科学计算等多个领域的任务,如视觉检测、文本分类、语音识别、图像生成等。 - 数据集资源:包含Infinity - Instruct、P - MMEval、longwrit...
CodeFuse-DevOps-Model-开源的中文开发运维大模型
CodeFuse-DevOps-Model是一系列开源的中文开发运维大模型,主要用于解决DevOps领域的问题,提供了模型下载、评测、快速使用、训练及量化等相关内容。 1. 模型概述 - 模型研发:基于Qwen系列模型,使用高质量中文DevOps语料加训得到Base模型,再经DevOps QA数据对齐产出Chat模型。 - 模型下载:提供了7B和14B的基座模型(Base)和对齐模型(Chat),可从🤗Huggingface和🤖ModelScope获取,部分量化模型即将推出。 2. 模型评测 - 评测数据选取:在CMMLU和CEval评测数据集中选取与DevOps...
Qwen-阿里云推出的通义千问大语言模型
Qwen是阿里云推出的通义千问大语言模型及相关项目的官方仓库,包含多种语言模型,具备丰富功能和特性,支持多种使用和部署方式。 1. 模型概述 - 模型发布:开源了Qwen系列模型,包括基础语言模型Qwen - 1.8B、Qwen - 7B、Qwen - 14B、Qwen - 72B,以及聊天模型Qwen - 1.8B - Chat、Qwen - 7B - Chat、Qwen - 14B - Chat、Qwen - 72B - Chat。 - 模型特点 - 基础语言模型经过大量数据训练,在基准数据集上表现出色,如在MMLU、C - Eval、GSM8K等数据...
LLaMA - Factory-轻松高效微调大语言模型的项目
LLaMA - Factory是一个用于轻松高效微调大语言模型的项目,具有多种功能和特点,支持众多模型和训练方法,提供了丰富的数据集和便捷的使用方式。 1. 项目概述 - 目标:提供统一高效的方式对100多种大语言模型进行微调。 - 功能特点 - 支持多种模型,如LLaMA、ChatGLM、Qwen等系列。 - 集成多种训练方法,包括预训练、监督微调、奖励建模等。 - 具备可扩展资源,支持16位全量微调、冻结微调、LoRA及多种量化方式。 - 采用先进算法,如GaLore、BAdam、Adam - mini等...