甘虎文'blogs

Created2025-10-14|AgentAgent_Principle

Agent的概念概念：在AI领域，AI是一种能够感知环境（通过传感器接受用户的文本、语音、文件等信息和问题）进行自主理解，进行决策和执行动作的智能实体。原理Agent = 大脑(LLM)+记忆(memory)+任务规划(planner)+工具使用(MCP)+行动(Action) Agent本质上翻译过来是代理的意思，所以它能代表你处理任务，所以它要有人的记忆和大脑，有规划能力和处理的工具和实际行动。 AI agent工作流程prompt提示词提示词是Agent接受到的初始输入，描述了Agent需要完成的任务或解决的问题 LLM大模型大模型是agent进行任务规划和知识推理的重要工具，利用LLM大模型对提示词进行深入分析，生成可能的解决方案。 Memory记忆可以保留当前用户输入内容，上下文内容，外部向量存储的知识库，网页信息等。 planning规划定义：任务规划是agent根据提示词、大模型以及知识库进行决策和规划的过程。它涉及对任务的分解、目标的设定、路径的规划等实现方式：图中“规划”这一步，在目前绝大多数基于大模型的Agent系统中，正是通过精心设计的提示...

volc_engine_Agent_learning

Created2025-10-13|Agentvolc_engine_Agent_learning

火山-agent原理基础知识网址：https://www.volcengine.com/ agent定义：根据用户的提示词，动态判断需要调用哪些工具，比如查询天气，调天气预报的接口、做翻译，调翻译软件的接口等等。本质是将外部的一些软件工具，做一个封装，让agent去判断，用户的需求是调用哪一个？如何快速搭建生产级Agent火山方舟：大模型工具平台 TREA：AI IDE工具 MCP服务：火山引擎的MCP服务 PromptPilot：提示词工程工具 AI知识管理火山引擎介绍：定位：字节的云服务与技术中台，是所有AI产品背后的”水电煤”功能：提供超大规模算力（万卡GPU集群）、高性能网络、存储服务，支撑大模型的训练和推理。同时，它也是“火山方舟”的载体，将字节的AI能力商业化输出给外部企业客户火山方舟和豆包的区别火山方舟和扣子：是平台，都是赋能企业和开发者，面向企业。是B端产品豆包、即梦AI、Trae：是应用，给个人提供AI服务，面向用户。是C端产品

基于LangGraph的垂直领域智能体实战

Created2025-06-11|AI_Module基于LangGraph的垂直领域智能体实战

基于LangGraph的垂直领域智能体实战实现步骤：环境搭建：能够独立配置LangGraph开发环境。掌握工具：掌握LangGraph的核心概念（图、节点、边、状态、流程控制等）基础开发：完成基本的对话系统/工作流的搭建。设计模式：理解和实践六种主流的智能体设计模式。完成项目：使用LangGraph，完成新车型设计方案，具备构建智能体的实战能力。 1. LangGraph介绍 a. 需要达到的目标做到了解基于大模型的智能体了解LangGraph和LangChain的区别能够独立安装LangGraph环境能够快速上手第一个LangGraph程序 b. 智能体智能体（Agent）是指能够感知环境并采取行动以实现特定目标的代理体。它可以是软件、硬件或一个系统，具备自主性、适应性和交互能力。智能体通过感知环境中的变化（如通过传感器或数据输入），根据自身学习到的知识和算法进行判断和决策，进而执行动作以影响环境或达到预定的目标。智能体在人工智能领域广泛应用，常见于自动化系统、机器人、虚拟助手和游戏角色等，其核心在于能够自主学习和持续进化，以更好地完成任务和适应...

借助MCP搭建AI数据分析智能体

Created2025-05-21|AI_Module借助MCP搭建AI数据分析智能体

借助MCP搭建AI数据分析智能体进行MCP智能体快速发开发，来搭建一个能够进行SQL查询和Python自动编写的入门级数据分析智能体。 1、创建项目使用Pycharm创建一个项目 2、配置MySQL安装好mysql后，创建表并插入数据 12345678910111213141516171819202122CREATE DATABASE school;USE school;-- 然后创建一个虚拟表格，里面包含了10位同学各自3门课程的分数：CREATE TABLE students_scores ( id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(50), course1 INT, course2 INT, course3 INT );INSERT INTO students_scores (name, course1, co...

大模型微调做信息抽取和文本分类任务

Created2025-05-08|AI_Module微调大模型微调做信息抽取和文本分类任务

硬件：GPU=A800+80G显存；CPU=100G内存准备数据集数据集制作来源包括：大模型生成+hugging face的公开数据集+人工标注模型搭建与训练

MCP协议

Created2025-05-05|AI_ModuleMCP协议

MCP协议 MCP模型上下文协议学习目标理解协议在AI中的作用。掌握MCP的核心概念及应用。分析MCP与Function Calling的差异，并解释为什么MCP可以降低对大模型Function Calling能力的要求。 1、什么是MCP协议 MCP（Model Context Protocol，模型上下文协议）是由 Anthropic 在2024年1月提出的一套开放协议，旨在实现大型语言模型（LLM）与外部数据源和工具的无缝集成，用来在大模型和数据源之间建立安全双向的链接。 Anthropic的愿景，希望把MCP协议打造成AI世界的“Type-C”接口，可以通过MCP协议工具、数据链接起来，达类似HTTP协议的那种通用程度。 1.1核心概念协议的定义：协议（Protocol）是一种约定或标准，用于定义不同系统、设备或软件之间如何通信和交换数据。它确保各方使用相同的“语言”和规则，避免混乱。例如，HTTP协议定义了浏览器与服务器的交互方式，USB协议标准化了设备连接。协议在AI中的作用：在大型语言模型（LLM）和AI代理系统中，协议用于标准化模型与外部工具、...

milvus索引算法-IVF-PQ的原理解释

Created2025-04-21|AI_Modulemilvus索引算法-IVF-PQ的原理解释

给我解释一下milvus数据库索引方法的IVF-PQ的原理好的，我们来详细解释一下 Milvus 中 IVF-PQ 索引的原理。我会用循序渐进的方式，从核心概念到整体工作流程来讲解。核心思想：先粗筛，再细算IVF-PQ 不是一个单一的算法，而是两个经典技术的结合： IVF - 倒排文件：用于“粗筛”，快速缩小搜索范围。 PQ - 乘积量化：用于“细算”，在缩小后的范围内高效且近似地计算距离。把它们组合起来，IVF-PQ 的工作方式就像图书馆找书： IVF：先根据书的类别（比如“计算机科学”、“文学”），找到可能存放目标书籍的几个书架（粗筛）。 PQ：然后在这几个书架上，不是一本一本地仔细看书名，而是通过书脊的颜色、厚度等特征快速排除大部分无关的书，最后只对剩下的几本进行精确比对（细算）。这样避免了在整个图书馆（全库）进行地毯式搜索，极大地提升了效率。 1. IVF - 倒排文件目标：将整个向量空间分割成 nlist 个小单元，缩小搜索范围。工作原理：聚类：在构建索引时，使用 K-Means 等聚类算法对所有原始向量进行训练，得到 nlist 个聚类中心（...

基于ChatGLM微调多任务

Created2025-04-08|AI_Modulelora微调基于ChatGLM微调多任务

项目整体介绍：项目背景LLM拥有庞大的知识库，但是博而不精。在RAG项目中ChatModel，主要是用来回答用户的通用型知识和陪着聊天，但是LLM完成一些任务会存在一些答案解析上的困难，比如输出答案的格式：生成json格式、给生成的答案加水印等等。一般可以通过提示词完成，但是提示词有缺点，比如用户问：把上一代产品和现在的芯片做一个对比图，大模型私有化部署后，不知道上一代产品是什么，你需要告诉它上一代产品是G250芯片，现在是G260芯片，RAG只能给大模型提供什么是B260芯片，以及相关参数知识。但不能解决大模型理解用户的习惯问题。微调能更懂用户（企业）的偏好。微调和提示词的优缺点：维度 🛠️ 微调 🎩 提示词工程核心比喻量身定制的专属司机熟知你的习惯、路线和偏好，无需多言。使用通用地图APP 功能强大，但每次都要重新输入目的地和设置偏好。工作原理改变模型“大脑”结构通过训练数据更新模型权重，内化知识和规则。给模型“临时指令” 通过精心设计的文字引导模型，不改变其底层参数。优点 ✅ 高可靠性 & 一致性：形成“肌肉记忆”，输出稳...

RAG项目梳理

Created2025-04-05|AI_ModuleRAG项目梳理

目前代码用到的包pymilvus、logging 模块一、听课笔记项目背景能解决大模型幻觉、过时、安全、专业知识的弊端的解决方法就是：RAG+微调。RAG和微调本质上都是为了，让大模型更好地基于企业私有知识来回答问题，RAG提供外部知识库，提供数据来源。微调基于知识库，告诉大模型怎么生成答案。例如提示词微调Prompt 微调。基于企业私有知识的垂直领域微调：拿企业的知识做微调训练比如PEFT中lora拿少量数据集，去给大模型做一个微调。基于企业私有知识的RAG问答系统：给企业的私有知识创建一个数据库，让大模型去做意图识别，从而进行专有领域的一个问答。微调的弊端：需要微调人才+需要显卡资源通用模型和垂直领域模型的区别：能做所有任务，通晓所有领域常识的模型就是通用型或者说通用领域的大模型，专精于某个领域（e.g.法律）的就是垂直领域大模型。项目流程不进入RAG:用户输入query，先经过mysql检索阈值>=0.85的高频回答对。存在直接返回，无需进入RAG流程。进入RAG：找到本地文档–文档切分，切分的文档做embedding，存入milvus。 query也...

图像分类

Created2025-04-02|CV图像分类

图像分类_overview图像分类分类模型给图像分配多个标签，每个标签的概率值不同，如dog:1%，cat:4%，panda:95%，根据概率值的大小将该图片分类为panda，那就完成了图像分类的任务。常用数据集CIFAR-10和CIFAR-100数据集解释CIFAR-100 = Canadian Institute For Advanced Research - 100 classes CIFAR：加拿大高等研究院 100：代表这个数据集中包含的 100个细粒度的类别（classes）。这与它的前身CIFAR-10（包含10个类别）形成了直接对比。细粒度解释“细粒度”是相对于“粗粒度”而言的，它描述的是一种更精细、更具体、更关注细微差别的分类或分析级别。您可以把它想象成观察事物的“放大镜倍数”：粗粒度：低倍数放大镜，看大致的轮廓和类别。例如：识别一辆“车”、一只“鸟”、一条“狗”。细粒度：高倍数放大镜，看具体的型号、品种或子类型。例如：识别这辆车是“2012款奥迪A6”还是“2020款特斯拉Model 3”；这只鸟是“北美红雀”还是“美洲知更鸟...