甘虎文'blogs

甘虎文'blogs

基于LangGraph的垂直领域智能体实战
Created2025-06-11|AI_Module基于LangGraph的垂直领域智能体实战
基于LangGraph的垂直领域智能体实战 实现步骤: 环境搭建:能够独立配置LangGraph开发环境。 掌握工具:掌握LangGraph的核心概念(图、节点、边、状态、流程控制等) 基础开发:完成基本的对话系统/工作流的搭建。 设计模式:理解和实践六种主流的智能体设计模式。 完成项目:使用LangGraph,完成新车型设计方案,具备构建智能体的实战能力。 1. LangGraph介绍 a. 需要达到的目标 做到了解基于大模型的智能体 了解LangGraph和LangChain的区别 能够独立安装LangGraph环境 能够快速上手第一个LangGraph程序 b. 智能体 智能体(Agent)是指能够感知环境并采取行动以实现特定目标的代理体。它可以是软件、硬件或一个系统,具备自主性、适应性和交互能力。智能体通过感知环境中的变化(如通过传感器或数据输入),根据自身学习到的知识和算法进行判断和决策,进而执行动作以影响环境或达到预定的目标。智能体在人工智能领域广泛应用,常见于自动化系统、机器人、虚拟助手和游戏角色等,其核心在于能够自主学习和持续进化,以更好地完成任务和适应...
借助MCP搭建AI数据分析智能体
Created2025-05-21|AI_Module借助MCP搭建AI数据分析智能体
借助MCP搭建AI数据分析智能体进行MCP智能体快速发开发,来搭建一个能够进行SQL查询和Python自动编写的入门级数据分析智能体。 1、创建项目使用Pycharm创建一个项目 2、配置MySQL安装好mysql后,创建表并插入数据 12345678910111213141516171819202122CREATE DATABASE school;USE school;-- 然后创建一个虚拟表格,里面包含了10位同学各自3门课程的分数:CREATE TABLE students_scores ( id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(50), course1 INT, course2 INT, course3 INT );INSERT INTO students_scores (name, course1, co...
大模型微调做信息抽取和文本分类任务
Created2025-05-08|AI_Module微调大模型微调做信息抽取和文本分类任务
硬件:GPU=A800+80G显存;CPU=100G内存 准备数据集数据集制作来源包括:大模型生成+hugging face的公开数据集+人工标注 模型搭建与训练
MCP协议
Created2025-05-05|AI_ModuleMCP协议
MCP协议 MCP模型上下文协议 学习目标 理解协议在AI中的作用。 掌握MCP的核心概念及应用。 分析MCP与Function Calling的差异,并解释为什么MCP可以降低对大模型Function Calling能力的要求。 1、什么是MCP协议 MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 在2024年1月提出的一套开放协议,旨在实现大型语言模型(LLM)与外部数据源和工具的无缝集成,用来在大模型和数据源之间建立安全双向的链接。 Anthropic的愿景,希望把MCP协议打造成AI世界的“Type-C”接口,可以通过MCP协议工具、数据链接起来,达类似HTTP协议的那种通用程度。 1.1核心概念 协议的定义: 协议(Protocol)是一种约定或标准,用于定义不同系统、设备或软件之间如何通信和交换数据。它确保各方使用相同的“语言”和规则,避免混乱。例如,HTTP协议定义了浏览器与服务器的交互方式,USB协议标准化了设备连接。 协议在AI中的作用: 在大型语言模型(LLM)和AI代理系统中,协议用于标准化模型与外部工具、...
milvus索引算法-IVF-PQ的原理解释
Created2025-04-21|AI_Modulemilvus索引算法-IVF-PQ的原理解释
给我解释一下milvus数据库索引方法的IVF-PQ的原理 好的,我们来详细解释一下 Milvus 中 IVF-PQ 索引的原理。我会用循序渐进的方式,从核心概念到整体工作流程来讲解。 核心思想:先粗筛,再细算IVF-PQ 不是一个单一的算法,而是两个经典技术的结合: IVF - 倒排文件:用于“粗筛”,快速缩小搜索范围。 PQ - 乘积量化:用于“细算”,在缩小后的范围内高效且近似地计算距离。 把它们组合起来,IVF-PQ 的工作方式就像图书馆找书: IVF:先根据书的类别(比如“计算机科学”、“文学”),找到可能存放目标书籍的几个书架(粗筛)。 PQ:然后在这几个书架上,不是一本一本地仔细看书名,而是通过书脊的颜色、厚度等特征快速排除大部分无关的书,最后只对剩下的几本进行精确比对(细算)。 这样避免了在整个图书馆(全库)进行地毯式搜索,极大地提升了效率。 1. IVF - 倒排文件目标: 将整个向量空间分割成 nlist 个小单元,缩小搜索范围。 工作原理: 聚类:在构建索引时,使用 K-Means 等聚类算法对所有原始向量进行训练,得到 nlist 个聚类中心(...
基于ChatGLM微调多任务
Created2025-04-08|AI_Modulelora微调基于ChatGLM微调多任务
项目整体介绍:项目背景LLM拥有庞大的知识库,但是博而不精。在RAG项目中ChatModel,主要是用来回答用户的通用型知识和陪着聊天,但是LLM完成一些任务会存在一些答案解析上的困难,比如输出答案的格式:生成json格式、给生成的答案加水印等等。一般可以通过提示词完成,但是提示词有缺点,比如用户问:把上一代产品和现在的芯片做一个对比图,大模型私有化部署后,不知道上一代产品是什么,你需要告诉它上一代产品是G250芯片,现在是G260芯片,RAG只能给大模型提供什么是B260芯片,以及相关参数知识。但不能解决大模型理解用户的习惯问题。微调能更懂用户(企业)的偏好。 微调和提示词的优缺点: 维度 🛠️ 微调 🎩 提示词工程 核心比喻 量身定制的专属司机 熟知你的习惯、路线和偏好,无需多言。 使用通用地图APP 功能强大,但每次都要重新输入目的地和设置偏好。 工作原理 改变模型“大脑”结构 通过训练数据更新模型权重,内化知识和规则。 给模型“临时指令” 通过精心设计的文字引导模型,不改变其底层参数。 优点 ✅ 高可靠性 & 一致性:形成“肌肉记忆”,输出稳...
RAG项目梳理
Created2025-04-05|AI_ModuleRAG项目梳理
目前代码用到的包pymilvus、logging 模块一、听课笔记项目背景能解决大模型幻觉、过时、安全、专业知识的弊端的解决方法就是:RAG+微调。RAG和微调本质上都是为了,让大模型更好地基于企业私有知识来回答问题,RAG提供外部知识库,提供数据来源。微调基于知识库,告诉大模型怎么生成答案。例如提示词微调Prompt 微调。基于企业私有知识的垂直领域微调:拿企业的知识做微调训练比如PEFT中lora拿少量数据集,去给大模型做一个微调。基于企业私有知识的RAG问答系统:给企业的私有知识创建一个数据库,让大模型去做意图识别,从而进行专有领域的一个问答。微调的弊端:需要微调人才+需要显卡资源 通用模型和垂直领域模型的区别:能做所有任务,通晓所有领域常识的模型就是通用型或者说通用领域的大模型,专精于某个领域(e.g.法律)的就是垂直领域大模型。 项目流程不进入RAG:用户输入query,先经过mysql检索阈值>=0.85的高频回答对。存在直接返回,无需进入RAG流程。 进入RAG:找到本地文档–文档切分,切分的文档做embedding,存入milvus。 query也...
图像分类
Created2025-04-02|CV图像分类
图像分类_overview图像分类分类模型给图像分配多个标签,每个标签的概率值不同,如dog:1%,cat:4%,panda:95%,根据概率值的大小将该图片分类为panda,那就完成了图像分类的任务。 常用数据集CIFAR-10和CIFAR-100数据集解释CIFAR-100 = Canadian Institute For Advanced Research - 100 classes CIFAR:加拿大高等研究院 100: 代表这个数据集中包含的 100个细粒度的类别(classes)。这与它的前身CIFAR-10(包含10个类别)形成了直接对比。 细粒度解释“细粒度”是相对于“粗粒度”而言的,它描述的是一种更精细、更具体、更关注细微差别的分类或分析级别。 您可以把它想象成观察事物的“放大镜倍数”: 粗粒度:低倍数放大镜,看大致的轮廓和类别。 例如:识别一辆“车”、一只“鸟”、一条“狗”。 细粒度:高倍数放大镜,看具体的型号、品种或子类型。 例如:识别这辆车是“2012款奥迪A6”还是“2020款特斯拉Model 3”;这只鸟是“北美红雀”还是“美洲知更鸟...
RAG项目在windows系统下的环境安装流程
Created2025-03-07|RAG_NotesRAG项目在windows系统下的环境安装流程
RAG项目环境安装流程1 python虚拟环境 依赖文件 (requirements.txt) 自己创建requirements.txt文件, 将以下内容复制进去即可 123456789101112131415161718192021222324252627282930313233# Web框架fastapiuvicorn[standard]websockets# 数据库连接pymysqlredis# 向量检索rank_bm25scikit-learnnumpyjiebapandastransformerstorchlangchainlangchain_communitysentence_transformerspymilvus# AI模型openai# 配置和工具configparserlocustwebsocket-client# 其他依赖pydanticstarlette 打开cmd终端(win+r)输入以下命令 123456# 创建虚拟环境, 安装3.10及以上的python解析器conda create -n EduRAG python=3.10# 切换虚...
dify_tutorial
Created2025-02-13|Agentdify_tutorial
Dify介绍定义:Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service) 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。 安装Dify安装Dify所在的机器的最低配置:CPU核数 >= 2 Core RAM运行内存 >= 4GB 先安装WSL(Windows Subsystem for Linux),根据系统,可选执行原因:dify依赖linux系统,如果是在linux系统上部署,比如Ubuntu,就不需要安装WSL 定义:WSL 本质上是 Windows 的一个功能组件/子系统,它让 Windows 具备了原生运行 Linux 程序的能力,同时提供了管理这个环境的工具集。 参考操作文档:https://learn.microsoft.com/zh-cn/windows/wsl/install 以管理员权限打开PowerShell,运行以下命令去安装WSL:1wsl --install 安装完成后,重启电脑 已完成配置安装linux发行版ubuntu1wsl.exe...
12…7
avatar
甘虎文
探索技术 & 分享生活
Articles
64
Tags
16
Categories
32
Follow Me
Announcement
patience & passion
Recent Posts
基于LangGraph的垂直领域智能体实战2025-06-11
借助MCP搭建AI数据分析智能体2025-05-21
大模型微调做信息抽取和文本分类任务2025-05-08
MCP协议2025-05-05
milvus索引算法-IVF-PQ的原理解释2025-04-21
Categories
  • AI_Module13
    • DeepLearning5
      • PyTorch框架使用1
      • 卷积神经网络CNN1
      • 循环神经网络RNN1
      • 深度学习简介1
      • 神经网络基础1
    • FineTuning1
Tags
MachineLearning Python_Programing FineTuningNotes Agent CV_Content et_cetera Local_deploy_LLM AI_Module a_new_FT RAG_Notes command_set DataProcess_StatisticalAnalysis Python Advanced LLM_Notes NLP_Notes Language_Learning
Archives
  • June 2025 1
  • May 2025 3
  • April 2025 4
  • March 2025 1
  • February 2025 2
  • January 2025 4
  • December 2024 1
  • November 2024 1
Website Info
Article Count :
64
Unique Visitors :
Page Views :
Last Update :
© 2025 By 甘虎文Framework Hexo 7.3.0|Theme Butterfly 5.4.3