甘虎文'blogs

Created2024-03-15

Pandas数据分析一、Pandas框架概述学习目标知道Pandas的作用能够搭建使用Pandas的开发环境 Pandas介绍Python在数据处理上独步天下：代码灵活、开发快速；尤其是Python的Pandas包，无论是在数据分析领域、还是大数据开发场景中都具有显著的优势： Pandas是Python的一个第三方包，也是商业和工程领域最流行的结构化数据工具集，用于数据清洗、处理以及分析 Pandas在数据处理上具有独特的优势：底层是基于Numpy构建的，所以运行速度特别的快有专门的处理缺失数据的API 强大而灵活的分组、聚合、转换功能适用场景: 数据量大到Excel严重卡顿，且又都是单机数据的时候，我们使用Pandas Pandas用于处理单机数据(小数据集(相对于大数据来说)) 在大数据ETL数据仓库中，对数据进行清洗及处理的环节使用Pandas 安装Pandas打开cmd窗口，输入如下命令： 1pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ pandas 注意：Anacon...

RAG-Milvus

Created2024-03-15

RAG-Milvus配置文件，文档处理模块日志书写原始子块，txt sparse vector parent content source timestamp 检索精准。分块检索，父块子块子块的文档切分器父类的文档切分器基于父块，切文档的处理模块创建并加载集合转换成向量并存储 trainer.train() model args 帮助简化训练流程。处理数据（※）帮助跟随节奏：敲注释，敲print信息。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748检查模型路径是否存在加载预训练模型将模型移到指定设备记录加载成功的日志初始化新模型num labels=4；就是多分类default：就是2将模型移到指定设备记录初始化模型的日志保存模型（save_model)创建dataset对象训练bert分类模型# 加载数据集with open万能读取方式json.loads(value) for value in f.readlines(...

基于GPT2的医疗问诊机器人

Created2024-03-13

基于GPT2的医疗问诊机器人学习目标理解医疗问诊机器人的开发背景. 了解企业中聊天机器人的应用场景掌握基于GPT2模型搭建医疗问诊机器人的实现过程 1. 项目介绍【理解】1.1 项目背景本项目基于医疗领域数据构建了智能医疗问答系统,目的是为为用户提供准确、高效、优质的医疗问答服务。 1.2 环境准备 python==3.10 transformers==4.40.2 torch==2.5.1+cu121 1.3 项目整体结构整体代码结构： 2. 数据处理【实现】2.1 数据介绍数据存放位置：llm_tuning/Gpt2_Chatbot/data data文件夹中存有原始训练语料为train.txt。train.txt的格式如下，每段闲聊之间间隔一行，格式如下： 12345帕金森叠加综合征的辅助治疗有些什么？综合治疗；康复训练；生活护理指导；低频重复经颅磁刺激治疗卵巢癌肉瘤的影像学检查有些什么？超声漏诊；声像图；MR检查；肿物超声；术前超声；CT检查 2.2 数据处理目...

transformers库使用

Created2024-03-13

transformers库使用1 transformers库使用1.1 transformers库是什么收集预训练模型的开源库各种开源大模型以及数据集访问https://huggingface.co需要科学上网 1.2 transformers库使用12345678910# 创建虚拟环境conda create --name 虚拟环境名称 python=3.10# 切换虚拟环境conda activate 虚拟环境名称# 安装transformers库pip install transformers -i https://mirrors.aliyun.com/pypi/simple/# 安装datasets库pip install datasets -i https://mirrors.aliyun.com/pypi/simple/# 安装torch cpu/gpu 当前是cpu版本pip install torch -i https://mirrors.aliyun.com/pypi/simple/ 管道方式文本分类任务 12345678910111213...

基于ChatGLM微调多任务实战

Created2024-02-25

基于ChatGLM微调多任务实战1. 项目介绍【理解】 1.1. 项目简介LLM（Large Language Model）通常拥有大量的先验知识，使得其在许多自然语言处理任务上都有着不错的性能。但，想要直接利用 LLM 完成一些任务会存在一些答案解析上的困难，如规范化输出格式，严格服从输入信息等。因此，在这个项目中我们对大模型 ChatGLM-6B 进行 Finetune，使其能够更好的对齐我们所需要的输出格式。 1.2. ChatGLM-6B模型1.2.1 模型介绍ChatGLM-6B 是清华大学提出的一个开源、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。该模型使用了和 ChatGPT 相似的技术，经过约 1T 标识符的中英双语训练(中英文比例为 1:1)，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答（目前中文支持最好）。相比原始Decoder模块，ChatGLM-6B模型结构有如下改动点： embedding 层梯度缩...

fasttext工具

Created2024-02-25

fasttext工具1 fasttext工具1.1 介绍概念是一种文本分类和词向量训练的高效工具作用文本分类 (分类模型) 训练高质量词向量 (词嵌入模型) 特点高效, 快适用于大规模数据集 1.2 架构(了解) fasttext模型组成输入层词向量 -> 根据词和词子词信息词:apple 子词:app ppl ple skipgram模型 CBOW模型隐藏层加权求和 -> 文本向量表示输出层文本分类线性层 softmax层层次softmax 由霍夫曼二叉树组成二叉树转换成是否问题二分类问题树路径越短, 词概率越大; 树路径越长, 词概率越小层次softmax最多只需要计算 $$log_2词数$$ 次数, 普通的softmax计算词数的次数负采样将输出层的神经元分为正负两类, 正例神经元1个, 其余都是负例神经元在负例神经元中随机选择2-5个/5-20个进行反向传播其他Bert/GPT模型对所有的神经元进行反向传播 1.3 文本分类概念: 将输入文本分...

transformer介绍

Created2024-02-08

day12_课堂笔记1 transformer介绍概念 transformer是基于自注意力机制的seq2seq模型/架构/框架核心思想基于注意力机制自注意力一般注意力作用捕获超长距离语义关系并行计算灵活性: 处理不同的数据, 文本/语音/图像/视频扩展性: 层数和多头数量可调, transformer默认是6层, 8个头 2 transformer架构输入部分词嵌入层位置编码层输出部分线性层 softmax层编码器部分多头自注意力子层前馈全连接子层残差连接层规范化层(层归一化) 解码器部分掩码多头自注意力子层编码器-解码器堵头一般注意力子层前馈全连接子层残差连接层规范化层(层归一化) 3 输入3.1 文本嵌入层概念将token转换成词向量过程 nn.Embedding() 代码实现 1234567891011121314151617181920212223242526272829303132333435363738# 输入部分是由 ...

图像分类和目标检测

Created2024-02-01

图像分类和目标检测正在跳转到图像分类和目标检测...

transformer

Created2024-01-22

transformer1 transformer介绍概念 transformer是基于自注意力机制的seq2seq模型/架构/框架核心思想基于注意力机制自注意力一般注意力作用捕获超长距离语义关系并行计算灵活性: 处理不同的数据, 文本/语音/图像/视频扩展性: 层数和多头数量可调, transformer默认是6层, 8个头 2 transformer架构输入部分词嵌入层位置编码层输出部分线性层 softmax层编码器部分多头自注意力子层前馈全连接子层残差连接层规范化层(层归一化) 解码器部分掩码多头自注意力子层编码器-解码器堵头一般注意力子层前馈全连接子层残差连接层规范化层(层归一化) 3 输入3.1 文本嵌入层概念将token转换成词向量过程 nn.Embedding() 代码实现 1234567891011121314151617181920212223242526272829303132333435363738# 输入部分是由...

新零售行业评价决策系统

Created2024-01-19|AI_ModuleFineTuning新零售行业评价决策系统

新零售行业评价决策系统一、项目介绍【理解】1、项目背景随着科技的迅速发展和智能设备的普及，AI技术在新零售行业中得到了广泛应用。其中智能推荐系统是AI技在新零售中最为常见且有效的应用之一。通过分析用户的购买历史、浏览行为以及喜好偏好，推荐系统可以根据个人特征给用户进行个性化商品推荐。这种个性化推荐不仅可以提高用户购买意愿，减少信息过载，还可以带来更高的用户满意度和销量。在智能推荐系统中，文本分类的应用属于重要的应用环节。比如：某电商网站都允许用户为商品填写评论，这些文本评论能够体现出用户的偏好以及商品特征信息，是一种语义信息丰富的隐式特征。相比于单纯的利用显式评分特征，文本信息一方面可以弥补评分稀疏性的问题，另一方面在推荐系统的可解释方面也能够做的更好。因此，本次项目我们将以”电商平台用户评论”为背景，基于深度学习方法实现评论文本的准确分类，这样做的目的是通过用户对不同商品或服务的评价，平台能够快速回应用户需求，改进产品和服务。同时，自动分类也为个性化推荐奠定基础，帮助用户更轻松地找到符合其偏好的商品。 2、评论文本分类实现方法2.1 传统的深度学习方法目前实...