甘虎文'blogs

Created2024-12-01

今日目标掌握Ollama模块实现熟练使用Streamlit 掌握基于Ollama平台Python语言聊天机器人实现【熟悉】阿甘智聊机器人项目介绍随着人工智能技术的飞速发展，聊天机器人在多个领域得到了广泛应用，如客户服务、教育辅导、娱乐互动等。然而，现有的许多聊天机器人依赖于云端服务，这不仅可能导致用户数据隐私泄露，还可能因网络延迟影响用户体验。因此，开发一款本地部署的聊天机器人显得尤为重要。本地聊天机器人能够在用户本地环境中运行，确保数据的安全性和对话的实时性，同时也能根据用户的个性化需求进行定制和优化。项目演示项目技术架构后端模型：利用 Ollama 平台的 Qwen 模型，该模型具备出色的自然语言处理能力，能够理解和生成自然语言文本，为聊天机器人提供核心的对话处理功能。前端界面：采用 Streamlit 框架搭建用户界面，Streamlit 是一个简单易用的 Python 库，能够快速创建美观、交互式的 Web 应用，使用户能够通过网页与聊天机器人进行实时对话。对话交互：用户可以通过 Streamlit 界面输入文本，聊天机器人基于 Qwen 模型对输入...

LLM-Index

Created2024-11-22

LLM-Index昨日回顾1、output parsers 字符串解析器列表解析器 json解析器 pydantic解析器自定义解析器 2、memory ChatMessageHistory history.add_user_message(xxx) history.add_ai_message(xxx) message_to_dict() messages_from_dict() ConversationChain(自动管理上下文) ConversationChain（llm=model） conversation.predict(input=’xxx’) 3、Index(RAG核心组件) 文件加载器创建UnstructuredLoader对象load docs = loader.load html可以用自己的html对象文档分割器创建文档分割器的对象（separator,chunk_size,chunk_overlap）单文档切割多文档切割(打印信息不同，打印出多个document的k...

Conda_Command

Created2024-07-26

Conda_Command导出当前conda环境下所有的包的名字1conda env export > /你的指定路径/requir.txt

部署本地大模型

Created2024-07-21

了解私有化大模型掌握Ollama安装与部署熟悉Ollama客户端命令掌握基于Ollama平台的ChatBot聊天机器人【了解】私有大模型学习目标了解私有化大模型解决方案，能够选择企业常用的方案实现私有大模型部署为什么要有私有大模型随着AI技术的不断普及，人们也积极拥抱其带来的变化，在生活或者工作中亦使用AI技术来帮助我们更高效的完成某些事件，但是在这个过程中，也暴露出AI技术当前下存在在的系列问题，其中最严重的就是安全问题比如：最典型的是三星员工使用ChatGPT泄露公司机密的案例。其实上述案例表现的就是企业数据隐私与安全的问题，在许多行业，如金融、医疗、政府等，数据隐私和安全是至关重要的。使用公共大模型可能涉及敏感数据的泄露风险，因为公共模型在训练过程中可能接触到了来自不同来源的敏感数据。因此就有了私有大模型的市场需求，私有大模型允许企业或机构在自己的数据上训练模型，而且训练的结果只供内部或合作伙伴使用，从而确保了数据隐私和安全。当然除了数据隐私问题原因之外，还存有便于内部员工工作提效、大模型开发的投入等诸多原因综合，直接推动私有大模型成为未来AI发展的新...

操作系统的安装

Created2024-06-22|et_cetera操作系统的安装

操作系统的安装组装新电脑一台电脑=主板+CPU+内存条+硬盘等主要部件。假设电脑是一台车，主板就是一个车架子和电路板，负责协调所有硬件工作。而BIOS集成在主板上，是主板自带的程序。其作用是整台车的打火器，让主板工作，是电脑接上电源启动后，最先启动的组件。主板烧录操作系统主板主板图片：定义：主板是一块物理电路板，它是计算机所有核心硬件的连接中心和通信枢纽。它是硬件平台，让CPU、内存、硬盘、显卡等能连接在一起协同一起工作。包含：物理接口（CPU插槽、内存条插槽、USB插口、显卡插槽、电源插口、硬盘接口、电池包接口）固件芯片（flash ROM）这块芯片存储着BIOS或者UEFI固件 …… BIOS程序1、定义：BIOS(老式主板) 的全称是：Basic Input/Output System 基本输入输出系统。BIOS是一种固化在计算机主板上的固件（firmware），是计算机启动时最先运行的软件之一。 2、主要作用：开机自检：检查内存、CPU、硬盘等硬件是否正常硬件初始化：启动并配置基本的硬件设备引导操作系统：找到硬盘、U盘等设备上的操作...

大模型应用初体验与聊天机器人的项目

Created2024-05-21

今日大纲介绍今日目标：掌握使用VMware+CentOS搭建聊天机器人项目环境核心知识点模块： ①聊天机器人项目介绍 ②大模型核心基础 ③VM安装与Linux使用 ④聊天机器人部署项目环境【熟悉】聊天机器人项目简介学习目标掌握聊天机器人搭建核心步骤，完成聊天机器人架构设计什么是聊天机器人概念：聊天机器人是一种基于人工智能的自然语言处理技术开发的软件程序，能够通过文本或语音与用户进行交互，模拟人类对话。它可以根据用户输入的问题或指令，生成相应的回答或执行特定的操作。特点：自然语言理解（NLP）：能够理解用户输入自然语言，包括文字或语音，并从中提取意图和关键信息。人工智能人工智障对话管理：通过对话引擎维持对话的连贯性，根据上下文生成合适的回答。个性化交互：可以根据用户的历史记录和偏好提供定制化的回答。笔记本电脑真笔记本多功能性：除了聊天，还可以执行任务，如查询信息、预订服务、提供帮助等。执行任务查询信息预订服务应用场景： ...

Python编程_基础语法与条件判断

Created2024-04-23

大纲介绍 Python环境搭建 Python基础语法与变量 Python判断结构之if结构【了解】Python概述与安装学习目标了解Python语言特点掌握Python环境搭建与基础语法为什么要学习Python① 技术趋势 Python自带明星属性，热度稳居编程语言界前三 https://www.tiobe.com/tiobe-index/ https://pypl.github.io/PYPL.html ② 简单易学开发代码少，精确表达需求逻辑；==33个关键字，7种基本数据类型==；语法规则简单，接近自然语言。 ③ 应用广泛 Python语言涉及IT行业70%以上的技术领域 Python语言的诞生1989年，为了打发圣诞节假期，龟叔(吉多·范·罗苏姆)开始写Python语言的编译器；1991年，第一个Python编译器诞生Python这个名字，来自龟叔所挚爱的电视剧Monty Python’s Flying Circus (蒙蒂·蟒蛇的飞行马戏团） Python语言的优缺点优点简单：Python是一种代表简单...

Pandas进阶

Created2024-04-22

Pandas数据分析一、Pandas框架概述学习目标知道Pandas的作用能够搭建使用Pandas的开发环境 Pandas介绍Python在数据处理上独步天下：代码灵活、开发快速；尤其是Python的Pandas包，无论是在数据分析领域、还是大数据开发场景中都具有显著的优势： Pandas是Python的一个第三方包，也是商业和工程领域最流行的结构化数据工具集，用于数据清洗、处理以及分析 Pandas在数据处理上具有独特的优势：底层是基于Numpy构建的，所以运行速度特别的快有专门的处理缺失数据的API 强大而灵活的分组、聚合、转换功能适用场景: 数据量大到Excel严重卡顿，且又都是单机数据的时候，我们使用Pandas Pandas用于处理单机数据(小数据集(相对于大数据来说)) 在大数据ETL数据仓库中，对数据进行清洗及处理的环节使用Pandas 安装Pandas打开cmd窗口，输入如下命令： 1pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ pandas 注意：Anacon...

Matplotlib

Created2024-04-03

Matplotlib一、Matplotlib快速入门学习目标了解什么是matplotlib 为什么要学习matplotlib matplotlib简单图形的绘制什么是Matplotlib 是专门用于开发2D图表(包括3D图表) 以渐进、交互式方式实现数据可视化为什么要学习Matplotlib可视化是在整个数据挖掘的关键辅助工具，可以清晰的理解数据，从而调整我们的分析方法。能将数据进行可视化,更直观的呈现使数据更加客观、更具说服力例如下面两个图为数字展示和图形展示：实现一个简单的Matplotlib画图 — 以折线图为例matplotlib.pyplot模块matplotlib.pytplot包含了一系列类似于matlab的画图函数。 1import matplotlib.pyplot as plt 图形绘制流程： 1.创建画布 – plt.figure() plt.figure(figsize=(), dpi=) figsize:指定图的长宽 dpi:图像的清晰度返回fig对象 12345- 2.绘制图像 -- plt....

大模型微调的主要方式

Created2024-03-30

大模型微调的主要方式【掌握】1、大模型Prompt-Tuning方法1.1 NLP任务四种范式第一范式：基于传统机器学习模型第二范式：基于深度学习第三范式：基于预训练模型+fine-tuning 第四范式：预训练模型+Prompt+预测 1.2 Fine-Tuning(微调)Fine-Tuning基本思想：使用小规模的特定任务文本继续训练预训练语言模型。 Fine-Tuning问题：所需的Fine-Tuning量取决于预训练语料库和任务特定语料库之间的相似性。如果两者相似，可能只需要少量的Fine-Tuning，如果两者不相似，则可能需要更多的Fine-Tuning，并且效果不明显。成本高 Prompt-Tuning的基本思想：通过添加模板的方法将任务目标转化为与预训练目标相似的形式（如MLM），避免引入额外的参数的同时，最大化利用模型的预训练知识。 Prompt-Tuning主要解决传统Fine-Tuning方式的两个痛点： **降低语义偏差：**预训练任务主要以MLM为主，而下游任务则重新引入新的训练参数，因此两个阶段目标差异较大。因此需要解决Pre-Tra...