大模型最常使用的5大向量数据库:Chroma、Pinecone、Weaviate、Milvus和Faiss介绍

以下是大型模型(如LLM)最常使用的五大向量数据库的详细介绍,结合其核心特性、适用场景及优缺点分析: 1. Chroma 核心特性 Chroma 是一个轻量级、开源的向量数据库,专注于快速搭建语义搜索原型。它支持近似最近邻搜索(ANN),提供简单的API,适合本地开发和小型项目。与LangChain

顾文强 Published on 2025-02-11

基于llm大语言模型生成ai导游App

如何实现一个基于LLM大语言模型的AI导游应用。首先,我得弄清楚用户的需求到底是什么。他们可能想要一个能够提供实时导游服务的应用,可能包括景点讲解、路线规划、问答互动这些功能。但可能用户自己对这些功能的细节还不清楚,需要我来帮他们梳理。 首先,我得考虑技术选型。LLM方面,可能的选择有GPT-4、C

顾文强 Published on 2025-02-11

Docker 搭建私有仓库

Docker私有仓库搭建的详细步骤如下‌: ‌下载Registry镜像‌: 首先,需要从Docker Hub上下载官方的Registry镜像。使用命令docker pull registry即可拉取到最新的Registry镜像‌12。 ‌配置Docker信任地址‌: 由于私有仓库通常使用自签名证书或

顾文强 Published on 2025-02-10

Docker 可用镜像

Docker 加速 添加到 /etc/docker/daemon.json { "registry-mirrors": [ "https://docker.m.daocloud.io" ] }

顾文强 Published on 2025-02-10
Git

Pycharm / Idea Git推送时出错

Pycharm/Idea 内置Git模块推送时报错 Unable to negotiate with 43.135.163.94 port 29418: no matching host key type found. Their offer: ssh-rsa,ssh-dss fatal: Coul

顾文强 Published on 2025-01-24

LlamaIndex的组成以及Embeddings 和 LLM的关系

LlamaIndex( "Llama Hub")是一个AI的Agent框架,用于将数据连接到语言模型(LLMs),如 OpenAI GPT-4 或其他 Transformer 模型。这个框架包括两个关键组件:Embeddings 和 LLM。 定义 1. Embeddings Embeddings

顾文强 Published on 2025-01-23

Rembg 去除背景工具介绍

Rembg 是一个用于去除图像背景的工具,支持多种模型,包括通用模型和针对特定场景(如人类和服装)的模型。Rembg 提供了命令行接口(CLI)和库接口,方便用户在不同的环境中使用。以下是Rembg库的基本使用方法和一些注意事项: 基本使用方法 1. 安装Rembg Rembg支持CPU和GPU两种

顾文强 Published on 2025-01-23

ONNX Runtime 介绍

ONNX Runtime(简称 ORT)是一个高性能的推理引擎,专为开放神经网络交换(Open Neural Network Exchange,简称ONNX)格式的模型设计。参考网站: https://onnxruntime.ai/ 以下是对ONNX Runtime的详细解释: ‌定义和用途‌:

顾文强 Published on 2025-01-23

Ollama 介绍

Ollama是一个基于Go语言开发的本地大模型运行框架,旨在简化大型语言模型的本地部署、管理和推理工作流‌。 Ollama允许用户在本地机器上拉取、管理、运行大模型,并提供多种访问方式,包括本地CLI、HTTP接口以及通过OpenAI客户端的集成。其核心功能包括: ‌本地模型管理‌:Ollama支持

顾文强 Published on 2025-01-23

LlameIndex 介绍

LlamaIndex(GPT Index)是您的LLM(大型语言模型)应用的数据框架。使用LlamaIndex进行构建通常涉及与LlamaIndex核心以及所选的一组集成(或插件)一起工作。在Python中,有两种方法可以开始使用LlamaIndex进行构建。 Starter(初学者包):llama

顾文强 Published on 2025-01-23

HuggingFace 的镜像站

Hugging Face的镜像网站主要有以下几个: ‌官方推荐的镜像站‌:Hugging Face官方提供了一个国内镜像网站,地址为:https://hf-mirror.com/‌。这个镜像站可以用于下载各种大模型的权重以及复现代码,是官方推荐的一个可靠来源。 ModelScope: ‌https:

顾文强 Published on 2025-01-21

WebSocket 使用

在Spring Boot和Vue 3中集成WebSocket可以实现实时的双向通信,这在许多现代Web应用中都是非常有用的,比如实时聊天、实时数据更新等。以下是一个基本的指南,介绍如何在Spring Boot后端和Vue 3前端之间使用WebSocket。 1 Spring Boot 后端 ‌1.1

顾文强 Published on 2025-01-21

Ubuntu 安装 RabbitMQ

1 安装rabbitmq-server apt install rabbitmq-server -y 2 开启web管理 rabbitmq-plugins enable rabbitmq_management 3 登录web端 访问地址 http://localhost:15672 用户名: gue

顾文强 Published on 2025-01-21

SpringBoot 启动多源数据库

1 在Maven的pom.xml添加依赖 <dependency> <groupId>com.baomidou</groupId> <artifactId>dynamic-datasource-spring-boot3-starter</artifactId> <version>

顾文强 Published on 2025-01-21

Mysql 主从复制

MySQL主从复制的搭建涉及主服务器的配置、从服务器的配置、数据同步和复制过程的启动。以下是搭建MySQL主从复制的基本步骤,这些步骤适用于大多数MySQL版本,包括MySQL 8.0,但请注意,具体的配置细节和命令可能因版本而异。 1. 环境准备 准备两台服务器,一台作为Master(主服务器),

顾文强 Published on 2025-01-21

Mysql 主从同步失败

// 查看从机状态信息 SHOW REPLICA STATUS; // 查看错误信息 SELECT * FROM performance_schema.replication_applier_status_by_worker; Worker 1 failed executing transactio

顾文强 Published on 2025-01-21

Anaconda 安装 Pytorch

1 运行Anaconda Prompt 查看虚拟运行环境 conda env list 利用conda创建新的虚拟环境 conda create -n 虚拟环境名字 python=3.11.11(pytorch官方要求3.9-3.11) 删除虚拟环境 conda remove -n 虚拟环境名字 -

顾文强 Published on 2025-01-20

HuggingFace 模型离线下载

1 直接从官网下载 打开 HuggingFace官网地址为 https://huggingface.co 选择要下载的模型 在Files and versions 标签下进行逐项下载

顾文强 Published on 2025-01-20
Previous Next