大模型常见工程化工具:微调、量化、部署、Agent、RAG等

news/2024/7/5 2:34:58

包括微调(Axolotl、Llama-Factory、Firefly、Swift、XTuner)、量化(AutoGPTQ、AutoAWQ、Neural
Compressor)、部署(vLLM、SGL、SkyPilot、TensorRT-LLM、OpenVino、TGI)、本地运行(MLX、Llama.cpp、Ollama、LM
Studio)、Agent及RAG(检索增强生成)框架(LlamaIndex, CrewAI, OpenDevin)、评测(LMSys,
OpenCompass, Open LLM Leaderboard)、模型二次开发(Dolphin, Openbuddy)

微调

Axolotl:
https://github.com/OpenAccess-AI-Collective/axolotl
Llama-Factory :
https://github.com/hiyouga/LLaMA-Factory
Firefly:
https://github.com/yangjianxin1/Firefly
Swift:
https://github.com/modelscope/swift
XTuner:
https://github.com/InternLM/xtuner

量化

AutoGPTQ:
https://github.com/AutoGPTQ/AutoGPTQ
AutoAWQ:
https://github.com/casper-hansen/AutoAWQ
Neural Compressor:
https://github.com/intel/neural-compressor

部署

1)线上工程化部署
vLLM:
https://github.com/vllm-project/vllm
SGL:
https://github.com/sgl-project/sglang
SkyPilot:
https://github.com/skypilot-org/skypilot
TensorRT-LLM:
https://github.com/NVIDIA/TensorRT-LLM
OpenVino:
https://github.com/openvinotoolkit/openvino
TGI:
https://github.com/huggingface/text-generation-inference

2)本地运行
MLX:
https://github.com/ml-explore/mlx
Llama.cpp:

https://github.com/ggerganov/llama.cpp
Ollama:
https://ollama.com/
LM Studio:
https://lmstudio.ai/

Agent及RAG(检索增强生成)框架(

LlamaIndex:
https://www.llamaindex.ai
CrewAI:
https://www.crewai.com/
OpenDevin:
https://github.com/OpenDevin/OpenDevin/

评测

LMSys:
https://lmsys.org
OpenCompass:
https://opencompass.org.cn/home

Open LLM Leaderboard:
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

模型二次开发

Dolphin:
https://huggingface.co/cognitivecomputations
Openbuddy:
https://github.com/OpenBuddy/OpenBuddy


http://lihuaxi.xjx100.cn/news/2195916.html

相关文章

使用NetAssist网络调试助手在单台计算机上配置TCP服务器和客户端

要使用NetAssist网络调试助手在同一台计算机上配置一个实例作为服务器(server)和另一个实例作为客户端(client),可以按照以下步骤进行操作: 前提条件 确保已经安装NetAssist网络调试助手,并了…

使用opencv在图像上画带刻度线的十字线,以图像中心点为0点

使用OpenCV在图像上绘制带刻度线的十字线&#xff0c;可以通过以下步骤实现。我们将首先找到图像的中心点&#xff0c;然后绘制水平和垂直线&#xff0c;并在这些线的适当位置绘制刻度线。以下是详细的C代码示例&#xff1a; #include<opencv2\opencv.hpp> //画十字标注…

了解 ADC 的幅度量化误差

ADC 将输入值转换为一组离散级别中的一个值&#xff0c;并输出数字代码以指定量化级别。量化过程会给系统带来一些误差。 本文将通过将斜坡输入应用于量化器来研究量化误差。然后&#xff0c;我们将看一个示例&#xff0c;其中量化误差类似于噪声源。此外&#xff0c;我们将讨…

深度学习的模型剪枝

深度学习的模型剪枝 模型剪枝&#xff08;Model Pruning&#xff09;是深度学习中一种减少模型复杂度、提高计算效率的方法。通过删除冗余的神经元或连接&#xff0c;剪枝能够在不显著影响模型性能的前提下&#xff0c;减少模型参数数量、降低计算和存储需求。以下是对深度学习…

无限滚动分页加载与下拉刷新技术探析:原理深度解读与实战应用详述

滚动分页加载&#xff08;也称为无限滚动加载、滚动分页等&#xff09;是一种常见的Web和移动端应用界面设计模式&#xff0c;用于在用户滚动到底部时自动加载下一页内容&#xff0c;而无需点击传统的分页按钮。这种设计旨在提供更加流畅、连续的浏览体验&#xff0c;减少用户交…

服务器数据恢复—强制上线raid5阵列离线硬盘导致raid不可用的数据恢复案例

服务器数据恢复环境&#xff1a; 某品牌2850服务器中有一组由6块SCSI硬盘组建的raid5磁盘阵列&#xff0c;linux操作系统ext3文件系统。 服务器故障&#xff1a; 服务器运行过程中突然瘫痪。服务器管理员检查阵列后发现raid5阵列中有两块硬盘离线&#xff0c;将其中一块硬盘进行…

通用树查找算法

想要一个树形控件来显示数据&#xff0c;却发现Racket的GUI库竟然没有提供这个控件。既然没有&#xff0c;那就自己手搓一个吧。没想到&#xff0c;在做这个控件中竟然有了新发现&#xff01; 树形控件有一个功能是查找树中指定的节点。这就是接下来的故事的起点。 1 找外援 不…

Game Fi链游:定制开发源码搭建

随着科技的飞速发展&#xff0c;游戏开发行业正经历着前所未有的变革。Game Fi&#xff0c;这个新兴的概念&#xff0c;正以其独特的魅力&#xff0c;引发了游戏开发行业的热潮。 一、Game Fi 的概念与影响 Game Fi&#xff0c;是一种新型的游戏开发模式&#xff0c;它强调游…