我昨天说从数据技术嘉年华回来后就部署了一套ChatGLM,准备研究利用大语言模型训练数据库运维知识库,很多朋友不大相信,说老白你都这把年纪了,还能自己去折腾这些东西?为了打消这些朋友的疑虑,我今天把这两天折腾ChatGLM的过程分享给大家,也为有兴趣折腾一下ChatGLM的朋友讲一下避坑的一些技巧。
ChatGLM-6B是基于清华大学 KEG 实验室与智谱 AI 于2025年联合训练的语言模型 GLM 开发而成,是一个大型的语言模型,其针对用户的问题和要求提供适当的答复和支持。上面的回答是ChatGLM自己回答的,GLM-6B是一个开源的62亿参数的预训练模型,其特点是可以在比较小的硬件环境下本地运行。这一特性可以让基于大语言模型的应用可以走进千家万户。KEG实验室的目的是要让更大的GLM-130B模型(1300亿参数,与GPT-3.5相当)能够在一个8路RTX 3090的低端环境中完成训练。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
如果这个目标真的能实现,那么对想基于大语言模型做一些应用的人来说绝对是一个福音。目前的ChatGLP-6B的FP16模型大约13G多一点,INT-4量化模型不到4GB,完全可以在一块6GB显存的RTX 3060TI上运行。
在部署前我不太了解这些情况,因此买了一块不上不下的12GB的RTX 3060,于是完成安装部署后仍然无法运行FP16的模型。早知道在自己家里做测试验证,直接买块价格更便宜的3060TI就可以了。而如果要运行无损的FP16模型,就必须上24GB显存的3090了。
如果你仅仅是想在自己的机器上测试一下ChatGLP-6B的能力,那么你可能不需要直接去下载THUDM/ChatGLM-6B模型,在huggingface上有一些打包好的量化模型可以下载。模型下载速度很慢,你可以直接下载int4的量化模型。
我这次安装是在一台I7 8核的PC机上完成的,显卡为12G显存的RTX 3060,因为这台电脑是我的工作电脑,因此我把ChatGLM安装在了WSL子系统上。在WINDOWS WSL 子系统上安装ChatGLM比直接在LINUX环境中安装要复杂一些。其中最大的坑是显卡驱动的安装。直接在Linux上部署ChatGLM
的时候,需要直接安装NVIDIA的驱动程序,通过modprobe来激活网卡驱动就可以了。而在WSL上安装则大有不同。
ChatGLM可以在github上下载,在网站上也有一些简单的文档,甚至包含一个在WINDOWS WSL上部署ChatGLM的文档。只不过如果你是这方面的小白,完全按照这个文档去部署,会遇到无数的坑。
Requriements.txt文档里列出了ChatGLM使用的主要开源组件的清单与版本号,其核心是transformers,需要版本4.27.1,实际上要求没有这么严格,略低一点也没太大问题,不过安全起见还是用相同的版本为好。Icetk是做Token处理的,cpm_kernels是中文处理模型与cuda的核心调用,protobuf是结构化数据存储的。Gradio是用于利用Python快速生成AI应用的框架。Torch就不用我多做介绍了。
ChatGLM可以在没有GPU的环境中使用,利用CPU和32GB的物理内存来运行,不过运行速度很慢,仅仅能够用来做个演示验证而已。要想玩ChatGLM最好还是配备一块GPU。
在WSL上安装ChatGLM最大的坑是显卡驱动,在Git上ChatGLM的文档十分不友好,对于不太了解这个项目或者没有做过此类部署的人来说,文档实在太坑。实际上软件部署并不麻烦,而显卡驱动就十分有技巧性。
因为是在WSL subsystem上部署,因此LINUX只是一个*系统,并不是完整的LINUX,因此英伟达的显卡驱动只需要在WINDOWS上安装,不需要在WSL里激活。不过在WSL的LINUX虚拟环境中还是需要安装CUDA TOOLS。WINDOWS上的英伟达驱动一定要安装官网上的最新驱动,而不能使用WIN10/11自带的兼容性驱动,因此从官网上下载最新驱动并安装一定不要省略。
安装完WIN的驱动后就可以直接在WSL里安装cuda tools了,安装完毕后,运行nvidia-smi如果能够看到上面的界面,那么恭喜你,你已经成功地避开了第一个坑。实际上在安装cuda tools时候还会遇到几个小坑。那就是你的系统中必须安装合适版本的gcc,gcc-dev和make等编译相关的工具,如果缺少这些组件,cuda tools的安装会失败。
上面就是坑人的前期准备,实际上避开英伟达驱动这个坑,后面的安装还是很顺利的。在系统的选择上,我还是建议选择Debian兼容的Ubuntu,新版的Ubuntu的aptitude十分智能,能够帮你解决大量软件的版本兼容问题,实现部分软件的自动降版本。
下面的安装过程完全按照安装指南就可以顺利完成了,要注意的是替换/etc/apt/sources.list里面的安装源的工作最好按照指南完成,一方面安装速度会快很多,另外一方面也避免出现软件版本兼容性的问题。当然不替换也不一定会影响后面的安装过程。
如果你顺利地通过了前面的各道关卡,那么你就进入到了最后一步,启动web_demo了。执行python3 web_demo.py可以启动一个WEB对话的例子。这时候如果你是个穷人,只有一张12GB显存的3060,那么你就一定会看到上面的报错了,哪怕你把PYTORCH_CUDA_ALLOC_CONF设置为最小的21,也无法避开这个报错。这时候你就不能偷懒了,必须简单地改写一下python脚本。
默认的web_demo.py是使用FP16的预训练模型的,13GB多的模型肯定无法装载到12GB现存里的,因此你需要对这个代码做一个小的调整。
你可以改为quantize(4)来装载INT4量化模型,或者改为quantize(8)来装载INT8量化模型。这样你的显卡内存就够用了,而且可以支持你做各种对话了。
要注意的是,web_demo.py启动后,模型的下载工作才真正开始,因此要下载13GB的模型,需要相当长的时间,你可以把这项工作放到半夜做,或者你直接用迅雷等下载工具预先从hugging face上下载模型。如果你对模型一无所知,不太会安装下载的模型,你也可以修改代码中的模型名称,THUDM/chatglm-6b-int4,直接从网上下载只有不到4GB的INT4量化模型,这样会快很多,反正你的破显卡也跑不起FP16的模型。
至此,你可以通过网页与ChatGLM对话了,不过这一切只是折腾的开始。只有你能够把你的微调模型训练出来了,那么你的ChatGLM的入坑之旅才会真正开始。玩这种东西还是需要大量的精力和金钱的,入坑要慎重。
最后我还是十分感谢清华大学KEG实验室的朋友,他们的工作让更多的人可以低成本地使用大语言模型。
# debian
# 如果你
# 的是
# 的人
# 显卡驱动
# 就可以
# 你就
# 显存
# 文档
# 是一个
# 你可以
# gpt
# Python
# ubuntu
# linux
# gpt-3.5
# gpt-3
# 数据库
# windows
# git
# github
# int
# Token
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】
AI无镜头相机Paragraphica:颠覆传统摄影的新方式
AI虚拟女友:终极浪漫伴侣还是数字陷阱?
即梦ai怎样生成插画作品_即梦ai插画生成入口与风格选择【教程】
Vidu AI:使用Q1模型轻松创建电影级短片
蚂蚁阿福官方网站入口_网页版在线解读体检报告
艺龙旅行AI怎样筛选最优车次_艺龙AI车次筛选与耗时最短推荐【攻略】
Midjourney怎样生成网页图标_Midjourney图标生成教程【方法】
Claude怎么用新功能会议纪要_Claude纪要生成使用【步骤】
研究学者如何利用现有资源提升学术影响力
Depseek怎么生成员工成长总结_Depseek成长维度提取与案例整合【方法】
DeepSeek写合同怎么用_DeepSeek写合同使用方法详细指南【教程】
AI驱动营销:如何利用人工智能构建高效营销漏斗
AI动画制作教程:Adobe Express一键语音转动画
服务合同模板:起草、签署和管理指南,提升业务效率
图像分割技术详解:定义、类型、技术与应用
tofai怎么调整层级顺序 tofai图层上下移动方法【步骤】
AI广告全面解析:免费教程、JSON提示与营销策略
即梦ai怎么生成游戏角色原画_即梦ai游戏角色生成风格与装备细节【教程】
Spin Rewriter AI:终极内容创作与SEO优化指南
ClaudePC端怎么设主题色_ClaudePC端主题设置步骤【教程】
EdrawMind终极评测:AI赋能思维导图,提升效率与创造力
LTX Studio:AI电影制作平台深度评测与应用指南
tofai官网网页版入口 tofai最新网页版登录链接
如何用ChatGPT准备面试 模拟面试问答与职场话术练习教程
律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望
通义千问怎样写文案_通义千问文案写作教程【指南】
Zapier MCP:AI赋能工作流,释放Claude强大潜能
啦啦队女孩:青春活力与性感魅力的完美结合
Canva AI终极指南:免费AI聊天机器人,设计、视频、网站全搞定!
Pictory AI视频制作平台深度评测:功能、价格与使用指南
PandaDoc vs. SignEasy: 2025 eSignature 平台终极对比
AI写作鱼怎么一键生成论文大纲_AI写作鱼大纲生成与逻辑梳理【技巧】
iPhone 17 Pro Max深度测评:AI驱动的未来手机已来?
AI赋能!图形设计师必备的顶级AI工具
留学文书PS怎么写?教你用AI写出招生官眼前一亮的个人陈述
怎么用AI帮你解读复杂的学术论文?快速抓住核心论点和证据
通义千问怎样优化提示词合需求_通义千问需求契合技巧【步骤】
终极人声移除器UVR5:AI驱动的免费开源音频处理神器
一键改变发型:Gemini AI 助你轻松打造时尚造型
Pearson AI学习工具:高效提升你的数学学习效率
Claude怎样写指令型提示词_Claude指令提示词写法【方法】
DeepSeek解释机器学习模型 DeepSeek数据科学学习指南
百度ai助手快捷键怎么关 百度ai助手快捷键取消设置
AI赋能保险销售:提升邮件营销效果的终极指南
AI Lead Generation: 解锁未来增长引擎,营销新纪元
ChatGPT 在电商产品描述批量生成中的应用
AI如何变革法律行政助理角色?未来发展趋势分析
通义千问怎么设置功能偏好_通义千问偏好设置【教程】
Artist.ly AI Image Designer: 终极指南
2023-05-02
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。