折腾ChatGLM的几个避坑小技巧


我昨天说从数据技术嘉年华回来后就部署了一套ChatGLM,准备研究利用大语言模型训练数据库运维知识库,很多朋友不大相信,说老白你都这把年纪了,还能自己去折腾这些东西?为了打消这些朋友的疑虑,我今天把这两天折腾ChatGLM的过程分享给大家,也为有兴趣折腾一下ChatGLM的朋友讲一下避坑的一些技巧。

ChatGLM-6B是基于清华大学 KEG 实验室与智谱 AI 于2025年联合训练的语言模型 GLM 开发而成,是一个大型的语言模型,其针对用户的问题和要求提供适当的答复和支持。上面的回答是ChatGLM自己回答的,GLM-6B是一个开源的62亿参数的预训练模型,其特点是可以在比较小的硬件环境下本地运行。这一特性可以让基于大语言模型的应用可以走进千家万户。KEG实验室的目的是要让更大的GLM-130B模型(1300亿参数,与GPT-3.5相当)能够在一个8路RTX 3090的低端环境中完成训练。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果这个目标真的能实现,那么对想基于大语言模型做一些应用的人来说绝对是一个福音。目前的ChatGLP-6B的FP16模型大约13G多一点,INT-4量化模型不到4GB,完全可以在一块6GB显存的RTX 3060TI上运行。

在部署前我不太了解这些情况,因此买了一块不上不下的12GB的RTX 3060,于是完成安装部署后仍然无法运行FP16的模型。早知道在自己家里做测试验证,直接买块价格更便宜的3060TI就可以了。而如果要运行无损的FP16模型,就必须上24GB显存的3090了。

如果你仅仅是想在自己的机器上测试一下ChatGLP-6B的能力,那么你可能不需要直接去下载THUDM/ChatGLM-6B模型,在huggingface上有一些打包好的量化模型可以下载。模型下载速度很慢,你可以直接下载int4的量化模型。

我这次安装是在一台I7 8核的PC机上完成的,显卡为12G显存的RTX 3060,因为这台电脑是我的工作电脑,因此我把ChatGLM安装在了WSL子系统上。在WINDOWS WSL 子系统上安装ChatGLM比直接在LINUX环境中安装要复杂一些。其中最大的坑是显卡驱动的安装。直接在Linux上部署ChatGLM的时候,需要直接安装NVIDIA的驱动程序,通过modprobe来激活网卡驱动就可以了。而在WSL上安装则大有不同。

ChatGLM可以在github上下载,在网站上也有一些简单的文档,甚至包含一个在WINDOWS WSL上部署ChatGLM的文档。只不过如果你是这方面的小白,完全按照这个文档去部署,会遇到无数的坑。

Requriements.txt文档里列出了ChatGLM使用的主要开源组件的清单与版本号,其核心是transformers,需要版本4.27.1,实际上要求没有这么严格,略低一点也没太大问题,不过安全起见还是用相同的版本为好。Icetk是做Token处理的,cpm_kernels是中文处理模型与cuda的核心调用,protobuf是结构化数据存储的。Gradio是用于利用Python快速生成AI应用的框架。Torch就不用我多做介绍了。

ChatGLM可以在没有GPU的环境中使用,利用CPU和32GB的物理内存来运行,不过运行速度很慢,仅仅能够用来做个演示验证而已。要想玩ChatGLM最好还是配备一块GPU。

在WSL上安装ChatGLM最大的坑是显卡驱动,在Git上ChatGLM的文档十分不友好,对于不太了解这个项目或者没有做过此类部署的人来说,文档实在太坑。实际上软件部署并不麻烦,而显卡驱动就十分有技巧性。

因为是在WSL subsystem上部署,因此LINUX只是一个*系统,并不是完整的LINUX,因此英伟达的显卡驱动只需要在WINDOWS上安装,不需要在WSL里激活。不过在WSL的LINUX虚拟环境中还是需要安装CUDA TOOLS。WINDOWS上的英伟达驱动一定要安装官网上的最新驱动,而不能使用WIN10/11自带的兼容性驱动,因此从官网上下载最新驱动并安装一定不要省略。

安装完WIN的驱动后就可以直接在WSL里安装cuda tools了,安装完毕后,运行nvidia-smi如果能够看到上面的界面,那么恭喜你,你已经成功地避开了第一个坑。实际上在安装cuda tools时候还会遇到几个小坑。那就是你的系统中必须安装合适版本的gcc,gcc-dev和make等编译相关的工具,如果缺少这些组件,cuda tools的安装会失败。

上面就是坑人的前期准备,实际上避开英伟达驱动这个坑,后面的安装还是很顺利的。在系统的选择上,我还是建议选择Debian兼容的Ubuntu,新版的Ubuntu的aptitude十分智能,能够帮你解决大量软件的版本兼容问题,实现部分软件的自动降版本。

下面的安装过程完全按照安装指南就可以顺利完成了,要注意的是替换/etc/apt/sources.list里面的安装源的工作最好按照指南完成,一方面安装速度会快很多,另外一方面也避免出现软件版本兼容性的问题。当然不替换也不一定会影响后面的安装过程。

如果你顺利地通过了前面的各道关卡,那么你就进入到了最后一步,启动web_demo了。执行python3 web_demo.py可以启动一个WEB对话的例子。这时候如果你是个穷人,只有一张12GB显存的3060,那么你就一定会看到上面的报错了,哪怕你把PYTORCH_CUDA_ALLOC_CONF设置为最小的21,也无法避开这个报错。这时候你就不能偷懒了,必须简单地改写一下python脚本。

默认的web_demo.py是使用FP16的预训练模型的,13GB多的模型肯定无法装载到12GB现存里的,因此你需要对这个代码做一个小的调整。

你可以改为quantize(4)来装载INT4量化模型,或者改为quantize(8)来装载INT8量化模型。这样你的显卡内存就够用了,而且可以支持你做各种对话了。

要注意的是,web_demo.py启动后,模型的下载工作才真正开始,因此要下载13GB的模型,需要相当长的时间,你可以把这项工作放到半夜做,或者你直接用迅雷等下载工具预先从hugging face上下载模型。如果你对模型一无所知,不太会安装下载的模型,你也可以修改代码中的模型名称,THUDM/chatglm-6b-int4,直接从网上下载只有不到4GB的INT4量化模型,这样会快很多,反正你的破显卡也跑不起FP16的模型。

至此,你可以通过网页与ChatGLM对话了,不过这一切只是折腾的开始。只有你能够把你的微调模型训练出来了,那么你的ChatGLM的入坑之旅才会真正开始。玩这种东西还是需要大量的精力和金钱的,入坑要慎重。

最后我还是十分感谢清华大学KEG实验室的朋友,他们的工作让更多的人可以低成本地使用大语言模型。


# debian  # 如果你  # 的是  # 的人  # 显卡驱动  # 就可以  # 你就  # 显存  # 文档  # 是一个  # 你可以  # gpt  # Python  # ubuntu  # linux  # gpt-3.5  # gpt-3  # 数据库  # windows  # git  # github  # int  # Token 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】  AI无镜头相机Paragraphica:颠覆传统摄影的新方式  AI虚拟女友:终极浪漫伴侣还是数字陷阱?  即梦ai怎样生成插画作品_即梦ai插画生成入口与风格选择【教程】  Vidu AI:使用Q1模型轻松创建电影级短片  蚂蚁阿福官方网站入口_网页版在线解读体检报告  艺龙旅行AI怎样筛选最优车次_艺龙AI车次筛选与耗时最短推荐【攻略】  Midjourney怎样生成网页图标_Midjourney图标生成教程【方法】  Claude怎么用新功能会议纪要_Claude纪要生成使用【步骤】  研究学者如何利用现有资源提升学术影响力  Depseek怎么生成员工成长总结_Depseek成长维度提取与案例整合【方法】  DeepSeek写合同怎么用_DeepSeek写合同使用方法详细指南【教程】  AI驱动营销:如何利用人工智能构建高效营销漏斗  AI动画制作教程:Adobe Express一键语音转动画  服务合同模板:起草、签署和管理指南,提升业务效率  图像分割技术详解:定义、类型、技术与应用  tofai怎么调整层级顺序 tofai图层上下移动方法【步骤】  AI广告全面解析:免费教程、JSON提示与营销策略  即梦ai怎么生成游戏角色原画_即梦ai游戏角色生成风格与装备细节【教程】  Spin Rewriter AI:终极内容创作与SEO优化指南  ClaudePC端怎么设主题色_ClaudePC端主题设置步骤【教程】  EdrawMind终极评测:AI赋能思维导图,提升效率与创造力  LTX Studio:AI电影制作平台深度评测与应用指南  tofai官网网页版入口 tofai最新网页版登录链接  如何用ChatGPT准备面试 模拟面试问答与职场话术练习教程  律师视角下的生成式AI:信息爆炸时代的法律实践与未来展望  通义千问怎样写文案_通义千问文案写作教程【指南】  Zapier MCP:AI赋能工作流,释放Claude强大潜能  啦啦队女孩:青春活力与性感魅力的完美结合  Canva AI终极指南:免费AI聊天机器人,设计、视频、网站全搞定!  Pictory AI视频制作平台深度评测:功能、价格与使用指南  PandaDoc vs. SignEasy: 2025 eSignature 平台终极对比  AI写作鱼怎么一键生成论文大纲_AI写作鱼大纲生成与逻辑梳理【技巧】  iPhone 17 Pro Max深度测评:AI驱动的未来手机已来?  AI赋能!图形设计师必备的顶级AI工具  留学文书PS怎么写?教你用AI写出招生官眼前一亮的个人陈述  怎么用AI帮你解读复杂的学术论文?快速抓住核心论点和证据  通义千问怎样优化提示词合需求_通义千问需求契合技巧【步骤】  终极人声移除器UVR5:AI驱动的免费开源音频处理神器  一键改变发型:Gemini AI 助你轻松打造时尚造型  Pearson AI学习工具:高效提升你的数学学习效率  Claude怎样写指令型提示词_Claude指令提示词写法【方法】  DeepSeek解释机器学习模型 DeepSeek数据科学学习指南  百度ai助手快捷键怎么关 百度ai助手快捷键取消设置  AI赋能保险销售:提升邮件营销效果的终极指南  AI Lead Generation: 解锁未来增长引擎,营销新纪元  ChatGPT 在电商产品描述批量生成中的应用  AI如何变革法律行政助理角色?未来发展趋势分析  通义千问怎么设置功能偏好_通义千问偏好设置【教程】  Artist.ly AI Image Designer: 终极指南 

 2023-05-02

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.