ChatGPT引起巨大的业界震撼,各行各业都在讨论大语言模型、通用人工智能。AI经历了五十多年的发展,现在正处于产业结构水平化发展的关键时期。这一变化源于NLP领域范式的转变,从“预训练+微调”向“预训练、提示、预测”模式演进。在这一新模式下,下游任务适应预训练模型,使得一个大型模型能适用于多个任务。这一变化为AI产业的水平化分工奠定了基础,大型语言模型成为基础设施,Prompt Engineering公司层出不穷,专注于连接用户和模型。AI产业的分工初步形成,包括底层基础设施(云服务商)、大型模型、Prompt Engineering平台和终端应用。随着AI产业变革,开发者可以充分利用大型语言模型(LLM)和Prompt Engineering来开发创新应用。
目前要开发一个基于LLM的应用,我们面临最大的工程上的问题是什么?
以Langchain为例简单来说:LangChain是 LLM 底层能力的封装,是一种 Prompt Engineering或者说是Prompt-Ops。
这是一个用ChatGPT和LangChain开发的Demo对比的例子,输入的都是“谁是周杰伦的老婆?她当前的年龄乘以0.23是多少?”。可以看出ChatGPT或者GPT-3.5因为没有搜索能力,回答的结果是错误的。右边用LangChain结合OpenAI的GPT-3.5的API则输出了正确的结果,他会逐步去搜索获得正确信息,得出正确结果,而且中间的过程是框架自动处理的,我除了输入问题没有其他操作。
这是一个非常令人震惊的例子,在这个流程中,它自己发现函数未定义的报错并自行纠正。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
Fuzzy API composition: querying NBA stats with GPT-3 + Statmuse + Langchain
使用Langchain与体育数据搜索网站相结合,提问复杂的数据问题并得到准确的回复。例如:“波士顿凯尔特人队在这个 2025-2025 赛季的 NBA 赛季场均防守得分是多少?与他们上赛季的平均水平相比,百分比变化如何?”
一个蛮科幻的场景,我用Langchain接入了Python REPL工具,输入“给我放一首歌”,它导入了webBrowser包,调用代码打开了浏览器,给我播放了一首 《never gonna give you up》
def pythonTool():
bash = BashProcess()
python_repl_util = Tool(
"Python REPL",
PythonREPL().run,
"""A Python shell. Use this to execute python commands.
Input should be a valid python command.
If you expect output it should be printed out.""",
)
command_tool = Tool(
name="bash",
descriptinotallow="""A Bash shell. Use this to execute Bash commands. Input should be a valid Bash command.
If you expect output it should be printed out.""",
func=bash.run,
)
# math_tool = _get_llm_math(llm)
# search_tool = _get_serpapi()
tools = [python_repl_util, command_tool]
agent = initialize_agent(tools, llm, agent="zero-shot-react-description", verbose=True)
agent.run("给我播放一首音乐")
有数据连接私有数据对第三方企业做LLM应用来说非常重要。下面举几个例子
法律公文和政策条款一般都非常复杂繁琐,这个demo中将旧金山政府的信息用Langchain与GPT结合,做到询问其中细节能获得准确回复的效果。
> Entering new AgentExecutor chain... I need to find out the size limit for a storage shed without a permit and then search for sheds that are smaller than that size. Action: SF Building Codes QA System Action Input: "What is the size limit for a storage shed without a permit in San Francisco?" Observation: The size limit for a storage shed without a permit in San Francisco is 100 square feet (9.29 m2). Thought:Now that I know the size limit, I can search for sheds that are smaller than 100 square feet. Action: Google Action Input: "Storage sheds smaller than 100 square feet" Observation: Results 1 - 24 of 279 ... Thought:I need to filter the Google search results to only show sheds that are smaller than 100 square feet and suitable for backyard storage. Action: Google Action Input: "Backyard storage sheds smaller than 100 square feet" Thought:I have found several options for backyard storage sheds that are smaller than 100 square feet and do not require a permit. Final Answer: The size limit for a storage shed without a permit in San Francisco is 100 square feet. There are many options for backyard storage sheds that are smaller than 100 square feet and do not require a permit, including small sheds under 36 square feet and medium sheds between 37 and 100 square feet.
LLM应用与私有数据交互非常重要,我看到无数人在问一些ChatGPT无法回答的问题了:问认不认识谁、问自己公司业务细节、问各种可能不包含在预训练数据集里的东西。这些都已用Langchain和LlaMaIndex来解决。试想一下,将私有数据与LLM相结合,将改变数据原有的访问方式,通过问答能很自然地获取到自己需要的信息,这是比当前的搜索/打标分类都要高效的数据交互方式。
向量数据库现在看起来是构建LLM App中很关键的一个组件。首先 LLM 的预训练和微调过程不可能包含我们所期待的私有数据,因此如何将LLM关联到私有数据成为一个很关键的需求。而且LLM的“接口”-自然语言通常不是像Key-Value的映射那样精确地。而且在这一阶段我们希望LLM去理解我们的知识库,而不是简单的在其中搜索相同的字符串,我们希望询问关于我们知识库的细节,并给出一定理解后的答案(以及来源),这样匹配向量这样的搜索方式是一个非常合适且关键的解决方案。还有一个关键点是,LLM在每次调用是按token计费(即文本量),并且目前的接口的上下文有着4096 tokens的限制。,因此面对庞大的数据,我们也不可能将所有的数据一次性传给LLM。因此才有了第一张图那个流程图的结构。本地预先将我们私有的数据转成向量存在Qdrant里,用户问答时,将用户的问题转为向量,然后去Qdrant里进行搜索(相似性匹配)得到Top K个结果,然后将这些结果(注意这里的结果已经是自然语言了)传给LLM进行总结输出。
这里使用Langchain社区博客的流程图为例
私有数据分割成小于LLM上下文的分块,创建向量后存入向量数据库
将问题计算向量后在向量数据库进行相似性搜索,算出相关性较高的top k个结果后拼接prompt送往LLM获得答案。
再来聊聊最近那个OpenAI私有部署的新闻,如果用Langchain来做链接,面对庞大的私有数据,用一个embedding模型(OpenAI的ada)计算输入问题向量,用Qdrant等向量数据库来管理私有数据的向量和向量搜索,用Langchain来做中间的链接虽然可以解决问题,但是token的消耗却是不容忽视的成本问题。私有部署+微调可能能解决大部分前面提到的问题。可能是有钱大公司用Model instance和fine-tuning,小公司独立开发者用Langchain等框架。更未来OpenAI的LLM服务能力外溢,可能不需要Prompt了,甚至把Langchain的功能都能包括了,LLM应用的开发接入也许只需要一个接口调用。
2.4 2025年的LLM应用技术栈
2025 用来简单搭建 AI Demo 的最新技术栈:
一些关于 Langchain 这类Prompt-Ops这类工具的反对观点:stream.thesephist.com主要问题是在这类工具/框架,将自然语言作为代码和LLM的连接,使用非确定性语言本身作为控制流,有点疯狂。而且本身评估模型输出效果现在是个很麻烦的事,没有很好的解决方案,很多都是维护一个巨大的电子表格,靠人去评估。(也有用LLM评估LLM的方案,还比较早期)所以要投入生产,真实面对用户而不是作为twitter演示可能还有很多工作要做。
详细说说测试环节面临的巨大挑战。假如你的产品有一套研发阶段效果很好的prompt,交给测试后,可能测试上百条上千条就能看出问题了。由于效果无法保证,真正推出给c端用户会面临很大的挑战。而且没有用微调服务或者model instance的话,如果OpenAI更新了模型,你的生产环境的prompt可能需要全部重新测试一下效果。你的prompt也需要和代码一样按版本来管理,不管有没有prompt变更,每个版本上线前都需要进行回归测试。没有好的自动化评估方案的话,大量的case都需要测试人工来看会耗费非常多的人力。
结合私有数据的LLM应用目前开发起来在工程上已经有很多不错的方案了,很容易跑出效果不错的demo,但还是需要非常谨慎对待这样一种应用。毕竟我们不只是要做一个在社交媒体或者Leader面前演示的项目。提供给用户输入的是一个对话框,自然语言宽泛到即使你测试上万条结果也可能出现意想不到的结果,毕竟像new bing和chatGPT这样的产品也会被Prompt Injection。面对这种不确定性,工程上如何去避免,测试如何去覆盖都是一个成熟产品待解决或者说还有很多工作可以做的问题。
但我觉得也不必完全否定这类Prompt-Ops工具/框架,毕竟现阶段确实能做出很多不错的demo来验证想法。
聊聊ChatGPT API开放后LLM应用可能的形态。
LLM应用实际是一种新的人机交互方式,能够让用户用自然语言与我们目前的系统沟通,很多应用甚至可以简化到只有一个聊天窗口。
目前来说由于通用大模型训练/部署的高成本来说,产业水平化分工的条件基本成熟,世界上并不需要很多个大模型,做LLM的应用将会是中小型企业和个人开发者的必然选择。新形态的编程/工程范式需要工程师去及时学习理解。目前的开源技术栈已经能满足大部分产品的需求,可以尝试快速实践demo来验证想法。
参考资料:
Tutorial: ChatGPT Over Your Data
Question Answering with LangChain and Qdrant without boilerplate
Atom Capital:深入探讨ChatGPT带来的产业变革
# AI-powered
# 个人开发
# 自动化
# notion
# gpt
# copilot
# langchain
# prompt
# embedding
# atom
# iot
# 自然语言
# 它可以
# 都是
# 这类
# 给我
# 文档
# 这一
# 是一种
# 在这个
# JS
# Python
# flask
# for
# 封装
# Token
# 字符串
# 数据结构
# 接口
# 栈
# chatgpt
# 数据库
# milvus
# faiss
# 人工智能
# nlp
# gpt-3
# gpt-3.5
# https
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
百度AI搜索怎么用AI总结网页_百度AI搜索网页总结功能与调用【技巧】
AI赋能QA:测试管理的未来趋势与实践
JSON Prompting: 创造爆款AI广告的秘诀和方法
AI驱动的潜在客户挖掘:15分钟搭建营销机构并获利
AI驱动的Web应用测试:突破QA挑战,提升用户体验
批改网ai检测工具怎样生成改进建议_批改网ai检测工具改进建议查看与应用【攻略】
AI 3D人像视频制作:零成本手机教程,引爆社交媒体
AI图像识别如何减少保险欺诈和加速理赔
AI vs. 人工书籍教练:哪个更适合你?终极指南
GitHub Copilot CLI:终端中的 AI 编码助手
AI任务管理器终极评测:找到最适合你的效率神器
文心一言辅助进行行业深度研究报告撰写
2025年最佳AI流程图工具:效率提升秘籍
AI|直播|话术生成工具有哪些_一键生成带货话术的AI工具推荐
DeepSeek解释机器学习模型 DeepSeek数据科学学习指南
InZOI游戏评测:AI驱动的模拟人生,是创新还是噱头?
Motion 教程:AI 驱动的智能日程安排,提高工作效率
AI如何变革法律行政助理角色?未来发展趋势分析
7个简单高效的面部肌肉锻炼,改善面部不对称,塑造完美脸型
Notion AI整理笔记怎么用_Notion AI整理笔记使用方法详细指南【教程】
千问怎么用提示词生成演讲稿_千问演讲稿提示词框架与开场【教程】
教你用AI一键为代码添加注释,小白也能读懂复杂程序
AI时代软件工程师如何破局?未来必备技能全解析
tofai官方网站入口 tofai在线网页版登录
AI学习秘籍:3个高效黑科技,解锁智能学习新时代
AI客服工具:24/7全天候支持业务增长的秘密武器
PixianAI抠图如何导出PSD_PixianAI分层导出与PSD保存设置【实操】
Venggage AI Pitch Deck生成器:快速创建投资者演示文稿
百度搜索ai助手怎么关闭 百度搜索ai对话屏蔽方法
利用AI自动化回复Google Voice短信:终极指南
Hugging Face Transformers:文本分类的完整指南
AI电商网站搭建:CSV到WooCommerce全流程指南
雷小兔ai智能写作如何生成日记_雷小兔ai智能写作日记模板调用【步骤】
如何用AI根据职位描述(JD)定制你的求职信?
如何配置 DeepSeek 以支持企业级私有化部署
AI赋能营销:角色、策略与工具选择全指南
AI赋能建筑合同管理:ChatGPT实用案例深度解析
DeepSeek 辅助进行 Linux 内核参数调优教程
AI代码助手的崛起:软件工程的未来展望与实用指南
Gemini 辅助进行博物馆数字化藏品分类建议
Xeon E5-2667 V2性能评测:老平台焕发新生,游戏与工作负载表现分析
豆包AI怎样生成PPT目录页_豆包AI目录自动生成与页码添加【指南】
kimi如何导出对话_导出对话内容方法【攻略】
ChatGPT怎样一键生成PPT_ChatGPT生成PPT方法【步骤】
Postman Flows:构建智能AI驱动型工作流完全指南
老电脑焕新:i5-2400搭配FirePro V5900 打造复古游戏利器
Canva AI 辅助 KDP 封面设计:轻松创建畅销书笔记本
AI猫咪视频创作指南:轻松打造百万级YouTube Shorts
谷歌 Nano Banana:免费AI图像生成的强大工具
豆包AI怎么查看个人主页_管理账号信息与偏好设置
2023-04-12
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。