带你构造AI技术栈版图（下）

AI技术栈与编程技术栈"类比"

如果对AI技术栈不太了解，但是对编程技术栈有一定了解的同学，下面这张图你理解起来可能会更容易一些：

基础设施层 vs 操作系统层

首先是基础设施上都非常类似，因为计算机硬件、操作系统和CPU指令集往往代表着最高级别的抽象。

框架层 vs 编译器层

往上看，AI大模型技术栈的框架层对应编程技术栈的编译器层，编译器层的第一作用就是，将高级语言转换为机器可执行的底层代码。其次是在编译阶段进行代码优化。

而AI框架层的主要作用就是将用户定义的高层模型转换为底层计算图（如TensorFlow的静态图、PyTorch的动态图）。还有就是在运行时优化计算图执行（如算子融合、内存复用、自动选择最佳硬件后端）。

两者均承担了“将高层逻辑映射到底层执行”的核心职能。编译器是静态代码到机器码的“翻译器”，而AI框架是动态模型到硬件指令的“映射器”。

编程语言层 vs 模型层

编程技术栈的编程语言层，提供开发者编写程序的基础语法和核心能力，并能够通过语言特性（如面向对象、垃圾回收）封装底层复杂性，使开发者专注于逻辑实现。

相对应AI的模型层（GPT-4o、DeepSeek-V3），则主要提供预训练的知识与推理能力（如自然语言理解、代码生成），可直接用于任务解决。通过模型架构（如Transformer）封装海量数据和复杂计算，使开发者无需从头训练模型。两者均为各自技术栈的核心能力提供者。

编程语言是开发者表达逻辑的“工具”，而预训练模型是AI开发者调用智能的“工具”。

接口层 vs 开发框架层

编程领域的开发框架层主要是提供模块化组件、通信协议支持，将底层技术细节（如TCP连接、线程池）抽象为高层API，让开发者聚焦业务逻辑。

而相对的AI的接口层主要就是将模型能力封装，将底层模型的计算复杂性抽象为开发者友好的接口。

应用层 vs 应用层

AI大模型技术栈的应用层与传统编程技术栈的业务应用层在目标上高度一致：直接解决用户需求。

编程领域的业务应用层主要就是基于底层框架（如Spring、Gin）构建，封装业务逻辑。

而AI应用层主要就是基于模型接口层（如OpenAI API、LangChain）构建，封装AI能力，并依赖大模型推理、向量数据库、RAG（检索增强生成）等技术。

通过分层类比，AI大模型技术栈可视为一种以数据为中心、计算密集型的垂直技术栈，而传统编程技术栈是以逻辑为中心、通用化的横向技术栈。两者的融合（如AI原生应用开发）正在成为趋势，例如用LangChain编排业务逻辑，同时调用LLM API实现智能化功能。

分层定位与学习路径

在理解AI大模型技术栈的分层逻辑后，学习和开发过程中需要根据技术栈的分层特点，明确目标定位、选择合适工具并制定针对性策略。

应用层

应用层需要直接面对客户使用，所以重点的能力就是场景适配，即提示工程（Prompt Engineering）和AI智能体的工作流设计。在用户体验方面，需要处理模型输出的不确定性。

接口层

这一层的重点在于模型服务化，比如OpenAI API的流式响应、LangChain的Chain/Agent设计模式。甚至可以使用Ollama工具将AI大模型进行本地化部署。

模型层

从这一层开始，就需要有一些AI的专业能力作为铺垫了，因为可能会涉及到模型架构的概念，比如Transformer的Self-Attention、MoE（混合专家）的路由机制，以及模型训练技术等等。

框架层

在这一层主要的工具就有PyTorch、TensorFlow等，主要用来做张量操作、自动微分（Autograd）、计算图（静态图 vs 动态图）。

此外还有高级封装库，比如Hugging Face Transformers的预训练模型调用、Keras的高层API。

基础层

基础层的内容可能大多数人都不太需要关注到，可以仅作为了解，比如理解GPU/TPU的并行计算原理（如CUDA核心、张量加速），了解cuDNN、OneDNN等加速库的使用场景和DeepSpeed、Megatron的分布式策略（数据并行、模型并行）等等。

小总结

在阅读完这篇文章之后，你是否已经对AI领域的相关技术栈分类有初步的认识？在明确了这些工具之后，后续我们无论是为了个人开发还是团队提效，都可以先做出对自己想要开发的产品作出基本的定位，有了定位之后就可以依照流程做出设计和开发。

对文章内容有哪些疑问，可以在留言区一起讨论。

科技改变生活-雨落星辰 - 所有的伟大,都源于一个勇敢的开始

带你构造AI技术栈版图（下）