2025 微软微软技术直通车：从机器学习向RAG 大模型的范式转变

Posted:

Mar 22, 2026

Tags:

RAG 大模型机器学习

Comments:

0 Comments

2025 微软微软技术直通车：从机器学习向RAG 大模型的范式转变

跨界知识聚会系列文章，“知识是用来分享和传承的”，各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议，向大家展示我所做的一些成果。从听众到演讲感觉是不一样的，把知识分享出来，你才能收获更多。

关于作者

张丹，数据分析师/程序员/Quant: R,Java,Nodejs
blog: http://fens.me
email: bsspirit@gmail.com

转载请注明出处：
http://blog.fens.me/meeting-ms-direct-20251227/

前言

随着生成式AI大模型的普及，很多项目开始从机器学习（ML）向RAG（检索增强生成）结合大模型的范式转变，确实标志着技术重心从特征工程（Feature Engineering）转向提示词工程（Prompt Engineering）。

这一转变体现了AI从数据驱动特征到知识驱动交互的演进，通过结合MCP多工具协同，让开发者需同时掌握数据处理、检索优化与提示词设计的能力，以应对更复杂的实际应用场景。

分享主题：从机器学习向RAG 大模型的范式转变
会议体验和照片分享

1. 分享主题：用 Copilot 构建机器学习模型

随着大模型的发展，越来越多的工作开始与AI深度结合，机器学习领域也正在经历一场范式转变。本次分享，我将从“机器学习”与“RAG+大模型”的对比出发，探讨两者的本质差异，以及RAG的到来为我们打开了哪些新的可能性。

分享围绕三个层面展开：

第一，应用场景的差异。机器学习擅长处理结构化、封闭领域的任务，如分类、回归、聚类、推荐，它依赖明确的问题定义和相对静态的数据分布。而RAG+大模型面向开放域、知识密集型的生成式任务，能够动态结合外部知识，处理文本、PDF、网页等非结构化数据。

第二，技术路径的对比。从数据处理看，机器学习以结构化数据为主，RAG则以非结构化文本为核心。从特征工程看，机器学习依赖领域专家手动设计特征或自动特征交叉；而RAG中，特征被预训练大模型的语义理解能力替代，文本通过Embedding模型自动转化为向量，提示词本身成为新的“特征”——通过角色设定、思维链、示例等方式引导模型输出。

第三，训练与评价的差异。机器学习通常需要从头训练模型，依赖大量标注数据，评价指标是准确率、F1、AUC等客观指标，可解释性强。RAG+大模型则直接调用预训练基座模型，无需重新训练（或仅需微调），评价聚焦于检索质量，如召回率、相关性评分。

最终我们将看到：机器学习与RAG大模型并非替代关系，而是解决不同问题的不同工具。理解它们的边界与互补性，才能在新的技术范式下做出更合理的技术选型。

我主要为分三个部分进行介绍：