跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。
关于作者
- 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
- blog: http://fens.me
- email: bsspirit@gmail.com
转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20251227/
前言
随着生成式AI大模型的普及,很多项目开始从机器学习(ML)向RAG(检索增强生成)结合大模型的范式转变,确实标志着技术重心从特征工程(Feature Engineering) 转向提示词工程(Prompt Engineering)。
这一转变体现了AI从 数据驱动特征 到 知识驱动交互 的演进,通过结合MCP多工具协同,让开发者需同时掌握数据处理、检索优化与提示词设计的能力,以应对更复杂的实际应用场景。
目录
- 分享主题:从机器学习向RAG 大模型的范式转变
- 会议体验和照片分享
1. 分享主题:用 Copilot 构建机器学习模型
随着大模型的发展,越来越多的工作开始与AI深度结合,机器学习领域也正在经历一场范式转变。本次分享,我将从“机器学习”与“RAG+大模型”的对比出发,探讨两者的本质差异,以及RAG的到来为我们打开了哪些新的可能性。
分享围绕三个层面展开:
第一,应用场景的差异。 机器学习擅长处理结构化、封闭领域的任务,如分类、回归、聚类、推荐,它依赖明确的问题定义和相对静态的数据分布。而RAG+大模型面向开放域、知识密集型的生成式任务,能够动态结合外部知识,处理文本、PDF、网页等非结构化数据。
第二,技术路径的对比。 从数据处理看,机器学习以结构化数据为主,RAG则以非结构化文本为核心。从特征工程看,机器学习依赖领域专家手动设计特征或自动特征交叉;而RAG中,特征被预训练大模型的语义理解能力替代,文本通过Embedding模型自动转化为向量,提示词本身成为新的“特征”——通过角色设定、思维链、示例等方式引导模型输出。
第三,训练与评价的差异。 机器学习通常需要从头训练模型,依赖大量标注数据,评价指标是准确率、F1、AUC等客观指标,可解释性强。RAG+大模型则直接调用预训练基座模型,无需重新训练(或仅需微调),评价聚焦于检索质量,如召回率、相关性评分。
最终我们将看到:机器学习与RAG大模型并非替代关系,而是解决不同问题的不同工具。理解它们的边界与互补性,才能在新的技术范式下做出更合理的技术选型。
我主要为分三个部分进行介绍:
- 机器学习的应用场景
- RAG+大模型的应用场景
- 机器学习和RAG大模型的范式对比
2. 会议体验和照片分享
活动主题:OPC:AI时代的全新创业物种。一句提示词,一个新世界。One Word , One World。
三年前,ChatGPT3.5的横空出世,正式拉开了AI全新时代的序幕。短短三年间,AI以爆发式速度席卷全球,深度改变了个人与组织的生产方式。在创业领域,AI正在重塑资源配置与能力边界,OPC(One Person Company)作为”单人成军+A”的全新创业组织形态,正迅速成为未来趋势。
报名链接:https://www.huodongxing.com/event/8838166856000
2.1 会议主题
本次会议共2个会场,我们MVP的分享在MCP分会场议程。
2.2 讲师阵容
主持人,成芳,微软MvP|资深开发者社区运营实战专家|区块链、敏捷、DevOp等社区联合发起人,核心组织者
朱一婷,微软MVP和RD,NVIDIAGTC专家讲师|光辉城市CTO
主题:《MCP在智能体开发中的应用分析:场景、架构与实践》
张丹,微软MVP,R语言实践者,青萌数海CTO,PPT下载
主题:《从机器学习向RAG+大模型的范式转变》
郝冠军,微软MVP,微软技术直通车创始人
主题:《GitHub MCP Server入门》
王瑞,微软MVP, LyShak品牌创始人|奇安信科技集团安全研究员
主题:《AI技术赋能软件安全-智能二进制攻防的创新实践》
2.3 现场照片
纯技术沟通,高质量会议,会场满满地,座无虚席!辛苦组织者的小伙伴。










