• Posts tagged "大模型"

Blog Archives

2025 微软微软技术直通车:从机器学习向RAG 大模型的范式转变

跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。

关于作者

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20251227/

前言

随着生成式AI大模型的普及,很多项目开始从机器学习(ML)向RAG(检索增强生成)结合大模型的范式转变,确实标志着技术重心从特征工程(Feature Engineering) 转向提示词工程(Prompt Engineering)。

这一转变体现了AI从 数据驱动特征 到 知识驱动交互 的演进,通过结合MCP多工具协同,让开发者需同时掌握数据处理、检索优化与提示词设计的能力,以应对更复杂的实际应用场景。

目录

  1. 分享主题:从机器学习向RAG 大模型的范式转变
  2. 会议体验和照片分享

1. 分享主题:用 Copilot 构建机器学习模型

随着大模型的发展,越来越多的工作开始与AI深度结合,机器学习领域也正在经历一场范式转变。本次分享,我将从“机器学习”与“RAG+大模型”的对比出发,探讨两者的本质差异,以及RAG的到来为我们打开了哪些新的可能性。

分享围绕三个层面展开:

第一,应用场景的差异。 机器学习擅长处理结构化、封闭领域的任务,如分类、回归、聚类、推荐,它依赖明确的问题定义和相对静态的数据分布。而RAG+大模型面向开放域、知识密集型的生成式任务,能够动态结合外部知识,处理文本、PDF、网页等非结构化数据。

第二,技术路径的对比。 从数据处理看,机器学习以结构化数据为主,RAG则以非结构化文本为核心。从特征工程看,机器学习依赖领域专家手动设计特征或自动特征交叉;而RAG中,特征被预训练大模型的语义理解能力替代,文本通过Embedding模型自动转化为向量,提示词本身成为新的“特征”——通过角色设定、思维链、示例等方式引导模型输出。

第三,训练与评价的差异。 机器学习通常需要从头训练模型,依赖大量标注数据,评价指标是准确率、F1、AUC等客观指标,可解释性强。RAG+大模型则直接调用预训练基座模型,无需重新训练(或仅需微调),评价聚焦于检索质量,如召回率、相关性评分。

最终我们将看到:机器学习与RAG大模型并非替代关系,而是解决不同问题的不同工具。理解它们的边界与互补性,才能在新的技术范式下做出更合理的技术选型。

我主要为分三个部分进行介绍:

  • 机器学习的应用场景
  • RAG+大模型的应用场景
  • 机器学习和RAG大模型的范式对比

2. 会议体验和照片分享

活动主题:OPC:AI时代的全新创业物种。一句提示词,一个新世界。One Word , One World。

三年前,ChatGPT3.5的横空出世,正式拉开了AI全新时代的序幕。短短三年间,AI以爆发式速度席卷全球,深度改变了个人与组织的生产方式。在创业领域,AI正在重塑资源配置与能力边界,OPC(One Person Company)作为”单人成军+A”的全新创业组织形态,正迅速成为未来趋势。

报名链接:https://www.huodongxing.com/event/8838166856000

2.1 会议主题

本次会议共2个会场,我们MVP的分享在MCP分会场议程。

2.2 讲师阵容

主持人,成芳,微软MvP|资深开发者社区运营实战专家|区块链、敏捷、DevOp等社区联合发起人,核心组织者

朱一婷,微软MVP和RD,NVIDIAGTC专家讲师|光辉城市CTO

主题:《MCP在智能体开发中的应用分析:场景、架构与实践》

张丹,微软MVP,R语言实践者,青萌数海CTO,PPT下载

主题:《从机器学习向RAG+大模型的范式转变》

郝冠军,微软MVP,微软技术直通车创始人

主题:《GitHub MCP Server入门》

王瑞,微软MVP, LyShak品牌创始人|奇安信科技集团安全研究员

主题:《AI技术赋能软件安全-智能二进制攻防的创新实践》

2.3 现场照片

大合照

现场美食

主会场

纯技术沟通,高质量会议,会场满满地,座无虚席!辛苦组织者的小伙伴。

转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20251227/

2026 微软微软技术直通车:用 Copilot 构建机器学习模型

跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。

关于作者

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20260321/

前言

用大模型写程序,如今已变得愈发成熟。对于标准的程序结构,大模型生成得又快又好,确实能替代大量重复的开发时间,让我们从繁琐的代码细节中解放出来。然而,数据分析有其特殊性——它不只要求程序结构正确,更考验对业务逻辑的理解、统计学基础的掌握,以及面对不确定性的解释能力。单纯的“代码跑通”并不等同于“分析准确”。本次分享,我们将把大模型置于数据分析的真实场景中,借助GitHub Copilot,一同探索它的能力边界:哪些环节它可以成为得力助手,哪些关键节点依然离不开人的判断。这不仅是一次技术演示,更是一次对AI辅助分析范式的理性审视。

目录

  1. 分享主题:用 Copilot 构建机器学习模型
  2. 会议体验和照片分享

1. 分享主题:用 Copilot 构建机器学习模型

本次分享将聚焦一个核心问题:当大模型开始帮我们写代码,数据分析的哪些环节可以放心交给AI,哪些环节依然离不开人的判断?

我们不会绑定任何具体业务场景,而是以通用数据分析为脉络,系统性地探讨大模型的能力边界。分享将围绕五个主题展开:首先,梳理机器学习建模的标准流程,明确哪些是“确定性执行”,哪些是“不确定性判断”。接着,通过现场演示,看AI如何快速完成统计概览、机器学习建模、可视化图表三类常见任务——从数据加载到模型评估,从基础图表到交互式可视化,直观感受AI的生成效率与代码质量。在此基础上,我们将对比“大模型生成代码”与“古法手写代码”的差异:效率上,AI将分钟级工作压缩至秒级;可控性上,人类仍需对关键逻辑进行审核;思维方式上,开发者的核心能力正从“记忆语法”转向“提问与判断”。最终我们将得出一个务实结论:大模型是数据分析的“超级副驾驶”,它能极大降低编程门槛、提升开发效率,但在业务理解、统计诊断、结果解读等需要深度判断的环节,依然需要人作为主导。适合所有希望借助AI提升效率、同时又保持理性思考的数据从业者与业务分析师参与。

我主要为分三个部分进行介绍:

  • 机器学习建模关键步骤
  • 让AI生成代码:统计概览
  • 让AI生成代码:机器学习
  • 让AI生成代码:可视化工具
  • 大模型生成代码 VS 古法手写代码

2. 会议体验和照片分享

活动主题:微软技术直通车(第二十九期) 之 GitHub Copilot Dev Days 2026 | Beijing —— 代码人生的智能春天

微软技术直通车第二十九期,将于2026年3月21日面向大家。本次活动将作为全球GitHub Copilot Dev Days 2026系列活动的一部分,汇聚各开发者、爱好者和本地科技社区,通过实践体验探索GitHub Copilot的强大功能。并由微软MVP为您深度剖析案例、拆解技术架构。北京部分的活动重点采用嘉宾现场技术分享的方式进行,将为您呈现一场Github Copilot智能技术盛宴——干货满满,技术多多。这是一次引领未来的旅程,让我们一同探索如何将人工智能与当前的生产力环境相结合,创造出令人惊叹的技术创新和无限可能性。

本次活动面向所有开发者开放,由微软MVP主导,技术直通车技术社区主办,设计高度实用,重点介绍现实工作流程、动手作活动以及以GitHub Copilot人工智能辅助编码为核心的工作坊。希望本次活动能够成为您在人工智能领域学术交流和技术应用中的重要一步,给您带来无尽收获。

报名链接:https://www.huodongxing.com/event/6850835727900

官方会议纪要:https://mp.weixin.qq.com/s/1J3fieLkpGsezXasQ-hyxQ

2.1 会议主题

2.2 讲师阵容

朱一婷,微软MVP和RD,NVIDIAGTC专家讲师|光辉城市CTO

主题:《GitHub Copilot:解锁新潜能,激活全场景AI伙伴》

探索GitHub Copilot从助手到智能体协作的全新进化,不再被动等待指令,可自主规划、多步执行复杂任务。多终端全场景覆盖,AI伙伴随时响应。介绍全新的后台智能体能力,以及如何基于GitHub Copilot SDK将GitHub Copilot Agent集成到应用和服务中。

张丹,微软MVP,R语言实践者,青萌数海CTO,PPT下载

主题:《用Copilot构建机器学习模型,让小白也能做数据分析》

用机器学习做数据分析,是一种普遍的智能模型建模的思路。机器学习基于结构化数据,以统计概率为算法基础,计算快,解释性好,但是上手的门槛不低,需要有统计学的知识,以及对业务的理解。利用GitHub Copilot,补齐短板,让小白也能做数据分析。

郝冠军,微软MVP,微软技术直通车创始人

主题:《使用Copilot CLI开发应用》

通过实例介绍基于Copilot CLI的应用开发。基于Copilot CLI,使用Terminal,自定义指令,自定义Prompt,MCP,定制的Agent,以及Skill等,借力AI直接在Terminal中进行软件开发。

2.3 现场照片

大合照

会议组织者:刘力科,连续10余年微软MVP,20余年微软系统工程师,Microsoft 365和Azure AI双方向微软最有价值专家,“微软技术直通车”创始人

纯技术沟通,高质量会议,会场满满地,座无虚席!辛苦组织者的小伙伴。

转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20260321/

2025 微软微软技术直通车:大模型在数据分析领域落地的思考

跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。

关于作者

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20250518/

前言

Deepseek惊横空出世,打破了AI大场的算力垄断,拉平了个体与大厂的距离,让我们所有人都战在了同一起跑线。Deepseek强大的推理能力,确实让人震撼。如何把Deepseek用好在专业领域,实现AI落地,是最近大家都在尝试的和突破的。

我所熟悉的数据分析,正是战火最激烈的前线,让 Deepseek 在数据分析领域落地

目录

  1. 分享主题:大模型在数据分析领域落地的思考
  2. 会议体验和照片分享

1. 分享主题:Deepseek在数据分析领域落地的思考

Deepseek的出现,也让很多的数据分析从业人员感到担忧,什么时候自己会被模型所替代。去年在大模型影响下,很多人都觉得数据分析师会被大模型很快的替代。今年来看,虽然大模型技术更新速度很快,但是对于专业领域数据分析和数据科学的场景,大模型依然有较大难度。

数据分析师,积累了大量的行业经验,这些经验并不是简单靠大模型就能理解,还是需要人工的调优过程,这也说明,数据分析师的知识含金量很高,在这个时代中,我们要进化自己,保持学习的动力,和实际 解决问题的能力,结合DeepSeek辅助为我所用,才是时代赋予我们的机会。

我主要为分三个部分进行介绍:

  • Deepseek的基本情况
  • 数据分析要解决的问题
  • 契合点和分歧点

2. 会议体验和照片分享

活动主题:微软技术直通车(第二十四期)之 Microsoft Season of Agents(Beijing)

微软技术直通车第二十四期,将于2025年5月17日面向大家。活动将采用嘉宾现场技术分享的方式进行,“Microsoft Season of Agents(Beijing)”,将为您带来关于大模型发展“后时代”的启示和更多的思考,同时为AI加持生产力和Agent的高智能和全面自动化工作流程提供更多的示范,创造出令人惊叹的技术创新和无限可能性。

参加本次活动的专家全部来自微软的最有价值专家团队,他们均为从业AI领域最新发展方向的深切实践者。通过参加本次活动来宾将获得对于自己未来的技术方向和职业前景的展望和助力,并能够在沉浸中体验Agent给AI生态带来全新活力,以及强大便捷的生产力支持,同时在提高事务处理效率降低成本上带来前所未有的积极体验。

2025年5月17日下午,中国——北京——中关村——微软(中国)总部,Microsoft Season of Agents(Beijing)期待你的参与。

本期活动是由微软最有价值专家大中华区项目组(Microsoft MVP)、微软技术直通车(MSTECHLNK)和软积木联合主办,同时得到微软 Reactor 的推广和视频直播支持,将给您带来不同的期待和更加沉浸的技术体验,敬请参与。

报名链接:https://mstfreactor.huodongxing.com/event/1805921863911

官方会议纪要:https://mp.weixin.qq.com/s/ha7YWzziz2z2gglkniu8AQ

2.1 会议主题

会议PPT通过网盘分享的文件:
链接: https://pan.baidu.com/s/1BFRb5q4Vwg0Jw8nZ1kMvQQ
提取码:j5wp

2.2 讲师阵容

梁迪,微软MVP项目大中华区 负责人

刘海峰,微软MVP,软积木CEO,PEC China发起人

主题:大模型后时代企业AI落地的正确姿势

视频回放:https://www.bilibili.com/video/BV1MNJuz6E6Z/

“后时代”,企业如何真正将其价值落到实处?本次演讲将结合最新AI发展趋势与真实落地案例,深入探讨企业如何找准方向,构建可持续、可扩展、可交付的大模型应用体系,助力实现智能化转型与业务突破。

朱一婷,光辉城市CTO,微软最有价值专家(Microsoft MVP),微软技术社区区域总监

主题:Azure AI Agent Service 开发应用指南

视频回放:https://www.bilibili.com/video/BV1UNJuzzE4Y/

深入讨论了随着大模型相关技术的飞速发展,AI智能体也在快速走向实际应用,成为推动各行业数智化转型的关键。从大语言模型到智能体的原理速通,快速建立技术认知基础。结合实际案例场景,让大家了解了如何借助 Azure AI Agent Service 快速实施智能体应用。给希望了解智能体技术的开发者和正在寻找创新解决方案的决策者,带来了深刻的启发和巨大的帮助。

张丹,微软MVP,R语言实践者,

主题:DeepSeek在数据分析领域落地的思考

视频回放:https://www.bilibili.com/video/BV1UPJuzgEpM/

朱钢,微软最有价值专家,U3D工程师,eSimu工业智能系统服务端架构负责人,公众号《喵叔写技术》作者。

主题:Github Copilot Agent 在项目开发中的应用

视频回放:https://www.bilibili.com/video/BV1bPJuzgE8u/

深入讲解了AI在项目开发中显著提升效率,通过智能生成代码、优化算法减少编码时间;基于历史数据精准预测工时,合理规划资源;自动化代码审核快速识别漏洞,提升质量。AI还能实时监控进度,动态调整任务,降低延迟风险,助力团队高效协作,缩短交付周期,实现降本增效。

2.3 现场照片

大合照

组织者:刘力科,摄像,会场

主持人:栋杰

会议现场:

听众的交流

高质量会议,会场满满地,座无虚席!辛苦组织者的小伙伴。

转载请注明出处:
http://blog.fens.me/meeting-ms-direct-20250518/

2025 Global AI Bootcamp : Deepseek在数据分析领域落地的思考

跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。

关于作者

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/2025-global-ai-bootcamp-deepseek/

前言

Deepseek惊横空出世,打破了AI大场的算力垄断,拉平了个体与大厂的距离,让我们所有人都战在了同一起跑线。Deepseek强大的推理能力,确实让人震撼。如何把Deepseek用好在专业领域,实现AI落地,是最近大家都在尝试的和突破的。

我所熟悉的数据分析,正是战火最激烈的前线,让 Deepseek 在数据分析领域落地

目录

  1. 分享主题:Deepseek在数据分析领域落地的思考
  2. 会议体验和照片分享

1. 分享主题:Deepseek在数据分析领域落地的思考

Deepseek的出现,也让很多的数据分析从业人员感到担忧,什么时候自己会被模型所替代。去年在大模型影响下,很多人都觉得数据分析师会被大模型很快的替代。今年来看,虽然大模型技术更新速度很快,但是对于专业领域数据分析和数据科学的场景,大模型依然有较大难度。

数据分析师,积累了大量的行业经验,这些经验并不是简单靠大模型就能理解,还是需要人工的调优过程,这也说明,数据分析师的知识含金量很高,在这个时代中,我们要进化自己,保持学习的动力,和实际 解决问题的能力,结合DeepSeek辅助为我所用,才是时代赋予我们的机会。

我主要为分三个部分进行介绍:

  • Deepseek的基本情况
  • 数据分析要解决的问题
  • 契合点和分歧点

2. 会议体验和照片分享

活动主题: GIobaI AI Bootcamp·北京 从AI技术突破到全球落地

2025年初,国产大模型DeepSeek成为了AI领域的焦点,为整个行业发展注入新动能。在全新科技浪潮背景下,企业和个人都面临着如何通过AI以提升工作效率和创造更大价值的挑战和机遇。

Global AI Bootcamp是一个凝聚全球的AI开发者共同学习交流,共同推进人工智能行业快速发展的全球性活动,此活动旨在为参与者提供一个集结学习、交流和创新的平台,使其能够接触到前沿AI知识,并与志同道合的成员进行深入的探讨与实践。

自2023年起,软积木联合微软直通车在中国成功举办多次线下活动,获得行业热烈反响,为进一步聚焦AI技术前沿洞察,推进AI实际应用,我们计划3月15日于在北京微软中国研发集团总部推出Global AI Bootcamp活动。此次盛会将邀请多位AI行业重磅嘉宾深入探索AI服务在不同领域的应用潜力。

我们诚挚地邀请您参加本次活动,深入体验科技与智慧的精彩交融,共同见证AI时代所带来的创新、变革与无限可能!
本次会议官方报名页:2025·第三届Global AI Bootcamp·北京-从AI技术突破到全球落地

2.1 会议主题

2.2 讲师阵容

主持人:易亚婷,《易论AI》创世人

梁迪,微软MVP项目大中华区 负责人

刘海峰,微软MVP,软积木CEO,PEC China发起人

李婷,微软中国生态伙伴事业部 技术总监,微软AI技术:开启企业全球化新篇章

云中江树,LangGPT创始人,与DeepSeek协同:理念和方法

张丹,微软MVP,R语言实践者,DeepSeek在数据分析领域落地的思考

郝冠军,十年微软MVP,从Github copilot 看 AI 重塑软件开发模式

圆桌讨论:姜稳,徐磊,占冰强,周川,高书葆

2.3 现场照片

大合照

MVP团合照

闪电演讲TOP3

现场美食

现场观众

现场观众

现场观众

高质量会议,会场满满地,座无虚席!辛苦组织者的小伙伴。

转载请注明出处:
http://blog.fens.me/2025-global-ai-bootcamp-deepseek/

浅谈Sora新纪元下的数据分析的变革和机会

架构师的信仰系列文章,主要介绍我对系统架构的理解,从我的视角描述各种软件应用系统的架构设计思想和实现思路。

从程序员开始,到架构师一路走来,经历过太多的系统和应用。做过手机游戏,写过编程工具;做过大型Web应用系统,写过公司内部CRM;做过SOA的系统集成,写过基于Hadoop的大数据工具;做过外包,做过电商,做过团购,做过支付,做过SNS,也做过移动SNS。以前只用Java,然后学了PHP,现在用R和Javascript。最后跳出IT圈,进入金融圈,研发量化交易软件。

架构设计就是定义一套完整的程序规范,坚持架构师的信仰,做自己想做的东西。

关于作者:

  • 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
  • blog: http://blog.fens.me
  • email: bsspirit@gmail.com

转载请注明出处:
http://blog.fens.me/ai-sora

前言

2024年初,AIGC领域迎来跨时代技术大爆发,OpenAl发布Sora引领了新一轮的科技革命。我受邀请参加2024 Global AI Bootcamp,参加圆桌讨论:畅谈Sora新纪元下的行业变革与商业价值。会议页面:2024 Global AI Bootcamp: 畅谈Sora新纪元下的行业变革与商业价值

我本身就处于数据分析行业,一直有关注于大模型的进展,特别是怕Sora(chatgpt) 的强大,很快会把我也进行替代,因此做了一些调研。观点不成熟,而且仅聚焦于我所处于的行业。

目录

  1. 我的背景
  2. Sora通用大模型目前还不完美
  3. 世界模拟器:想象空间很大
  4. 专业领域模型有自己的生成逻辑
  5. 数据分析,如何结合大语言模型

1. 我的行业背景

我是张丹,技术出身,擅长R语言,一直还处于一线做数据分析。公司是北京青萌数海科技有限公司,服务于政府客户,以数据分析、数据建模为主。

在大数据时代,各个政府部门也积累了大量的数据,但是还主要以专家经验为核心,我们通过AI模型,可以极大的提升监管的效率,提升命中的准确率。

像chatgpt,sora生成式的大模型,我们也很关注,一方面担心被替代,另一方面也在思考怎么能结合实际工作的特点,提升数据分析的效率。

2. Sora通用大模型目前还不完美

我的主要观点,目前来看Sora(chatgpt),为代表的通用大模型目前还不完美。

我们所从事的数据分析领域模型和生成式大模型底层逻辑是不同的,从感觉上chatgpt在数据分析领域落地,还是比较难的。这种“落地”是能够直接替代 数据分析师 的落地,而不是指为 数据分析师 提供工具,还是离不开大量人工的辅助工具化。

我认为通用大模型(chatgpt) 和 专业领域模型(机器学习、深度学习、强化学习),能力并一样。

特别是从评价的角度,通用大模型,现在都是一种“感觉”的评价,比如大模型chatgpt 写的文字不错,Sora生成画面很舒服,感觉很真实。而专业领域模型需要有明确的目标,要求准确、高效。比如,我们需要明确找到 在100万笔电商的订单中,哪笔订单有问题,是否可能为走私、逃税的违法操作。

各个行业其实都有自己的法律、规范、要求等明确的依据条文,业务人员根据这些条文的要求设定规则,专业领域模型(机器学习)通过泛化能力,以概率的方式转化对规则边界定义,但依然保持着对目标的方向的锁定。而chatgpt大模型,似乎又近一步做了泛化,将导致对于目标的清晰度近一步丢失。

我个人感觉,大模型能落地的部分,还是面向toC的娱乐领域,在toB/toG领域还有一段路要走。就好比 短视频 和 电影,一个是消遣和娱乐,一个是高质量和深度。领域不同,要求不同。

2. 世界模拟器:想象空间很大

OpenAI 提出Sora是世界模拟器,而不是简单的文生视频的工具,这无疑是增加了大家对Sora的未来的想象力,为了更高的估值,获得更多的资金。

当然,Sora的能力确实能给我们眼前一亮的感觉,大幅领先于同时期的模型,可以把原来做不到的进行实现。

再科幻一点的想象,Sora生成的视频,不是一个纯计算机的数字化计算。而是创造一个平行世界,把平行世界中的内容展示出来,就像神创造了人类,人类就是sora世界中的神。不仅可以对未来做预测,也可以重现历史上任何事情的发生。所以,OpenAI要做万亿美元的融资,增加算力。那么,可能就到了人类的末日了(科幻领域)。

但现在Chatgpt大模型公布的生成机理上,还到不了智慧化的水平,可能一种探索的方向。

不管是chatgpt,还是sora,都是基于Transformer框架,用到的计算机数字计算的一种方式。 chatgpt的训练,是把所有收集的文档内容,通过遮盖文档的一部分,进行预测,来建立所有文字之间的上下文关系。当我们输入一个问题,chatgpt把他已知的文字向量关系输出给我们。对于sora的训练,是把所有收集的图片,通过打马赛克的方式进行遮挡,再反向通过全马赛克开始进行预测,从而输出一幅高质量图片,再加上时间轴连成视频。

3. 专业领域模型有自己的生成逻辑

专业领域模型通常有自己的计算逻辑,专业领域模型,一种是科学领域,一种是应用领域。

在科学领域:

  • 央视报道:AI 仅用6周时间破解了移民火星的生存之谜,模拟243次实验,从数百万的方法中,找到了产生氧气的黄金配方,15小时,暴力穷举,足够人类生存的氧气。
  • 用AI进行科学研究,找到抗生素Halicin,能够杀灭对已知抗生素产生耐药性的细菌菌株。研究小组找到包含2000种已知特性分子数据库,标记是否能组织细菌生长,进行模型训练,自动识别哪些分子能进行抗菌。最后用来审查FDA批准的药物,和天然产品库的6万多种不同的分子结构。
  • Google推出的 GraphCast 产品预测天气预报,1 分钟内预测未来 10 天的天气,GraphCast 是一种基于机器学习和图神经网络 (GNN) 的天气预报系统,比传统方法便宜 1000 倍。

在应用领域:

  • 量化交易模型,根据金融市场交易的数据、信息、规则等,设计模型构建交易策略,实现基金的盈利。
  • 风险甄别模型,根据进出口货物贸易的法规、报关单数据、国际形势变化等,发现走私、逃税、洗钱等风险。

在专业领域中,我们都是从目标出发,到底要解决什么问题。那么,我们在培养一个专业的数据分析师时,一般会按照专家路线,从业务入手,边做边理解。但反观大模型的生成式的训练过程,其实与培养人的过程是不同的。

因此,大模型在短期内,应该还不能把我们替代。

4. 数据分析,如何结合大语言模型

如果不能替代,那么就考虑怎么结合。

让大模型结合专业领域模型,是一种可行的路径。以大模型为主线,打通各个孤立的专业领域模型。比如:天气+粮食+进出口贸易+国际形势 = ? 是否会有粮食危机。药品 + 疾病 + 基因 + 政策 = ?会出现什么。

从而找到市场的空白点,帮助数据分析师找到新的思路。

数据分析领域,我们也有一些痛点:

痛点一,随着chatgpt在生活中的普及,同时提升了大家的认知水平。做数据分析的从业者,又开始要面对领导提出问题,现在AI这么牛了,把数据给了模型,结果就出来了,应该要想什么就有什么,为什么你们做不到。说技术听不懂,说成本预算有限。所以,toG 的项目,也是挺难干的。

痛点二,整个的数据分析过程,对于大部分没有一线参与建模的人来说,还是不理解的,就像我们也不理解chatgpt,sora的一样,只是根据效果、论文、别人的解释,进行理解。如果通用人工智能,如果可以把整个的数据处理、加工、建模过程,可视化、解释性,进行解释出来,就是把专业的知识简单化,就可以大幅提升数据分析行业效率。

最后,说说我理解的 大模型toG落地。从技术上来讲,建模过程主要是训练和推理。训练:通过海量的高质量数据进行训练,特别是结合内网数据,结合知识图谱数据,可以大幅提升行业模型的适配度,让AI懂行业。推理:结合专业领域模型,进行推理的模拟,进行目标导向,提升准确率。

如果有一天实现了 适用于各个行业通用的推理引擎,专业领域模型就真的可以被替代了,也许世界模拟器,也就能真正实现了。

观点不成熟,而且仅聚焦于我所处于的行业。

转载请注明出处:
http://blog.fens.me/ai-sora