跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。
关于作者
- 张丹,数据分析师/程序员/Quant: R,Java,Nodejs
- blog: http://fens.me
- email: bsspirit@gmail.com
转载请注明出处:
http://blog.fens.me/meeting-r-xagi-20240720
前言
R语言大会一晃已经第十七届了,我好像是从第七届开始参加的,已经10年了。R语言我也使用了10年了,伴随着也让我从程序员变化了数据分析师。每年都要来R语言大会,来分享我的使用经验。
今年又是一个热闹的大会,不仅包括了R语言的内容,又整合了X智能大会,和数据科学国际论坛。
目录
- 分享主题:数据分析落地的最佳实践
- 会议体验和照片分享
1. 分享主题:数据分析落地的最佳实践
Chatgpt的出现,也让很多的数据分析从业人员感到担忧,什么时候自己会被模型所替代。去年在大模型影响下,很多人都觉得数据分析师会被大模型很快的替代。今年来看,虽然大模型技术更新速度很快,但是对于专业领域数据分析和数据科学的场景,大模型依然有较大难度。
数据分析师,积累了大量的行业经验,这些经验并不是简单靠大模型就能理解,还是需要人工的调优过程,这也说明,数据分析师的知识含金量很高,在这个时代中,我们要进化自己,保持学习的动力,和实际 解决问题的能力,结合chatgpt辅助为我所用,才是时代赋予我们的机会。
我主要为分六个部分进行介绍:
- 什么是数据落地
- 数据分析怎么做
- 调包侠的时代已过
- 数据分析不只是指标体系、更不是指标堆积!
- 知识结构在变化,对人的要求越来越高
- 业务场景千差万别,适应变化
2. 会议体验和照片分享
此次盛会将邀请多位 MVP嘉宾,同时也有微软的员工,大家从不同的角度,把数据如何理解,如何加工,如何使用,如何落地进行阐述,我自己也是收益颇多,看到了不同层面的东西。
我们诚挚地邀请您参加本次活动,深入体验科技与智慧的精彩交融,共同见证AI时代所带来的创新、变革与无限可能。
本次会议官方报名页:第17届中国R会议 & 2024 X 智能大会 & 2024 数据科学国际论坛联合会议
2024.7.20-21 (9:00-17:30) :
线下:中国人民大学逸夫楼、立德楼
线上:学说直播平台
2024.7.22(19:00-21:00):
线上:学说直播平台
2.1 会议主题
我参加在数据科学专场践专场,由 4位行业专家参加:刘思喆(统计之都),kim(明宏投资), 许以言(和鲸科技),张丹(青萌数海), 一起作为分享嘉宾。视频回看:,https://mobile.51xueshuo.com/#/viewLive?planCode=1808151079477710848,我讲的内容在1小时30分开始。
活动嘉宾阵容:
Kim, GPU 在量化投资中的优势及应用
个人简介:
Kim ,就职于头部量化私募,负责量化交易低延时,高性能计算系统的有关开发工作。
报告摘要:
2007 年 英伟达发布 CUDA 编程范式以来,经过 17 年的发展,GPU 在算力和显存都已经逐步远超通用 CPU 的能力。量化投资领域一直走在技术的最前沿,原有用 CPU 来进行的高性能计算的程序,也逐步在切换到使用 GPU 来加速的模式。这里将介绍日常工作中 GPU 的应用场景,实际开发中遇到的问题,以及分享 GPU 提升对应业务效率的具体案例。
许以言,面向有组织科研的的模型生命周期管理
个人简介:
许以言,和鲸科技产品专家,专注于数据驱动研究与 AI for Science 场景的数据科学平台产品设计与方法创新,参与了 ModelWhale 数据科学协同平台在气象、地质、遥感、空间科学、临床等众多科研智能领域的落地,对数据智能场景的多角色协同研究流程有独到的见解与丰富的经验积累。
报告摘要:
随着有组织科研的快速发展,数据信息与数据价值正以更高维的形式体现在模型中,数据分析的过程也需要由多领域专家参与其中,本报告将围绕空间数据智能分析场景的模型生命周期管理流程,介绍 ModelOps 方法,并探讨面对交叉领域研究场景,如何通过平台化的工具与社区化的方法支撑有组织科研。
刘思喆,因果推断技术在工业界的实践应用
个人简介:
刘思喆,统计之都理事会成员。先后在彩票、电信、电商、教培、交通、餐饮行业从事算法、数据科学、营销赋能等相关工作。曾任 51Talk 数智中心助理副总裁、首席数据科学家,也曾任京东推荐平台部高级经理 ,京东技术名人堂成员之一。中国人民大学大数据分析实验班、首经贸信息学院校外硕士生导师。国内 R 语言的布道者,21 年的使用经验,《153 分钟学会 R》的作者,《R 语言核心技术手册》的译者。
报告摘要:
本报告围绕工业界中因果推断的核心价值展开,探讨其在产品优化、市场策略调整、供应链管理等业务中的重要性。本报告也将尝试系统梳理常见的因果推断技术,包括随机实验、倾向得分匹配、断点回归分析、合成控制等方法,并探讨它们之间的内在联系、适用场景及其潜在局限。通过剖析企业中的真实业务案例,我们将生动展示,如何利用这些方法提炼出精准的因果洞见,持续赋能企业的高质量决策的完整过程。
张丹,数据分析落地的最佳实践
个人简介:
张丹,R语言实践者,北京青萌数海科技有限公司CTO,微软MVP。10年以上互联网应用架构经验,在R、大数据、数据分析等方面有深厚的积累。精通量化投资交易策略,熟悉中国金融二级市场、交易规则和投研体系。熟悉数据学科方法论,在海关、药监、外汇等监管科技领域均有落地项目。著有《R的极客理想:量化投资篇》、《R的极客理想:工具篇》、《R的极客理想:高级开发篇》,图书英文版被CRC出版集团引进,在美国发行。个人博客:http://fens.me 。
报告摘要:
现在我们正处于大数据时代,处处都产生数据,大部分数据已经不再稀缺,分析方法和算法模型都也写在了教科书中。
如何挖掘出数据的价值,让数据分析落地,把数据价值转换为自身价值,是数据分析师核心要考虑的。
数据分析要解决实际业务场景问题,伪需求、不清晰的目标,都会造成项目失败。数据分析不只是指标体系、更不是指标堆积,市场在变,数据也在变,我们的知识结构也要跟着变化。
数据分析是跨学科的工作,对人的要求也越来越高,调包侠的时代已过。要以新的视角,看数据、看业务、看技术发展、看我们自己,适应变化,才能把项目做好、落地。
2.2 现场照片
主会场的情况:
主会场开始前
主会场听众
本次R会的主席致辞
吴喜之教授
我又听了几场分享:
朱赛赛,同方知网图书工具书与志鉴产品总监,统计数据大模型的应用场景和解决方案的探索与实践
唐飞虎,月之暗面高级研发工程师、开发者关系负责人,长文本应用如何推理加速。
王小宁,现为中国传媒大学数据科学与智能媒体学院副教授,中国商业统计学会理事,智能教育革命:如何借助大语言模型改善统计和数据科学教学。
17年了坚持下来真的不容易,我也从一个R语言的小白,变成一个坚定R语言的实践者。感谢统计之都这个民间组织,感谢人民大学长期的教授的支持。希望R会一直有,年年高水平。