从业互联网,软件行业已经多年,疲于做各种的项目、系统。原本走软件架构方向,基于SOA的各种系统集成解决方案。后来又投入互联网在高并发,大数据的背景下,做了云计算,SaaS等。一路跟着时代发展的脚步在前进。
现在的SNS,电子商务,微薄,博客等等的各种网络应用,都已经大众化,积累了大量的用户数据。这些数据怎么处理,便成为下一阶段要考虑的问题。@晒粉丝的应用,其实对于我来说是建立一个数据挖掘算法的运行平台。我会分析数据,但我没有能力采集数据,也没有能力存储数据。微博的开放平台,正好为我提供了一个采集数据和存储数据的平台,我可以专心做算法,解决数据的事情。
大家都知道算法有很多种,有数学,概率,统计的基础理论算法,也有计算世界里的排序算法,数据结构算法,ACM的各种算法,还是一些智能的算法,贝叶斯,神经网络,聚类等。这么多的算法,怎么用来处理微博的数据?其实我也并没有太多的经验,但我愿意努力去尝试。我希望从微博粉丝这个小点开始,发掘微博内在的关系。
晒粉丝的平台,也主要是以我个人的知识去构建的,按照以下的过程执行。
- 通过每个访问者的微博行为,进行数据采集。
- 设计算法模型,对每种数据集进行数据分析。
- 通过各种开源算法库去完成计算。
- 进行可视化的输出,返回用户能看得懂的数据。
这个应用开始只有简简单单地几个功能,粉丝云,粉丝微博年龄,认证比例。。。主要是为了搭建平台前期铺垫。之后会尽我的知识所学,发现微博的各种秘密!!
如果你使用了这个应用,谢谢你的支持。
如果你能提出你的宝贵意见,我会更加高兴!
现在只是刚开始,一切都会更好的!!
上线快一年了,今年准备来个面貌一新的改版!