收起
大数据应用案例暨CDA大数据分析就业班期中答辩
时间:6月18号
地点:海淀区厂洼街3号丹龙大厦B座3层
活动安排:
一、上午CDA大数据就业班期中答辩
时间:9:30——12:00
答辩题目:电子商务网站用户行为分析
答辩形式:6组现场和2组远程 每组分享15分钟
二、下午大数据案例分享
2:00-2:40 基于Hadoop的经管之家日志分析(北京大数据协会理事 曹正凤)
2:40-3:20 利用大数据进行美国航班晚点的预测分析(IBM大数据大学中国区项目总监 吴仲毓)
3:20-3:40 休息与讨论
3:40-4:00 CDA助力CDA数据分析师成长之路(CDA数据分析师联合创始人 周磊)
4:00-4:30 如何有效的确定数据挖掘模型的可用性(CDA数据分析研究院宋广磊)
CDA大数据就业班期中答辩毕业设计
毕设名称:电子商务网站用户行为分析
毕设方式:现场学员每小组合作完成 远程学员可以组队 也可以单独完成
毕设要求:
本例提取了淘宝数据从2013年1月至2013年5月共2万6千多条电商交易记录,具体字段可见相关表格,工作内容如下:
1.根据收货地址,编写mapreduce程序,进行用户地域分布的大数据分析,绘制用户分布画像,可以做成如下的样子:
2.绘制不同时间段用户购买次数的时序图,可以做成15天,30天,1个月的动态趋势图
3.对1万个会员的消费行为进行分析,建立会员偏好模型(可以使用数理统计和数据挖掘相应的算法),通过mahout和spark软件进行协同过滤算法的实现,并比较不同软件和算法的性能和准确性。
4.综合应用所学习的大数据工具,对该数据进行其它某个数理统计或数据挖掘的大数据分析,要包括算法、商业运用案例、效果评估等方面(开放题)。
详情可咨询:
CDA数据分析俱乐部负责 曹亮:18010116775(微信)
(8年前)
(8年前)
(8年前)
(8年前)
(8年前)
(8年前)