作业要求源自https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620
1.分析所采用数据的来源有哪些?
浏览了2019春节各种大数据分析报告,数据的来源大概分为以下几类:
- 交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
- 移动通讯数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。
- 机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等。
- 互联网上的“开放数据”来源。如政府机构,非营利组织和企业免费提供的数据。
- 人为数据即通过人类行为产生的数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。
2.大数据的呈现方式有哪些?
大数据一般借助于图形化的手段,清晰、快捷有效的传达与沟通信息。比较常用的呈现方式大概有以下几个分类:
- 指标值图形化。(例如柱状、圆环和曲线图等)

- 颜色可视化。
- 关系图形化。
- 关键词可视化。
3.大数据的特点是什么?对思维方式有何影响?
大数据的特点是大量化、快速化、多样化、价值化四种特点。
对思维方式有全样而非抽样、效率而非明确和相关而非因果三种影响。
- 全样而非抽样。就是直接获取总体信息,不必通过样本参数去推断总体参数。
- 效率而非明确。在样本=总体的大数据时代(有多少偏差就是多少偏差而不会被放大),快速获得一个大概的轮廓和发展脉络,就要比严格的精确性要重要得多。
- 相关而非因果。因为无法控制无关因素,所以只能得到相关结论,而非因果。
4.python输入输出编程练习
print('大富翁游戏开始!')
name1=input('请输入玩家1的名字:')
name2=input('请输入玩家2的名字:')
name3=input('请输入玩家3的名字:')
print('{}运气与谋略加成,如日中天,成为国内的房地产产业第一巨头。\n{}家道中落,投资失败,终日靠救济金过活。\n{}早年投资几套热门地段房产,外租别人赚点小钱,过上小康生活。'.format(name1,name2,name3))
具体代码
下面为程序结果截图: