天天看点

某市某区市级教育云建设项目可行性研究报告

作者:FRI55O3336776

某市某区市级教育云

建设项目

可行性研究报告

(获取完整版文档请添加关注并私信沟通!)

目录

第一章、 项目概况 1

1、 项目名称 1

2、 项目建设单位 1

3、 可行性研究报告编制单位 1

4、 可行性研究报告编制依据 1

5、 项目建设目标、规模、内容、建设期 2

5.1. 项目建设目标 2

5.2. 项目建设内容 3

5.3. 项目建设期 3

6、 项目总投资及资金来源 3

7、 经济与社会效益 3

8、 相对项目建议书批复的调整情况 4

9、 主要结论与建议 4

第二章、 项目建设单位概况 4

1、 项目建设单位与职能 4

2、 项目实施机构与职责 4

第三章、 需求分析 4

1、 项目建设的必要性 4

1.1. 某市信息化建设发展现状 6

1.2. 某市教育云建设目标 10

2、 建设原则和策略 11

3、 总体目标与分期目标 12

4、 总体建设任务与分期建设内容 13

5、 总体设计方案 13

第四章、 本期项目建设方案 13

1、 建设目标、规模与内容 13

2、 规范建设内容 15

3、 云平台技术建设方案 15

3.1. 总体设计 15

3.2. 兼容性和开放性 18

3.3. 系统高可靠和高可用性方案 19

3.4. 计算虚拟化 20

3.5. 存储方案设计 22

3.6. 云平台扩展 26

3.7. 弹性伸缩 26

3.8. 运维运营管理 26

3.9. 云平台安全 32

3.10. 技术支持服务 33

4、 云安全技术建设方案 33

4.1. 现有安全业务框架 33

4.2. 安全业务调整框架 34

4.3. 建设方案参照标准 35

5、 教育基础数据中心建设方案 36

5.1数据标准体系建设方案 37

5.2数据采集交换建设方案 38

5.3基础数据管理建设方案 51

5.4数据共享服务建设方案 53

5.5数据安全体系建设方案 57

第五章、 项目招标方案 58

1、 招标范围 58

2、 招标方式 58

3、 招标组织形式 58

第六章、 环保、消防、职业安全和卫生 59

1、 环境影响分析 59

2、 环保措施及方案 59

3、 消防措施 60

4、 职业安全和卫生措施 60

第七章、 节能分析 61

1、 用能标准及节能设计规范 61

2、 项目能源消耗种类和数量分析 62

3、 项目所在地能源供应状况分析 62

4、 能耗指标 62

5、 节能措施和节能效果分析等内容 62

第八章、 项目组织机构和人员培训 62

1、 领导和管理机构 63

2、 项目实施机构 63

3、 运行维护机构 63

4、 技术力量和人员配置 63

5、 人员培训方案 63

第九章、 项目实施进度和组织安排 66

1、 项目建设周期 66

2、 实施进度计划 66

1、 责任人和组织保障 66

第十章、 投资估算和资金来源 67

1、 投资估算的有关说明 67

2、 项目总投资估算 67

3、 资金来源与落实情况 67

4、 项目运行维护经费估算 67

第十一章、 效益与评价指标分析 69

1、 经济效益分析 69

2、 社会效益分析 70

3、 项目评价指标分析 70

第十二章、 项目风险及风险管理 70

1、 项目实施的外部风险及控制措施 70

2、 项目实施的内部风险及控制措施 71

第十三章、 附件总投资估算 73

第一章、项目概况

1、项目名称

2、项目建设单位

3、可行性研究报告编制单位

4、可行性研究报告编制依据

5、项目建设目标、规模、内容、建设期

5.1项目建设目标

充分运用云计算、大数据等先进理念和技术,按照“集约高效、共享开放、安全可靠、按需服务”的原则,以“云网合一、云数联动”为构架,建成某市教育云平台,实现某市各学校基础设施共建共用、信息系统整体部署、数据资源汇聚共享、业务应用有效协同,开展大数据开发利用。

通过某市教育云平台的建设,为B区各学校提供安全可靠的计算、存储、应用资源平台。落实关键信息基础设施和网络安全等级保护工作,加强网络安全管理和技术防范,实现同步规划、同步建设、同步运行,做到领导到位、机构到位、人员到位、责任到位、措施到位。结合B区信息中心已有安全设备进行补充替换提高安全防范能力。

在有效降低重复建设投资、节能环保的基础上,提高基础设施资源的利用率,实现B区教育信息化基础设施资源的统一规划、统一建设、按需调配、即需即用、有效共享。通过合理规划、小步快跑的方式,在实现建设集约化、信息共享化、服务标准化、效益最大化的同时,满足B区各学校IT基础设施的应用需求,为B区教育未来大数据产业奠定基础。

按照建设规划,原有信息中心已经部署的各项应用系统将按计划分批次分别迁移到云平台上;云平台在建设规模上也不是一次到位,而是根据需要规划相对应的容量,后期将根据规划和业务发展需要进行相应平台横向扩容。因此,平台的云自动化部署能力将降低平台扩容的技术难度和复杂度,自动实现云平台的平滑扩展。对于一些常用的标准应用,应当在云平台管理界面通过点击,实现应用的轻松部署,减少平时运维工作量。迁移软件后,空余设备将进行利旧处理加强云平台计算、存储、管理等各项处理能力。

5.2项目建设内容

全栈云基于开放架构的云服务框架,提供面向一云(云基础设施)、一湖(数据湖)、一平台(应用平台)的9类40+个服务。支持与公有云平台混合,实现业务无缝的跨云部署与迁移,为某市教育云业务向混合云演进提供支撑!

  • 通过计算服务支撑学校智慧校园建设和区级应用平台部署需求;
  • 安全服务和灾备服务可提供云主机信息安全能力。
  • 大数据服务、PaaS、数据库服务等应用支撑平台可满足其它信息化推进需求。
  • 信息中心安全保障能力。
  • 云平台自动化部署能力。
  • 云平台服务监控及报警。
  • 云管理平台服务能力。

5.3 项目建设期

6、项目总投资及资金来源

7、经济与社会效益

随着新技术的发展,教育信息化的发展将进入一个全面发展的时期。教育信息化建设的顶层设计正在逐步推进,建设方式从单一的独立系统建设转向统一的基础平台建设,基于云技术的整体技术架构成为主流。构建智能的教育信息化云服务平台不仅是满足规划的要求,同时也是建设智慧城市,积极推进智慧教育文化体系建设,推动智慧教育事业发展的需要。

8、相对项目建议书批复的调整情况

针对某市教育局数据中心建设比较薄弱的现状,增补,升级和改造教育局核心机房的建设工作,为B区各系统平台提供安全可靠的云平台基础环境和数据资源交换中心。

9、主要结论与建议

本报告以现状分析为基础,确定了项目的范围及目标,并提出了项目的方案,同时对项目实施过程中的难点进行了充分的分析并提出了解决方案。

综上所述,从管理、技术、经济、时间等方面论证,某市某区教育云项目是可行的。

第二章、项目建设单位概况

1、项目建设单位与职能

项目建设单位:某市某区教育局

2、项目实施机构与职责

项目实施单位:B区教育局信息中心

第三章、需求分析

1、项目建设的必要性

根据H市教育委员会关于印发《H市教育信息化2.0 行动计划(2018-2022)》,推进H市教育综合改革,助力H市教育现代化建设,深化《H市教育信息化“十三五”规划》。形成教育云平台统一服务引入第三方云计算、云应用和云服务资源,构建服务于各级各类教育单位的教育云平台,形成统一规范管理的教育云服务,并纳入整体安全管控。教育单位、高校、中职学校信息系统逐步上云。创新教育云建设和运行机制,鼓励政府和各级各类教育单位购买服务。教育单位完善网络安全与信息化工作的规章制度,并强化网络安全应急预案等,确保网络安全保障常规化、日常化。

某市教育信息网自2002年建设以来,经过多次扩容和升级,目前共接入了约320多家教育单位,接入带宽为千兆,全区出口带宽达到2G。中心机房接入两路市电供电加UPS,保证7*24小时不间断供电,两路UPS设计排除单点故障,强化安保与监控,无人值守时故障发生报警;配备了网络出口和数据中心防火墙、上网行为管理、入侵防御系统、网站应用防火墙等设备。根据网安部门最新实施的等保2.0方案进行部分老旧设备替换以及功能模块更新。

某市教育信息化建设在十二五期间取得了较大的发展和成绩,但在基础硬件资源服务、教学资源建设,教学应用发展等各方面同H市的相关规划要求还有一定差距,特别在覆盖全区教育信息化应用的教学资源平台和教学管理服务平台建设上仍处于起步阶段。信息中心的服务器存储等硬件资源仅为满足区教育相关网站等发布进行部署,远远无法满足对全区提供平台应用要求,尤其在B区着力推进智慧教育建设的前提下,更需建设可灵活调配的服务器和存储资源。各学校各自开发的应用分散部署在各校内服务器设备上,机房环境等较简陋,更缺乏统一的数据标准,安全管理和维护管理。从基本设施和技术力量等各方面考察,信息安全根本无法得到保障。

在十三五新一轮建设发展来临之际,面对某市教育信息化进一步发展,大量的全区教学资源、教学应用等需要进行落实部署运行,深入日常教学活动的应用数据将不断产生,未来教育业务快速扩展将给原有某市教育传统IT基础架构带来巨大挑战。

具体而言存在如下问题:

  • 资源利用率低:分散的硬件资源无法统一规划调度,最普遍的现象就是忙的设备不堪重负,闲的设备资源储备过多,二者相互之间又无法借用和共用。目前底层硬件资源建设是以功能单元为中心进行建设的,并不考虑上层业务对底层资源调用的优化,这使得资金投入无法取得等价的业务应用效果,反而浪费了更多配套资源和维护成本。
  • 数据无法整合:各学校系统应用所产生的数据分散在各处,缺乏统一的规范标准,难以进行数据收集整合。无法形成统一全面的教学数据资源库,更无从通过大数据分析进一步挖掘数据价值。
  • 维护管理困难:全区和学校的应用部署在分散的各自服务器存储上,缺乏统一的规划、维护和保障。学校的机房环境、网络环境、人员管理等多方面无法满足设备日常运行维护要求。不同时期按不同初衷建设的各种硬件设备堆砌,既给各学校带来繁重的维护压力,又容易出现漏洞和差错。
  • 信息安全无法保障:分散的应用数据部署,无法从整个系统角度制订统一完备的安全策略,比如防攻击策略、数据备份策略、高可用策略等等,极易在某一点、某一时刻产生信息安全漏洞造成整体的危害事件。结合某市教育现有安全硬件设备,进行升级更新。

从以上四个问题可以看出,伴随着某市教育信息化教学资源和应用规模化发展,原有硬件资源、底层支撑软件、运营管理、安全保障等处于零散无序状态。由此产生软件的集成问题、维护管理问题、信息孤岛问题、信息化应用效益问题将成为困扰教育信息化发展的核心问题。建设智慧教育云应用平台成为必然选择。某市教育信息化建设必须从根本上改变传统思路,遵照全新的体系架构,打造教育云IT基础设施。

1.1、某市信息化建设发展现状

B区教育信息网是覆盖B区内三百多所学校的综合计算机网络教学平台。2011年开始,某市教育信息网对MPLS VPN城域网构架进行了升级改造。升级改造后的网络系统以某市教育局信息中心和托管在宝杨路电信机房的核心设备为双核心,核心层设备实现与汇聚层设备互联的冗余备份,同时实现两台核心层设备之间的冗余;以托管在六个电信支局的设备作为汇聚层;以用户设备作为接入层。核心层、汇聚层与核心层之间通过万兆冗余互联,汇聚层与接入层之间均通过千兆互联。

网络链路

目前某市信息化网络系统的出口带宽分三条链路,一路共享教育城域网万兆互联,两路电信提供的各占1G带宽的网络链路,互不影响,即三路带宽只要有一路带宽正常情况下均不影响B区教育系统外网访问。现机房设备统一由信息中心统一管理。另外信息中心当务之急也正在考虑升级网络带宽。

6个汇聚层核心设备放置在电信机房,基本不存在汇聚层设备断电影响级联学校网络。

网络均衡

B区教育网路目前是使用双机主备技术

防火墙

现有三条链路出口均配备了防火墙设备,网络策略均为端口限制,负载均不是很大,故未采用冗余备份。

信息安全

网站应用防火墙设备根据B区日益增长信息能力需求进行考量,并采购新的安全设备并对原先上网行为管理(AC)进行型号升级满足教育内部日益上涨的网络数据压力。后续有相应的预算拟采购相应的硬件。

虚拟化设备出于安全层面考虑需求部署了趋势杀毒产品。

虚拟化服务器除了30T的热备存储外,对重要的核心应用数据仍然采用的异地的备份措施进行备份,保证数据安全。

为了满足教育内部各类人员进行远程访问接入,通过VPN技术手段进行线路加密以及简化部署。

根据安全法以及机房等级保护要求,需要进行各类网络设备、信息系统、应用平台的日志统一留存以及审计。

应用情况

B区教育城域网应用平台建设开发以某市教育网为主线,形成了区干训网、培训网、教研网、德育网、科研网为一体的教师专业发展多元发展策略,覆盖了某市教育局、某市教育学院各职能部门核心业务。

  1. 学校日常信息化支持系统:绩效工资系统、卫生上报、卫生日报、新闻通知
  2. 办公平台:网上阅卷、科研网、教师专业发展管理、教育督导、财务管理
  3. 查询公开类:信息公开、信息发布
  4. 网站门户类:宝教网、职能部门门户网站、各学校门户网站
  5. 其他类:统一身份认证、在线备课、在线教学、在线测评、资源中心、资源采集、教师空间、区及应用集群

某市教育城域网系统及现有主要设备清单:

序列 类别 数量 品牌/型号 采购时间 备注
1 服务器 5台 IBM3850 2014年 包括PC服务器
2 交换机设备 1台 思科N7K 2017年 路由交换设备
3台 思科3650 2010年
3 网络安全设备 4台 网站应用防火墙 2016年 网络安全设备
防火墙 2013年
入侵防御系统 2010年
上网行为管理 2013年

现有网络架构

某市某区市级教育云建设项目可行性研究报告

【图】现有网络架构拓扑图

现有数据中心仅承载某市教育公用业务系统,就已经子系统众多,运维管理工作量巨大,基础设施设备类型复杂,机房运维管理涉及的专业子系统众多,运维人员需要在各个子系统的界面上分别进行管控操作,对与运维工作人员操作不方便而且各个子系统之间孤立运行无法进行关联,造成运维人员工作负担重,且加大了运维成本,故障人为因素占比高。

后续将学校信息化系统逐步上收至教育局信息中心,在现有的架构下会带来更好的建设和减小运维压力。

服务器与存储

5余台机架式服务器(较老应用,准备替换),品牌为IBM,还存在部分dell的文件柜,服务器区部署了框式防火墙、IPS、行为审计等安全设备。

5台虚拟主机、配置分别为130G内存,32个cpu,包括一个30T的存储,实现双机20T的热备。目前核心应用服务器数量为30余台,位于该虚拟化服务器上。

1.2、某市教育云建设目标

2018首期项目的建设目标是完成基础设备(如服务器、存储设备、网络设备等)以及虚拟化云平台系统的采购及部署,建设某市智慧教育云管理平台,按目前规划整体云平台性能如下:

计算资源:新增10台服务器,单台2颗CPU,每颗12核。原有计算资源20颗CPU,每颗8核,预计可以提供物理共计10*2*12+20*8=400核CPU计算能力,可支持超售比例1:3,虚拟CPU共计400核*3=1200核。单台配置256G,共计2.5T内存。原有内存单台128G,共计5台。预计可以提供3.14T内存

存储资源:新增10台存储服务器,单台约35T存储空间,共计350T存储空间,原有EMC存储单台30T,共2台、预计可以提供410T存储。

教育云管理平台建设后,除了将现有应用平移到教育云后,2019年将要上线的平台:教育局预算项目库、教育局资产管理系统、教育局校舍工程管理平台、网络信息安全保障服务平台、校校通平台、某市教育学院智能在线教学系统建设服务平台、教育基础性教育资源平台、B区学校心理健康教育发展中心视频交互系统、“智校”综合管理信息系统、问题化学习支持与服务环境平台、基于物联网技术的智慧校园大平台、观澜书院平台、H市农场学校教育直播系统。

整体云平台资源使用情况表:

项目分类 系统名称 CPU核数 内存(G) 集中存储(T) 分布式存储(T)
现有应用 统一身份认证 30 80 5
在线备课 30 80 10
在线教学 36 92 5
在线测评 14 40 5
资源中心 60 148 10
资源采集 30 80 5
教师空间 30 80 60
网站集群 60 140 10
区及应用集群 46 112 5
财务管理 24 68 5
2019年将上线的应用 云管理软件 16 52 1
教育基础数据中心 30 80 40
教育局预算项目库 40 100 30
教育局资产管理系统 40 100 15
教育局校舍工程管理平台 32 84 10
网络信息安全保障服务平台 32 84 10
校校通平台 40 100 5
某市教育学院智能在线教学系统建设服务平台 38 96 10
教育基础性教育资源平台 40 100 7
B区学校心理健康教育发展中心视频交互系统 32 84 10
“智校”综合管理信息系统 20 50 8
问题化学习支持与服务环境平台 32 88 10
基于物联网技术的智慧校园大平台 24 60 8
观澜书院平台 32 88 8
H市农场学校教育直播系统 32 88 8
2020年将上线的应用 2019年教育云上线后,预计申报2020年的应用项目会比历年增加30%,因此预留约30%的资源给到2020年项目 360 966 110
合计 1200 3140 60 350

2、建设原则和策略

高起点规划、高强度投入、高标准建设、高效率管理

3、总体目标与分期目标

1)总体目标

通过某市教育云平台的建设,为B区各学校提供安全可靠的资源平台。

在有效降低重复建设投资、节能环保的基础上,提高基础设施资源的利用率,实现B区教育信息化基础设施资源的统一规划、统一建设、按需调配、即需即用、有效共享。通过合理规划、小步快跑的方式,在实现建设集约化、信息共享化、服务标准化、效益最大化的同时,满足B区各学校IT基础设施的应用需求,为B区教育未来大数据产业奠定基础。

2018首期项目的建设目标是完成基础设备(如服务器、存储设备、网络设备等)以及虚拟化云平台系统的采购及部署,建设某市智慧教育云管理平台,按目前规划整体云平台性能如下:

计算资源:新增10台服务器,单台2颗CPU,每颗12核。原有计算资源20颗CPU,每颗8核,预计可以提供物理共计10*2*12+20*8=400核CPU计算能力。单台配置256G,共计2.5T内存。原有内存单台128G,共计5台。预计可以提供3,14T内存。(根据内存数量以及CPU计算能力以单台虚拟机4核16G计算可提供约200台虚拟机。CPU计算能力可进行复用,估算复用比为1:2)

存储资源:新增10台存储服务器,单台约35T存储空间,共计350T存储空间,原有EMC存储单台30T,共2台、预计可以提供410T存储。

教育云管理平台建设后,将承载现有平台:区统一身份认证、在线备课、在线教学、在线评测、资源中心、资源采集、网站集群、区及应用集群、财务管理平台,等。以及2019年将要上线的平台:教育局预算项目库、教育局资产管理系统、教育局校舍工程管理平台、网络信息安全保障服务平台、校校通平台、某市教育学院智能在线教学系统建设服务平台、教育基础性教育资源平台、B区学校心理健康教育发展中心视频交互系统、“智校”综合管理信息系统、问题化学习支持与服务环境平台、基于物联网技术的智慧校园大平台、观澜书院平台、H市农场学校教育直播系统。

2)分期目标

2018.10-2018.11:优化方案、招投标

2018.11-2018.12:项目启动、实施规划

2019.1-2019.5:项目建设

2019.5-2019.6:项目试运行、培训工作、竣工验收

4、总体建设任务与分期建设内容

本项目预计建设期于2018年12月始至2019年6月止。项目实施过程主要包括项目可研报告的审批、工程方案的设计及审批、设备的购置、安装和调试、培训、试运行及项目验收等等。

5、总体设计方案

本项目涉及范围为:某市某区教育云建设。

本项目建设的系统为: 云平台技术建设、云平台存储建设、数据中心安全建设、数据标准体系建设、元数据管理建设、数据采集交换建设、基础数据管理建设、数据共享服务建设、数据安全体系建设。

第四章、本期项目建设方案

1、建设目标、规模与内容

建设目标

充分运用云计算、大数据等先进理念和技术,按照“集约高效、共享开放、安全可靠、按需服务”的原则,以“云网合一、云数联动”为构架,建成某市教育云平台,实现某市各学校基础设施共建共用、信息系统整体部署、数据资源汇聚共享、业务应用有效协同,开展大数据开发利用。

通过某市教育云平台的建设,为B区各学校提供安全可靠的资源平台。

在有效降低重复建设投资、节能环保的基础上,提高基础设施资源的利用率,实现某市教育信息化基础设施资源的统一规划、统一建设、按需调配、即需即用、有效共享。通过合理规划、小步快跑的方式,在实现建设集约化、信息共享化、服务标准化、效益最大化的同时,满足B区各学校IT基础设施的应用需求,为B区教育未来大数据产业奠定基础。

建设内容

全栈云基于开放架构的云服务框架,提供面向一云(云基础设施)、一湖(数据湖)、一平台(应用平台)的9类40+个服务。支持与公有云平台混合,实现业务无缝的跨云部署与迁移,为某市教育云业务向混合云演进提供支撑!

某市某区市级教育云建设项目可行性研究报告

图一 服务建设内容

  • 通过计算服务支撑学校智慧校园建设和区级应用平台部署需求;
  • 安全服务和灾备服务可提供云主机信息安全能力。
  • 大数据服务、PaaS、数据库服务等应用支撑平台可满足其它信息化推进需求。

2、规范建设内容

云平台技术建设、云平台存储建设、数据标准体系建设、元数据管理建设、数据采集交换建设、基础数据管理建设、数据共享服务建设、数据安全体系建设。

3、云平台技术建设方案

  • 总体设计

整个系统从功能角度可以划分为三大系统:

  1. 云服务系统(IAAS)
  2. 云资源系统(云管理平台)
  3. 云应用系统

解决方案可以覆盖以上三大系统,可以满足对于云平台的各种功能需求。

除了以上各种功能需求以外,项目的难点如下所示,方案可以解决这些难点,升级成为大规模云平台。

云平台扩展性(单集群至少支持200~500台节点);

高可用;

采用OpenStack商业化稳定发行版本OpenStack 9.0,其中主要包含以下几种服务器节点:

  • 自动化部署节点服务器,Fuel安装部署节点负责整个OpenStack云平台及第三方组件的安装部署和生命周期管理,占用一台物理服务器;
  • 控制节点服务器,控制节点是OpenStack云平台的控制器,采用3节点的HA部署架构,采用3个控制节点服务器中部署MySQL,RabbitMQ,Nova,Neutron,Cinder,Ceph Monitor等服务,同时控制节点也承担Neutron L3的功能;
  • 计算节点服务器,采用10个计算节点服务器部署Nova-Compute服务,采用KVM作为虚拟化方案;
  • 存储节点服务器,采用10个存储节点服务器部署Ceph OSD服务,可通过添加SAS和SSD盘构建不同性能的存储池为虚拟机提供块存储。默认推荐客户使用专用的存储节点。但是如果客户需要存储节点与计算节点的融合式部署方案,也能完全支持。
  • 监控节点服务器,采用1个监控节点部署基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。用来监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。网络架构物理网络架构
某市某区市级教育云建设项目可行性研究报告

图二 物理网络架构

实现物理链路的冗余:

  • 业务网络链路采用冗余链路,物理服务器采用双网口绑定连接。 默认支持图形化配置Active-Backup,Round-Robin,LACP三种协议的网卡绑定方式;
  • 业务网络物理交换机需要支持堆叠功能;
  • 拥有5种不同类型的逻辑网络,每种不同的逻辑网络承载着不同的流量:
  • Administrative/PXE网络,用于物理节点的管理和操作系统自动安装;
  • Public/Floating网络,云平台提供外部访问的地址段;
  • Management网络,用于OpenStack各组件之间的通信;
  • Private网络,虚拟机通信,虚拟机与L3组件通信的网络;
  • Storage网络,存储网络用于Ceph各节点之间的数据同步与数据复制;
  • 通过Fuel用户可以灵活的将逻辑网络与物理网络进行映射。多数据中心

多套openstack共享一个keystone和horizon。每个区域一套openstack环境,可以分布在不同的地理位置,只要网络可达就行。多region可以提供环境隔离的功能,选择启虚拟机的时候可以根据自己所处的位置就近选择。

为了进一步实现多中心资源调度,OpenStack支持与主流的智能运维平台通过调用标准OpenStack API等方式实现集成。

  • 存储方案

采用Ceph作为Glance镜像,Nova虚拟机,Cinder卷的统一存储后端,提供高效的虚拟机存储架构。详情参见存储方案设计章节。

  • 兼容性和开放性云平台开放性

云平台架构方案具有良好的兼容性,云平台计算、存储、网络不依赖任何特定型号品牌的硬件,无任何软件与硬件的绑定。所有功能模块都是开放的API,兼容业界标准设备。云平台可以无缝的和业务系统、监控系统进行集成。云平台本身的监控数据、计量数据和云平台用户管理数据都可以通过标准 Restful API 来调用读取、修改。

本次建设的“云服务系统”,定位为IAAS基础云平台服务,采用商用版本的Openstack方案,在学校后期的信息化建设过程中,兼容各类第三方paas,saas方案。

  • 产品接口开放性

产品 Fuel 和OpenStack都完全开源。 设计的云平台方案中服务高可用使用到的软件也是开源软件,因此架构设计也是开放的。 依赖开源社区构建自己的产品。

  • 系统高可靠和高可用性方案OpenStack服务高可用

提供了企业级的云平台服务高可用方案。使用服务器做为云集群的控制器部署,各项重要服务均提供高可用方案。保证做物理服务器宕机的情况下依然保障云服务正常运行。

在控制器节点上的每个服务都拥有它自己的高可用机制:

  • Horizon作为一个Web应用,在负载均衡时需要保持会话信息
  • 通过使用镜像队列,RabbitMQ可以提供active/active高可用
  • MySQL的高可用是通过Galera和Pacemaker active/active多主部署
  • nova-api, glance-api, keystone-api, neutron-api and nova-scheduler 是无状态的服务,在负载均衡时,不需要其他设置
  • Ceph监控节点实现了它自己的HA机制。 MySQL高可用

MySQL配合Galera实现了真正的active/active HA。Fuel配置MySQL/Galera 只对外提供一个active节点用于接受写操作和读请求。当集群节点增加时,你可以添加从节点。

  1. 只有一个MySQL/Galera节点被集群当作主节点,集群中其他节点被当作从主。
  2. 从主节点没有典型的MySQL主从模式中从节点的数据延迟因为Galera使用同步复制来保证 每个节点都是数据一致的。
  3. 使用 Pacemaker 和 HAProxy 来管理 MySQL/Galera:
  4. Pacemaker 管理 MySQL+Galera 节点, HAProxy, 和 Virtual IP Address (VIP).
  5. HAProxy运行在专用的网络命名空间管理MySQL客户端到VIP和VIP到MySQL/Galera 活主,备份主的连接。只有 MySQL/Galera 主和 VIP 保持连接。这种单主模式的同步复 制通常比其他模式的性能要好。
  • 计算虚拟化硬件要求

云解决方案对与服务器品牌和型号没有任何限制,只需是 x86 类型并且满足 CPU、内存、网络和磁盘大小要求即可。

  • 硬件虚拟化

支持的虚拟化软件 KVM 和 VMware 的 ESXi 均支持通过利用硬件 CPU 虚拟化 技术提高虚拟机计算性能。

  • 多Hypervisor架构支持

支持多 hypervisor 架构,可以在一个云环境中同时部署多种虚拟化软件。

  • 云主机管理

云平台对云主机管理的 API 操作支持创建、删除、重启、查看、关机、创建快照、迁移、挂载卷、修改配置(CPU、内存、磁盘)等。

  • 云主机配置修改

云平台支持对云主机进行 CPU、内存、磁盘的添加和修改,有标准 API 提供。方便用户使用。

  • 云主机类型管理

云平台支持对云主机类型的创建、删除、修改,可以指定的云主机规格主要有vCPU,内存,磁盘,带宽和云主机为私有或者公有。

  • 云主机操作系统列表

云平台支持的云主机操作系统有 Ubuntu、CentOS、RHEL、Windows Server 2007、Window Server 2008等。

  • 云主机动态调度

虚拟机动态资源调度功能可以通过Ceilometer获取虚拟机好物理节点性能数据,制定相应的告警通知消息,外部程序收到告警信息调用虚拟机迁移即可实现动态资源调度。

虚拟机的容错功能可以在基于共享存储上面,通过监控物理节点,检测到物理节点宕机后触发外部程序调用评估虚拟机API来实现虚拟机迁移保证虚拟机始终处于在线服务状态,解决物理节点宕机导致的虚拟机无法使用问题,以满足企业级用户云主机容错功能需求。

  • 云主机(应用)高可用方案

基于应用架构本身的高可用机制可提供更可控的HA架构,满足不同需求下的高可用架构。

对于无法实现应用层高可用的应用,推荐用户通过Murano Action功能并结合应用监控、虚拟机监控报警系统实现应用的高可用。

Murano应用目录能提供一键部署PaaS平台、数据库、应用环境等功能。Murano Action是Juno版本提供的高级功能,通过Murano Action,可实现应用的自动扩展、高可用等功能。

通过Murano Action定义一个工作流,并在Murano API中发布一个Web Hook API,当监控系统检查到应用系统的故障或物理机故障时,可触发调用Web Hook API执行相应的工作流,比如:

  • 如果应用没有外部依赖,可通过工作流执行nova evacuate命令将故障物理主机的虚拟机在其它健康物理机重启,恢复运行;
  • 如有应用将状态数据放置与外挂的Cinder数据卷中,应用HA的机制也依耐于外挂的数据卷。可通过工作流执行应用程序关闭,关闭虚拟机,卸载数据卷,创建新虚拟机,挂载数据卷,启动应用等一系列操作;在健康的物理机上启动业务并恢复应用运行;
  • 对于更负载的HA需求,Murano Action完全可定制的工作流功能可以最大满足用户的需求。
  • 存储方案设计

云平台设计了符合用户需求的存储解决方案。在云平台上 支持多种类型的存储,包括对象存储、分布式存储、传统 FC SAN 存储。针对于每种类型的存储都有可靠的高可用技术支撑。对于使用的开源分布式存储软件Ceph,承诺提供技术支持服务,保障云平台存储正常使用、扩展、升级。

  • 硬件需求

各类型存储解决方案均无任何存储硬件厂商、硬件产品型号的硬性要求。方案完全是开放的、灵活扩展的避免硬件和厂商锁定。

  • 分布式存储

本次实施Ceph作为分布式存储解决方案。Ceph作为开源的分布式软件,功能丰富,性能稳定。支持块存储、对象存储和文件存储。OpenStack对Ceph的支持也非常稳定、可靠。目前包括 Nova、Glance、Cinder都有相应的驱动或者后端使用Ceph块存 储。OpenStack 镜像服务、虚拟机存储和块设备存储统一使用Ceph存储可以大幅度提高虚拟机快照、 虚拟机启动速度。

通过Ceph实现的块设备云存储可以支持丰富的存储操作,完全兼容OpenStack Cinder服务对云存 储的各种 API,具体包括:创建、删除云存储、云主机挂载、卸载云存储、查询云存储,云存储快照 等。

使用统一Ceph存储,虚拟机镜像、虚拟机快照和新建虚拟机都存储在Ceph的存储池当中。还可以实现创建可以引导启动的云硬盘、云硬盘创建快照、云硬盘快照创建可以挂载的云硬盘以及可以启 动的云主机快照等。

拥有强大的Ceph开发支持团队,在世界范围内拥有多个成功的大型Ceph分布式存储的案例,使用Ceph作为OpenStack的块存储和对象存储是一个通用的解决方案。Ceph针对与OpenStack的统一存储也使云主机管理更加方便快捷。针对客户实施的Ceph分布式存储方案,承诺提供技术支持服务,存储的支持服务属于技术支持服务的一部分。

Ceph的优点

  • 扩展性:可以通过简单增加硬件提供集群整体容量和性能
  • 高可用性:三副本分布在不同的机架上,提高可用性
  • 高性能:性能线性扩展

Ceph的架构设计

  • 存储网络:推荐使用万兆网卡和交换机。
  • 副本数:根据数据持久性的要求选择不同的副本数。
  • OSD的类型:根据对性能的要求选中SSD或者是SATA。
  • RAID卡选型:需要支持Pass-Through模式
  • CRUSH MAP设计:使用新的CRUSH MAP可以提供数据持久性

Ceph的监控

Ceph最重要的是监控与运维,提供完整的Ceph监控报警解决方案,可以尽早发现问题。

Ceph的运维与故障排查

对于Ceph本身和Ceph的支撑系统有非常深刻的了解,而且积累了非常多的Ceph开发、测试、调优、部署、运维等经验。因针对Ceph的日常运维操作、常见故障有标准的处理流程,这可以保证服务可用性和数据可靠性。

Ceph的高可用性

Ceph监控器(Monitor) 管理着Ceph集群元数据。Ceph Monitor使用Paxos算法保证元数据一致性,因此需要保证Ceph监视器的个数为奇数。目前在10 ~ 100 台Ceph Storage节点的情况下,3个Ceph Monitor可以满足要求。

Ceph Monitor和Ceph OSD之间有Heartbeat检测,Ceph OSD之间也有Hearbeat检测。因此当某个Ceph OSD发生故障时,Ceph Monitor可以检测到OSD故障,并更新Ceph集群元数据,并通知所有Client。因为Ceph Storage采用多副本策略,其他Ceph OSD会马上接替该Ceph OSD的工作,保证存储服务的高可用性。

当该Ceph OSD过了一段时间还没恢复正常,Ceph Monitor会触发数据恢复,保证数据的高可靠性。

  • 对象存储

提供两种对象存储方案:

  • Ceph对象存储:Ceph实现了对象存储 Swift 的 API 功能子集。支持绝大部分对象操作。并且可以 和OpenStack项目无缝集成。

Swift 对象存储: Swift对象存储是 Fuel 部署云平台可选的组件之一。Swift是一个成熟的对象存储软件,和OpenStack中的认证管理项目 Keystone 无缝集成,可以提供给云平台用户使用。

对于对象存储的选择和方案设计是根据用户的具体需求确定的,Ceph 提高了对象存储和 分布式块存储功能,可以满足用户的存储要求,如果没有特殊说明指定,会默认使用Ceph的 对象存储作为云平台的一部分。

继续阅读