0
点赞
收藏
分享

微信扫一扫

学习笔记----网站架构的思路(一)


一.分层:

分层是企业应用系统中最常见的一种架构模式, 将系统在横向维度上切分成几个部分每个部分负责一部分相对比较单一的职责, 然后通过上层对下层的依赖和调用组成一个完整的系统。

在大型网站架构中也采用分层结构,将网站软件系统分为应用层、服务层、数据层,便于分工合作开发和维护; 各层之间具有一定的独立性,只要维持调用接口不变,各层可以根据具体问题独立演化发展而不需要其他层必须做出相应调整

分层存在的问题:

    分层架构也有一些挑战, 就是必须合理规划层次边界和接口,

在开发过程中,严格遵循分层架构的约束,

1.禁止跨层次的调用(应用层直接调用数据层)

2.逆向调用(数据层调用服务层,或者服务层调用应用层)。

3. 大的分层结构内部还可以继续分层,如应用层可以再细分为视图层( 美工负责)和业务逻辑层( 工程师负责) ;

4.服务层也可以细分为数据接口层(适配各种输入和输出的数据格式)和逻辑处理层

5.分层架构是逻辑上的,

6.在物理部署上, 三层结构可以部署在同一个物理机器上, 但是随着网站业务的发展,必然需要对已经分层的模块分离部署,即三层结构分别部署在不同的服务器上,使网站拥有更多的计算资源以应对越来越多的用户访问。

7.因此在网站规模还很小的时候就应该采用分层的架构, 这样将来网站做大时才能有更好地应对。

分层架构模式最初的目的

规划软件清晰的逻辑结构便于开发维护,

 分层结构的目标

对网站支持高并发向分布式方向发展至关重要。

二.分割

分层是将软件在横向方面进行切分, 那么分割就是在纵向方面对软件进行切分。

分割的原因:

网站越大, 功能越复杂, 服务和数据处理的种类也越多,

分割的动作是

将这些不同的功能和服务分割开来, 包装成高内聚低藕合的模块单元,

分割的优点:

一方面有助于软件的开发和维护; 另一方面, 便于不同模块的分布式部署, 提高网站的并发处理能力和功能扩展能力。

分割的例子:

大型网站分割的粒度可能会很小。

1.比如在应用层, 将不同业务进行分割, 例如将购物、论坛、搜索、广告分割成不同的应用, 由独立的团队负责,

部署在不同的服务器上;

2.在同一个应用内部, 如果规模庞大业务复杂, 会继续进行分割, 比如购物业务, 可以进一步分割成机票酒店业务、3C 业务,

小商品业务等更细小的粒度。而即使在这个粒度上,还是可以继续分割成首页、搜索列表、商品详情等模块,

这些模块不管在逻辑上还是物理部署上, 都可以是独立的。同样在服务层也可以根据需要将服务分割成合适的模块。

三.分布式

1.分布式的简单解释

1.对于大型网站, 分层和分割的一个主要目的是为了切分后的模块便于分布式部署,即将不同模块部署在不同的服务器上,

通过远程调用协同工作。分布式意味着可以使用更多的计算机完成同样的功能, 计算机越多, CPU 、内存、存储资源也就越多能够处理的并发访问和数据量就越大进而能够为更多的用户提供服务

2.分布式带来的问题:

分布式在解决网站高并发问题的同时也带来了其他问题。

首先, 分布式意味着服务调用必须通过网络, 这可能会对性能造成比较严重的影响;

其次, 服务器越多, 服务器岩机的概率也就越大, 一台服务器省机造成的服务不可用可能会导致很多应用不可访问, 使网站可用性降低;

另外, 数据在分布式的环境中保持数据一致性也非常困难, 分布式事务也难以保证, 这对网站业务正确性和业务流程有可能造成很大影响;

分布式还导致网站依赖、错综复杂, 开发管理维护困难。因此分布式设计要根据具体情况量力而行,切莫为了分布式而分布式。

3.常见的分布式部署方案:

在网站应用中, 常用的分布式方案有以下几种。

          1.分布式应用和服务:

          将分层和分割后的应用和服务模块分布式部署

      优点: 改善网站性能和并发性、加快开发和发布速度、减少数据库连接资源消耗;

                  使不同应用复用共同的服务,便于业务功能扩展。
           

         2.分布式静态资源:

 

           网站的静态资源如, CSS , Logo 图片等资源独立分布式部署,并采用独立的域名, 即人们常说的动静分离

      优点:静态资源分布式部署可以减轻应用服务器的负载压力;

             通过使用独立域名加快浏览器并发加载的速度; 由负责用户体验的团队进行开发维护有利于网站分工合作,使不同技术工种术业有专攻。
           

        3. 分布式数据和存储:

      背景:大型网站需要处理以P 为单位的海量数据单台计算机无法提供如此大的存储空间,这些数据需要分布式存储。除了对传统的关系数据库进行分布式部署外, 为网站应用而生的各种NoSQL 产品几乎都是分布式的。
        分布式计算: 严格说来,应用、服务与实时数据处理都是计算, 网站除了要处理这些在线业务,

      还有很大一部分用户没有直观感受的后台业务要处理, 包括搜索引擎的索引构建、数据仓库的数据分析统计等。这些业务的计算规模非常庞大,目前网站普遍使用Hadoop 及其MapReduce 分布式计算框架进行此类批处理计算,其特点是移动计算而不是移动数据,将计算程序分发到数据所在的位置以加速计算和分布式计算。
此外, 还有可以支持网站线上服务器配置实时更新的分布式配置; 分布式环境下实现并发和协同的分布式锁; 支持云存储的分布式文件系统等。

 

四.集群:

集群的背景:

使用分布式虽然已经将分层和分割后的模块独立部署,但是对于用户访问集中的模块(比如网站的首页) , 还需要将独立部署的服务器集群化

集群的概念

即多台服务器部署相同应用构成一个集群, 通过负载均衡设备共同对外提供服务。

 

集群的优点

因为服务器集群有更多服务器提供相同服务,因此可以提供更好的并发特性

当有更多用户访问的时候,只需要向集群中加入新的机器即可

同时因为一个应用由多台服务器提供当某台服务器发生故障时,负载均衡设备或者系统的失效转移机制会将请求转发到集群中其他服务器上,使服务器故障不影响用户使用

集群的要求

所以在网站应用中, 即使是访问量很小的分布式应用和服务,也至少要部署两台服务器构成一个小的集群,目的就是提高系统的可用性。

 

五.缓存:

1.什么是缓存:

缓存就是将数据存放在距离计算最近的位置以加快处理速度。

缓存是改善软件性能的第一手段,

现代CPU 越来越快的一个重要因素就是使用了更多的缓存,

在复杂的软件设计中, 缓存几乎无处不在。

大型网站架构设计在很多方面都使用了缓存设计。

常见的缓存技术:

             CDN: 即内容分发网络, 部署在距离终端用户最近的网络服务商,

           用户的网络请求总是先到达他的网络服务商那里, 在这里缓存网站的一些静态资源(较少变化的数据) ,

           可以就近以最快速度返回给用户, 如视频网站和门户网站会将用户访问量大的热点内容缓存在CDN。

            反向代理: 反向代理属于网站前端架构的一部分,部署在网站的前端, 当用户请求到达网站的数据中心时, 最先访问到的就是反向代理服务器,这里缓存网站的静态资源,无需将请求继续转发给应用服务器就能返回给用户。

             本地缓存: 在应用服务器本地缓存着热点数据, 应用程序可以在本机内存中直接访问数据,而无需访问数据库。

             分布式缓存: 大型网站的数据量非常庞大, 即使只缓存一小部分, 需要的内存空间也不是单机能承受的,

           所以除了本地缓存, 还需要分布式缓存,将数据缓存在一个专门的分布式缓存集群中, 应用程序通过网络通信访问缓存数据。

 

使用缓存有两个前提条件

一是数据访问热点不均衡, 某些数据会被更频繁的访问,这些数据应该放在缓存中;

二是数据在某个时间段内有效,不会很快过期,否则缓存的数据就会因已经失效而产生脏读, 影响结果的正确性。

缓存的作用:

网站应用中,缓存除了可以加快数据访问速度, 还可以减轻后端应用数据存储的负载压力,

这一点对网站数据库架构至关重要, 网站数据库几乎都是按照有缓存的前提进行负载能力设计的。
 

 

举报

相关推荐

0 条评论