Dubbo 整理
整理自官网, 对整体理解 Dubbo 很有作用.
作用
Apache Dubbo 是一款高性能, 轻量级的 Java RPC 框架.
三大核心能力
面向接口的远程方法调用
智能容错和负载均衡
以及服务自动注册和发现
健壮性
监控中心宕掉不影响使用, 只是丢失部分采样数据.
数据库宕掉后, 注册中心仍能通过缓存提供服务列表查询, 但不能注册新服务.
注册中心对等集群, 任意一台宕掉后, 将自动切换到另一台.
注册中心全部宕掉后, 服务提供者 和 服务消费者 仍能通过本地缓存通讯
.
服务提供者无状态, 任意一台宕掉后, 不影响使用.
服务提供者全部宕掉后, 服务消费者应用将无法使用, 并 无限次重连等待服务提供者恢复
.
伸缩性
注册中心为对等集群, 可动态增加机器部署实例, 所有客户端将自动发现新的注册中心.
服务提供者无状态, 可动态增加机器部署实例, 注册中心将推送新的服务提供者信息给消费者.
协议
Dubbo 协议
采用 NIO 复用单一长连接, 并使用线程池并发处理请求, 减少握手和加大并发效率, 性能较好
(推荐使用)
在大文件传输时, 单一连接会成为瓶颈
可用于生产环境Rmi 协议
可与原生 RMI 互操作, 基于 TCP 协议
偶尔会连接失败, 需重建 Stub 可用于生产环境Hessian 协议
可与原生 Hessian 互操作, 基于 HTTP 协议
需 hessian.jar 支持, http 短连接的开销大 可用于生产环境
nio 框架
Netty Transporter
JBoss 的 NIO 框架, 性能较好 (推荐使用)
一次请求派发两种事件, 需屏蔽无用事件.Mina Transporter
老牌 NIO 框架, 稳定
待发送消息队列派发不及时, 大压力下, 会出现 FullGC.
序列化
Hessian Serialization
Stable 性能较好, 多语言支持 (推荐使用)
Hessian 的各版本兼容性不好, 可能和应用使用的 Hessian 冲突, Dubbo 内嵌了 hessian3.2.1 的源码
可用于生产环境Dubbo Serialization
Tested
通过不传送 POJO 的类元信息, 在大量 POJO 传输时, 性能较好
当参数对象增加字段时, 需外部文件声明 试用Json Serialization
纯文本, 可跨语言解析, 缺省采用 FastJson 解析
性能较差 试用Java Serialization
Java 原生支持 性能较差
可用于生产环境
生成代理类
Javassist ProxyFactory
通过字节码生成代替反射, 性能比较好 (推荐使用)
依赖于 javassist.jar 包, 占用 JVM 的 Perm 内存, Perm 可能要设大一些: java -XX:PermSize=128m
可用于生产环境Jdk ProxyFactory
JDK 原生支持 性能较差 可用于生产环境
容错机制
Failover Cluster
失败自动切换, 当出现失败, 重试其它服务器, 通常用于读操作 (推荐使用)
重试会带来更长延迟Failfast Cluster
快速失败, 只发起一次调用, 失败立即报错, 通常用于非幂等性的写操作 如果有机器正在重启, 可能会出现调用失败 可用于生产环境Failsafe Cluster
失败安全, 出现异常时, 直接忽略, 通常用于写入审计日志等操作
调用信息丢失
可用于生产环境 MonitorFailback Cluster
失败自动恢复, 后台记录失败请求, 定时重发, 通常用于消息通知操作
不可靠, 重启丢失
可用于生产环境 RegistryForking Cluster
并行调用多个服务器, 只要一个成功即返回, 通常用于实时性要求较高的读操作
需要浪费更多服务资源
可用于生产环境Broadcast Cluster
广播调用所有提供者, 逐个调用, 任意一台报错则报错, 通常用于更新提供方本地状态
速度慢, 任意一台报错则报错
可用于生产环境
负载均衡算法
Random LoadBalance
随机, 按权重设置随机概率 (推荐使用)
在一个截面上碰撞的概率高, 重试时, 可能出现瞬间压力不均RoundRobin LoadBalance
轮询, 按公约后的权重设置轮询比率
存在慢的机器累积请求问题, 极端情况可能产生雪崩LeastActive LoadBalance
最少活跃调用数, 相同活跃数的随机, 活跃数指调用前后计数差, 使慢的机器收到更少请求
不支持权重, 在容量规划时, 不能通过权重把压力导向一台机器压测容量ConsistentHash LoadBalance
一致性 Hash, 相同参数的请求总是发到同一提供者, 当某一台提供者挂时, 原本发往该提供者的请求, 基于虚拟节点, 平摊到其它提供者, 不会引起剧烈变动
压力分摊不均
线程模型
IO 线程自行处理:
如果事件处理的逻辑能迅速完成, 并且不会发起新的 IO 请求, 比如只是在内存中记个标识, 则直接在 IO 线程上处理更快, 因为减少了线程池调度.
派发到线程池处理:
但如果事件处理逻辑较慢, 或者需要发起新的 IO 请求, 比如需要查询数据库, 则必须派发到线程池, 否则 IO 线程阻塞, 将导致不能接收其它请求.
如果用 IO 线程处理事件, 又在事件处理过程中发起新的 IO 请求, 比如在连接事件中发起登录请求, 会报 “可能引发死锁” 异常, 但不会真死锁.
分层
业务层: Service
RPC 层: Config, Proxy, Registry, Cluster, Monitor, Protocol
Remote 层: Exchange, Transport, Serialize
Service:
业务层. 包括业务代码的接口与实现.config 配置层:
对外配置接口, 以 ServiceConfig(暴露的服务配置), ReferenceConfig(引用的服务配置) 为中心, 可以直接初始化配置类, 也可以通过 spring 解析配置生成配置类. 该层管理整个 dubbo 的配置.proxy 服务代理层:
服务代理层. 在 Dubbo 中, 无论 服务提供者 还是 服务消费者, 框架都会生成一个代理类, 整个过程对上层透明.
当调用一个远程接口时, 看起来就像调用一个本地接口一样.
代理层会自动做远程调用并返回结果, 即让业务层对远程调用完全无感知.
服务接口透明代理, 生成服务的客户端 Stub 和服务器端 Skeleton, 以 ServiceProxy 为中心, 扩展接口为 ProxyFactoryregistry 注册中心层:
负责 Dubbo 框架的服务注册与发现. 当有新的服务加入或旧服务下线时, 注册中心都会感知并通知给所有订阅方. 以服务 URL 为中心, 扩展接口为 RegistryFactory, Registry, RegistryServicecluster 路由层:
封装多个提供者的路由及负载均衡, 并桥接注册中心, 以 Invoker 为中心, 扩展接口为 Cluster, Directory, Router, LoadBalance.
该层主要负责:
远程调用失败时的容错策略 (如失败重试, 快速失败);
选择具体调用节点时的负载均衡策略 (如随机, 一致性 Hash 等);
特殊调用路径的路由策略 (如某个消费者只会调用某个 IP 的生产者)monitor 监控层:
RPC 调用次数和调用时间监控, 以 Statistics 为中心, 扩展接口为 MonitorFactory, Monitor, MonitorServiceprotocol 远程调用层:
封装 RPC 调用具体过程., 以 Invocation, Result 为中心, 扩展接口为 Protocol, Invoker, Exporter.
是服务域, 它是 Invoker 暴露和引用的主功能入口, 它负责 Invoker 的生命周期管理.
Protocol 是核心层, 也就是只要有 Protocol + Invoker + Exporter 就可以完成非透明的 RPC 调用, 然后在 Invoker 的主过程上 Filter 拦截点.
Invoker 是 Dubbo 的核心模型, 框架中所有其他模型都向它靠拢, 或者转换成它, 它代表一个 可执行体.
允许向它发起 invoke 调用, 它可能是执行一个本地的接口实现, 也可能是一个远程的实现, 还可能是一个集群实现.exchange 信息交换层:
建立 Request-Response 模型, 封装请求响应模式, 同步转异步, 以 Request, Response 为中心, 扩展接口为 Exchanger, ExchangeChannel, ExchangeClient, ExchangeServertransport 网络传输层:
抽象 mina 和 netty 为统一接口, 以 Message 为中心, 扩展接口为 Channel, Transporter, Client, Server, Codecserialize 数据序列化层:
若数据要通过网络进行发送, 则需要先做序列化, 变成二进制流.
序列化层负责管理整个框架网络传输时的 序列化 / 反序列化 工作.
可复用的一些工具, 扩展接口为 Serialization, ObjectInput, ObjectOutput, ThreadPool
分层关系说明
在 RPC 中, Protocol 是核心层, 也就是只要有 Protocol + Invoker + Exporter 就可以完成非透明的 RPC 调用, 然后在 Invoker 的主过程上 Filter 拦截点.
Consumer 和 Provider 是抽象概念, 只是想让看图者更直观的了解哪些类分属于客户端与服务器端, 不用 Client 和 Server 的原因是 Dubbo 在很多场景下都使用 Provider, Consumer, Registry, Monitor 划分逻辑拓普节点, 保持统一概念.
而 Cluster 是外围概念, 所以 Cluster 的目的是将多个 Invoker 伪装成一个 Invoker, 这样其它人只要关注 Protocol 层 Invoker 即可, 加上 Cluster 或者去掉 Cluster 对其它层都不会造成影响, 因为只有一个提
供者时, 是不需要 Cluster 的.
Proxy 层封装了所有接口的透明化代理, 而在其它层都以 Invoker 为中心, 只有到了暴露给用户使用时, 才用 Proxy 将 Invoker 转成接口, 或将接口实现转成 Invoker, 也就是去掉 Proxy 层 RPC 是可以 Run 的, 只是不那么透明, 不那么看起来像调本地服务一样调远程服务.
而 Remoting 实现是 Dubbo 协议的实现, 如果你选择 RMI 协议, 整个 Remoting 都不会用上, Remoting 内部再划为 Transport 传输层和 Exchange 信息交换层, Transport 层只负责单向消息传输, 是对 Mina, Netty, Grizzly 的抽象, 它也可以扩展 UDP 传输, 而 Exchange 层是在传输层之上封装了 Request-Response 语义.
Registry 和 Monitor 实际上不算一层, 而是一个独立的节点, 只是为了全局概览, 用层的方式画在一起.
包
dubbo-common
公共逻辑模块: 包括 Util 类和通用模型.
serialize 层放在 common 模块中, 以便更大程度复用.dubbo-remoting
远程通讯模块: 相当于 Dubbo 协议的实现, 如果 RPC 用 RMI 协议则不需要使用此包.
transport 层和 exchange 层都放在 remoting 模块中, 为 rpc 调用的通讯基础.Remoting 实现是 Dubbo 协议的实现
, 如果你选择 RMI 协议, 整个 Remoting 都不会用上,Remoting 内部再划为 Transport 传输层和 Exchange 信息交换层
,Transport 层只负责单向消息传输
, 是对 Mina, Netty, Grizzly 的抽象, 它也可以扩展 UDP 传输, 而Exchange 层是在传输层之上封装了 Request-Response 语义
.dubbo-rpc
远程调用模块: 抽象各种协议, 以及动态代理, 只包含一对一的调用, 不关心集群的管理.
protocol 层和 proxy 层都放在 rpc 模块中, 这两层是 rpc 的核心, 在不需要集群也就是只有一个提供者时, 可以只使用这两层完成 rpc 调用.dubbo-cluster
集群模块: 将多个服务提供方伪装为一个提供方, 包括: 负载均衡, 容错, 路由等, 集群的地址列表可以是静态配置的, 也可以是由注册中心下发.dubbo-registry
注册中心模块: 基于注册中心下发地址的集群方式, 以及对各种注册中心的抽象.dubbo-monitor
监控模块: 统计服务调用次数, 调用时间的, 调用链跟踪的服务.dubbo-config
配置模块: 是 Dubbo 对外的 API, 用户通过 Config 使用 Dubbo, 隐藏 Dubbo 所有细节.dubbo-container
容器模块: 是一个 Standlone 的容器, 以简单的 Main 加载 Spring 启动, 因为服务通常不需要 Tomcat/JBoss 等 Web 容器的特性, 没必要用 Web 容器去加载服务.
整体上按照分层结构进行分包, 与分层的不同点在于:
container 为服务容器, 用于部署运行服务, 没有在层中画出.
protocol 层和 proxy 层都放在 rpc 模块中, 这两层是 rpc 的核心, 在不需要集群也就是只有一个提供者时, 可以只使用这两层完成 rpc 调用.
transport 层和 exchange 层都放在 remoting 模块中, 为 rpc 调用的通讯基础.
serialize 层放在 common 模块中, 以便更大程度复用.