1. 我们不禁要问,什么是"服务集群"?什么是"企业级开发"? 既然说了EJB 是为了"服务集群"和"企业级开发",那么,总得说说什么是所谓的"服务集群"和"企业级开发"吧!这个问题事实上挺关键的,由于J2EE 中并没有说明确,也没有详细的指标或者事例告诉广大程序猿什么时候用EJB 什么时候不用。于是大家都产生一些联想,觉得EJB"分布式运算"指得是"负载均衡"提高系统的执行效率。然而,预计非常多人都搞错了,这个"服务群集"和"分布式运算"并没有根本解决执行负载的问题,尤其是针对数据库的应用系统。为什么?我们先把EJB 打回原形给大家来慢慢分析。
2. 把EJB 掰开了揉碎了 我们把EJB 的概念好好的分析一下,看看能发现些什么蛛丝马迹。
3.1 EJB 概念的剖析我们先看一下,EJB 的官方解释:商务软件的核心部分是它的业务逻辑。业务逻辑抽象了整个商务过程的流程,并使用计算机语言将他们实现。……J2EE 对于这个问题的处理方法是将业务逻辑从client软件中抽取出来,封装在一个组件中。这个组件执行在一个独立的server上,client软件通过网络调用组件提供的服务以实现业务逻辑,而client软件的功能单纯到仅仅负责发送调用请求和显示处理结果。在J2EE 中,这个执行在一个独立的server上,并封装了业务逻辑的组件就是EJB(Enterprise JavaBean)组件。这当中我们主要关注这么几点,我们来逐条剖析:剖析1:所谓:"业务逻辑" 我们注意到在EJB 的概念中主要提到的就是"业务逻辑"的封装,而这个业务逻辑究竟是什么?说的那么悬乎,事实上这个所谓的"业务逻辑"我们全然能够理解成执行特定任务的"类"。剖析2:所谓:"将业务逻辑从client软件中抽取出来,封装在组件中……执行在一个服务器上"既然我们知道了"业务逻辑"的概念就是执行特定任务的"类",那么,什么叫"从client软件中抽取出来"?事实上,这个就是把原来放到client的"类",拿出来不放到client了,放到一个组件中,并将这个组件放到一个server上去执行。3.2 把EJB 这个概念变成大白话 变成大白话就是,"把你编写的软件中那些须要执行制定的任务的类,不放到client软件上了,而是给他打成包放到一个server上了"。3.3 发现问题了 无论是用"八股文"说,还是用大白话说这个EJB 概念都提到了一个词--"client软件"。"client软件"?难道EJB 的概念中说的是C/S 软件?是的,没错!EJB 就是将那些"类"放到一个server上,用C/S 形式的软件client对server上的"类"进行调用。快崩溃了吧!EJB 和JSP 有什么关系?EJB 和JSP 有关系,可是关系还真不怎么大,至多是在JSP 的server端调用远端服务上的EJB 类,仅此而已。
4 .1 EJB 的最底层到底是什么 我们揭开了EJB"八股"概念的真谛,那么,再来分析EJB 的底层实现技术,通过底层实现技术来分析EJB 的工作方式。
4.2 EJB 的实现技术EJB 是执行在独立server上的组件,client是通过网络对EJB 对象进行调用的。在Java中,能够实现远程对象调用的技术是RMI,而EJB 技术基础正是RMI。通过RMI 技术,J2EE将EJB 组件创建为远程对象,client就能够通过网络调用EJB 对象了。4.3 看看RMI 是什么东东 在说RMI 之前,须要理解两个名词:对象的序列化分布式计算与RPC名词1:对象的序列化 对象的序列化概念:对象的序列化过程就是将对象状态转换成字节流和从字节流恢复对象。将对象状态转换成字节流之后,能够用java.io 包中的各种字节流类将其保存到文件里,或者通过网络连接将对象数据发送到还有一个主机。上面的说法有点"八股",我们最好还是再用白话解释一下:对象的序列化就是将你程序中实例化的某个类的对象,比方,你自定一个类MyClass,或者不论什么一个类的对象,将它转换成字节数组,也就是说能够放到一个byte 数组中,这时候,你既然已经把一个对象放到了byte数组中,那么你当然就能够随便处置了它了,用得最多的就是把他发送到网络上远程的计算机上了。如图2 11所看到的。
名词2:分布式计算与RPC RPC 并非一个纯粹的Java 概念,由于在Java 诞生之前就已经有了RPC 的这个概念,RPC是"Remote Procedure Call"的缩写,也就是"远程过程调用"。在Java 之前的大多数编程语言,如,Fortran、C、COBOL 等等,都是过程性的语言,而不是面向对象的。所以,这些编程语言非常自然地用过程表示工作,如,函数或子程序,让其在网络上还有一台机器上运行。说白了,就是本地计算机调用远程计算机上的一个函数。如图2 12所看到的。
名词3:二者结合就是RMI RMI 英文全称是"Remote Method Invocation",它的中文名称是"远程方法调用",它就是利用Java 对象序列化的机制实现分布式计算,实现远程类对象的实例化以及调用的方法。说的更清楚些,就是利用对象序列化来实现远程调用,也就是上面两个概念的结合体,利用这种方法来调用远程的类的时候,就不须要编写Socket 程序了,也不须要把对象进行序列化操作,直接调用即可了很方便。远程方法调用是一种计算机之间对象互相调用对方函数,启动对方进程的一种机制,使用这种机制,某一台计算机上的对象在调用另外一台计算机上的方法时,使用的程序语法规则和在本地机上对象间的方法调用的语法规则一样。如图2 13所看到的。
4.4 长处这种机制给分布计算的系统设计、编程都带来了极大的方便。仅仅要依照RMI 规则设计程序,能够不必再过问在RMI 之下的网络细节了,如:TCP 和Socket 等等。随意两台计算机之间的通讯全然由RMI 负责。调用远程计算机上的对象就像本地对象一样方便。RMI 可将完整的对象作为參数和返回值进行传递,而不仅仅是提前定义的数据类型。也就是说,能够将相似Java 哈西表这种复杂类型作为一个參数进行传递。4.5 缺点 假设是较为简单的方法调用,其运行效率或许会比本地运行慢非常多,即使和远程Socket机制的简单数据返回的应用相比,也会慢一些,原因是,其在网络间须要传递的信息不仅仅包括该函数的返回值信息,还会包括该对象序列化后的字节内容。4.6 EJB 是以RMI 为基础的通过RMI 技术,J2EE 将EJB 组件创建为远程对象,EJB 尽管用了RMI 技术,可是却仅仅需要定义远程接口而无需生成他们的实现类,这样就将RMI 技术中的一些细节问题屏蔽了。但无论怎么说,EJB 的基础仍然是RMI,所以,假设你想了解EJB 的原理,仅仅要把RMI的原理搞清楚即可了。你也就弄清楚了什么时候用EJB 什么时候不须要用EJB 了。
5. EJB 中所谓的"服务群集" 既然已经知道了,RMI 是将各种任务与功能的类放到不同的server上,然后通过各个服务器间建立的调用规则实现分布式的运算,也就明确EJB 所谓的"服务群集"的概念。就是将原来在一个计算机上运算的几个类,分别放到其它计算机上去执行,以便分担运行这几个类所须要占用的CPU 和内存资源。同一时候,也能够将不同的软件功能模块放到不同的server上,当须要改动某些功能的时候直接改动这些server上的类即可了,改动以后全部客户端的软件都被改动了。如图2 14所看到的。
6. 这样的部署难道是无懈可击 图2 14所看到的的这个"服务群集"看似"无懈可击",事实上是它这个图没有画完整,我们来把这个图画完整,再来看看有什么问题没有。6.1 瓶颈在数据库端 细致观察之后,发现这样的配置是有瓶颈的,如图2 15所看到的。
我们看看图2 15的结构图,如今假设想实现各个server针对同一个数据库的查询,那么,无论你部署多少个功能server,都须要针对一个数据库server进行查询操作。也就是说,无论你的"计算"有多么"分布"也相同须要从一台server中取得数据。尽管,看起来将各个功能模块分布在不同的server上从而分担了各个主计算机的CPU 资源,然而,真正的瓶颈并不在这里,而是,数据库server那里。数据库server都会很忙的应付各个server的查询及操作请求。因此,通过这个结构图使我们了解到了EJB 根本不能全然解决负载的问题,由于,瓶颈并不在功能模块的所在位置,而是在数据库server这里。6.2 假如分开数据库,数据共享怎么办 有的读者一定会想到以下的这个应用结构,如图2 16所看到的。
就是把每个功能server后面都部署一个数据库,这样不就攻克了上节所说的问题了吗?是的攻克了数据库查询负载的问题,然而又出现了新的问题,就是"数据共享"的问题就又不easy攻克了。6.3 网络面临较大压力,让你的应用慢如老牛我们再向前翻看看如图2 15所看到的的这样的架构中存在两个网络,一个是"A 网"一个是"B网",这两个网络是不同的。"B 网"往往是局域网,一般带宽是10M/100M,速度较快,因此到还好说,然而,"A 网"往往是互联网或者是利用电信网络互联VPN 网或称广域网。"A 网"的特点是带宽一般较窄,如ADSL 的网络唯独512K-2M 的带宽,由于广域网互联的成本较高,所以一般不会有较高的带宽。而在这个网络上恰恰跑的是功能模块和client软件之间交换的数据,而这部分数据恰恰优势很占用带宽的。因此,这个应用架构其执行速度能够想见是多么的慢了。说句不夸张的话,有点想老牛拉破车一样的慢。一个如老牛的系统:眼下在中国互联网做运营商网络管理系统的一个大公司,它的一个早期的网管软件就是採用了这样的架构来做的C/S 结构的应用系统。有一次,我作为评估者来对其应用系统进行评估,将其部署到一个非运营商大型的网络中的时候,便出现了我们上述描写叙述的情况,速度已经到了难以忍受的地步,打开一个流量图,有时候须要用15分钟的时间才干呈现完整。然而,该系统在开发阶段并没有发现这个问题,为什么呢?由于,他们没有考虑到应用的实际用户连接网络的复杂性,从而给该公司造成较大损失,以至于,这个开发架构被终于遗弃。
7. EJB 活学活用,J2EE 不是必须使用EJB 通过上面小节的解说似乎好像EJB 和开发Web 应用的B/S 结构的系统关系并不大,事实上倒也不然。我们假设把"client程序"理解成某一台server,这样也是能够被应用的,并且,假设是server互相之间做EJB 的调用的话,也就不存在广域网带宽限制的问题了。可是,例如以下情况尽量就不要使用EJB 了:1、较为简单的纯Web 应用开发,不须要用EJB。2、须要与其它服务程序配合使用的应用,但调用或返回的自己定义的网络协议能够解决的应用程序,不须要使用EJB。3、较多人并发訪问的C/S 结构的应用程序,尽量不要使用EJB。
总结:
a.EJB实现原理: 就是把原来放到client实现的代码放到server端,并依靠RMI进行通信。
b.RMI实现原理 :就是通过Java对象可序列化机制实现分布计算。
c.server集群: 就是通过RMI的通信,连接不同功能模块的server,以实现一个完整的功能。