인기 있는 웹 사이트에서는 매일 수백만의 사용자 요구를 수용하기 위해 다수의 서버를 사용하고 있으며 하나의 가상 URL 인터페이스를 이용하여 사용자에게 투명성을 제공하는 방식을 채택하고 있다
따라서 웹 사이트의 확장성을 향상시키기 위한 많은 연구가 이루어지고 있으며 웹 서버 클러스터와 같이 다수의 노드를 가진 시스템이 자주 접근되는 웹 사이트를 만들기 위한 기반 구조가 되고 있다.
웹 서버 클러스터는 다수의 노드로 구성되어 있고 동적인 서비스를 수행해야 하므로 기존의 단일 계층구조와 알고리즘은 효과적이지 못하다. 따라서 본 논문에서는 웹 서버 클러스터를 대상으로 사용자의 응답 시간을 단축시키기 위한 연구를 수행하였다.
특히 사용자 응답시간을 향상시키기 위한 방안으로 메모리 적중률 향상을 위해 메모리 페이지 교체 알고리즘, Layer-4 부하 분배 알고리즘 등과 함께 잠재적으로 가장 성능이 우수한 Layer-7 방식의 부하 분배 알고리즘을 연구하였다. Layer-7 방식의 부하 분배는 메모리 적중률 향상과 함께 확장성 및 특성화된 노드를 운영할 수 있는 장점이 있다.
본 연구에서는 캐쉬의 적중과 각 서버의 부하 상태를 고려한 내용 기반의 부하 분배 알고리즘을 통해 동적 문서 요구를 수용할 수 있는 방식 을 제안하고 성능을 평가하였다. 연구의 결과를 통해 최근 웹 서버를 선도하는 클러스터 구조에서 효과적인 부하 분배를 통해 성능을 향상시킴으로써 기업에게는 비용 절감을, 사용자에게는 응답시간의 향상을 통한 만족을 이룰 수 있다.
Alternative Abstract
A common approach adopted by popular web sites to handle millions of accesses per day has one virtual URL interface and uses a distributed server architecture that is hidden from the user.
Much effort has been devoted in recent years to improve the scalability of systems supporting web sites. Systems with multiple nodes are the leading architectures to build highly accessed Web sites.
The web is becoming the standard interface for accessing remote services.
There is no doubt that Web clusters will be the basic architecture for Web-based systems.
This paper performs a study on improvement of user response time for web server clusters. Specially, memory page replacement, Layer-4 load distribution and potentially outperforming Layer-7 load distribution has been studied.
The Layer-4 distribution algorithms of web server clusters have widely studied, but they are content information blind. They select the target server when the client establishes the TCP/IP connection. On the contrary,content-based load distribution uses the detailed data found in the application layer to intelligently route user requests among web servers.
This paper proposes an effective content-based load distribution algorithm that considers cache hit and load information of the web servers under the web server clusters.