Arquitectura de Google
Fa uns dies he hagut d’investigar diverses arquitectures de serveis webs distribuits. Avui vull començar una sèrie d’articles sobre el tema. Començarem doncs parlant de l’arquitectura de google.
Arquitectura d’accés al servei per part dels usuaris
Quan un usuari fa una cerca a google, primer de tot es fa una traducció a nivell de DNS per arribar fins a una màquina que pugui servir la petició. Igualment es selecciona el clúster més proper geogràficament i es té en compte la càrrega de cada clúster amb un sistema que balanceja la càrrega.
Google està organitzat en clústers que serveixen les peticions de cerques dels usuaris, els clústers involucren milers de màquines.
Gestió del contingut i indexació
Un clúster de google està format per un o més servidor web capaç de resoldre peticions i un conjunt de servidors d’indexació i de servidors que contenen la informació dels documents.
Google ha creat un Google File System propi que permet emagatzemar els fitxers de forma segura i distribuïda. S’utilitza també l’algorisme de MapReduce per aconseguir tractar fitxers molt extensos amb contingut molt gran amb temps de resposta raonables i implicant també un nombre raonable de màquines.
Escalabilitat i dimensió del servei
Links interessants sobre el tema:
Luiz André Barroso,Jeffrey Dean,Urs Hölzle, The google cluster architecture
http://highscalability.com/google-architecture
Prof. Paul A. Strassmann, George Mason University, Google:A Model for the Systems Architecture of the Future














Hola,
D’algo servirà les tardes de dissabte investigant i descobrint arquitectures per Internet…