Grid Computing- komputery

Grid Computing - komputery "klastrowe"
"Grid Computing" jest rozproszonym przetwarzaniem, które wymaga koordynacji i dzielenia się zasobami w geograficznie rozproszonej organizacji. Wykorzystanie "Grid Computing" pozwala zaspokoić zapotrzebowanie na dużą moc obliczeniową w tak zwanym trybie "power on demand". Wyobraźmy sobie organizacje, która ma zapotrzebowanie na dużą mocą obliczeniową i ma infrastrukturę komputerową na całym świecie. Grid Computing pozwala na optymalne wykorzystanie zasobów komputerów np.: z działu księgowego czy kadr czy też rozproszonych ośrodków obliczeniowych, na przetwarzanie danych.

Taką właśnie technologie wykorzystuje firma McLaren do bardzo skomplikowanych obliczeń aerodynamiczności samochodu. Modele te zawierają ponad 10 milionów punktów i ich analiza nawet na wyspecjalizowanym sprzęcie mogłaby zająć tydzień.

104 procesory McLaren'a rozbijają analizę na części i pracując bez przerwy potrafią przedstawić wyniki w czasie od kilku do kilkunastu godzin zależnie od rodzaju analizy. Jednak skrócenie czasu to efekt uboczny większą korzyścią jest możliwość wykonania większej ilości powtórzeń.
Wyróżnia się trzy rodzaje Grid'ów:
- Obliczeniowe
- Przechowujące dane
- Wirtualny superkomputer- Metakomputer- połączenie obu w/w kategorii

Poznańskie Centrum Superkomputerowe Sieciowe (schemat Metakomputera na rysunku)
Poznańskie Centrum Superkomputerowo Sieciowe uczestniczy razem z Trójmiejską Akademicką Sieciowo Komputerową pod kierownictwem Politechniki Częstochowskiej w projekcie Krajowy Klaster Linuksowy Sieć TASK jest typowym przykładem użycia technologii Gridowej wykorzystywanej w nauce, cechuje się dużą ilością aktualnie przeprowadzanych projektów naukowych. Sieć TASK obejmuje cztery trójmiejskie uczelnie wyższe:
i składa się: z pętli Tokenringowej (FDDI) na światłowodzie i z punktami dostępowymi wykorzystującymi połączenia Ethernet(topologia kaktusa). Szczegółowy schemat sieci
Używając codziennie komputera wykorzystujemy do 10% jego mocy obliczeniowej- chyba, że wykonujemy jakieś skomplikowane i czasochłonne obliczenia (CAD, kompresja/dekompresja). Wykorzystanie tzw. "idle time" narodziło się gdy pierwsze komputery połączono w sieć (ARPAnet) na początku lat 70. Obecnie nawet tacy potentaci jak IBM, Compac, SUN uważają, że warto ujarzmić niezagospodarowane 90% mocy obliczeniowej "wolno stojących" komputerów. Takie podejście mogłoby wygenerować tyle mocy obliczeniowej, że superkomputery zostałyby daleko w tyle. Trzecią zaletą jest korzystny stosunek ceny do wydajności, gdyż nie trzeba dodatkowych nakładów na administracje skomplikowanym sprzętem dedykowanym.

Obecnie Internet pozwala na nową (globalną ) skalę wykorzystania "Grid Computing", okazuje się, że to działa. Projektem który można postawić za przykład jest Seti@Home- poszukiwanie pozaziemskich form inteligentnego życia rozpoczęty w 1999 roku. Ponad dwa miliony użytkowników uruchomiło program kliencki na swoich komputerach co udowadnia, że można przyspieszyć obliczenia rozpraszając je i jednocześnie redukując koszty. Projekt Wielkie internetowe poszukiwanie liczb Merssena wskazało entropię sieci na poziomie 1.3 teraflop/s. Tutaj entropia jest funkcją zmian układu izolowanego, która nie zależy od kolejnych przejść stanów tylko od stanu początkowego i końcowego

Oprogramowanie Uniwersytetu Berkeley ewoluowało od pojedynczego projektu (Seti@Home) do działania na dowolne dane- wiele projektów. Projekt BOINC umożliwia osobom dołączanie swoich projektów do "puli". Obecnie jest ich conajmniej kilkanaście: Einstein@Home, proteinPredictor@Home i inne.

Pełna lista projektów znajduje się tutaj Innym projektem, który wykazuje się innowacją w dziedzinie tworzenia klastrów obliczeniowych jest "FURBEOWULF- silnie równoległy system obliczeniowy"

Mimo tak wielu zalet duże firmy obawiają się o bezpieczeństwo swoich danych, by wprowadzać je do przetwarzania w Grid'ie Internetowym. Dla wielkoskalowego zastosowania Grid'ów wymagane jest utworzenie standardowych protokołów i usług predysponowanych do tego celu. Przyszłość "Grid Computing" wygląda na obiecującą gdyż udowodniły swojej użyteczności.
Dopisano pod wpływem __Unix Days 2006__- wykładu HPC- High Performance Computing

Prelegentem był administrator z TASK'u, który podzielił się swoją wiedzą w zakresie High Performance Computing. Stwierdził, że ok. 35% czasu ich klastrów przeznaczone jest dla projektów z dziedziny chemii- modelowanie DNA, białek, 35% na obliczenia kwantowe, 15% metody Monte Carlo, 15% CFD- Computational Fluid Dynamics czyli na numeryczną mechanikę płynów. Na zadane pytanie czemu poważne firmy nie korzystają z inicjatywy BOINC była poza obawą o kradzież danych, brak przewidywalności obliczeń- niemożliwość dotrzymania terminów- jeśli serwer wyśle do użytkownika pakiet w danymi do policzenia, to nie ma żadnej gwarancji, że ten użytkownik kiedykolwiek da odpowiedź- rozwiązanie.
Bibliografia
- globus.org
- nature.com
- webopedia.com
- prezentacja flash zalet Grid Computing prezentowana przez IBM
- ieeetfcc.org
- ccgrid.org
- http://www.deskeng.com/
Rysunki - prawa autorskie
- rysunki 1 i 2 z artykułu Alana Jocha dzięki uprzejmości http://www.deskeng.com/
- schemat meta-komputera dzięki uprzejmości http://www.man.poznan.pl
- rysunek 4 i 5 dzięki uprzejmości Iana Fostera
- 6 rysunek dzieło własne- zrzut z aplikacji Boinc- dla projektu Einstein
- 7 rysunek dzięki uprzejmości Trygve
- ostatni rysunek dzieło własne rozkład obciążenia sieci obliczeniowej w TASK'u numeracja rysunków zgodnie z występowaniem w tekście
Aby dodawać komentarze musisz być zalogowany!
