SIMAP: Unterschied zwischen den Versionen

Aus Planet 3DNow! Distributed Computing Wiki
Zur Navigation springen Zur Suche springen
K (parsic => PA-RISC; Sparc ist kein Unix, sondern eine Hardwarearchitektur)
 
(31 dazwischenliegende Versionen von 7 Benutzern werden nicht angezeigt)
Zeile 4: Zeile 4:
 
| {{Steckbrief Kategorie|Biologie & Medizin}}
 
| {{Steckbrief Kategorie|Biologie & Medizin}}
 
|-
 
|-
| {{Steckbrief Betreiber|TU München (Fachrichtung Bioinformatik)}}
+
| {{Steckbrief Betreiber|Universität Wien, TU München, Helmholtz-Zentrum München}}
 
|-
 
|-
| {{Steckbrief Nationalität|Deutschland|de}}
+
| {{Steckbrief Nationalität|Österreich|at}}
 
|-
 
|-
 
| {{Steckbrief Start|Dezember 2005}}
 
| {{Steckbrief Start|Dezember 2005}}
Zeile 12: Zeile 12:
 
| {{Steckbrief Status|Stabil}}
 
| {{Steckbrief Status|Stabil}}
 
|-
 
|-
| {{Steckbrief Webseite|URL=http://boinc.bio.wzw.tum.de|Name=boinc.bio.wzw.tum.de}}
+
| {{Steckbrief Webseite|URL=http://boincsimap.org/boincsimap/|Name=http://boincsimap.org/boincsimap/}}
 
|-
 
|-
| {{Steckbrief Anmeldung|URL=http://boinc.bio.wzw.tum.de/boincsimap/}}
+
| {{Steckbrief Anmeldung|URL=http://boincsimap.org/boincsimap/}}
 
|-
 
|-
 
| {{Steckbrief Clients Systeme}}
 
| {{Steckbrief Clients Systeme}}
Zeile 37: Zeile 37:
 
|-
 
|-
 
| {{Steckbrief P3D-Statistik|URL=http://boinc.bio.wzw.tum.de/boincsimap/team_display.php?teamid=783}}
 
| {{Steckbrief P3D-Statistik|URL=http://boinc.bio.wzw.tum.de/boincsimap/team_display.php?teamid=783}}
 +
|-
 +
| {{Steckbrief P3D-Statistik Live|Name=SIMAP}}
 
|}
 
|}
  
'''SIMAP''' ist ein Projekt der TU München, welches der Erstellung einer Datenbank dient, in der die Ähnlichkeiten zwischen Proteinsequenzen gespeichert werden.
+
'''SIMAP''' ('''Si'''milarity '''Ma'''trix of '''P'''roteins) ist ein Projekt der TU München, welches der Erstellung einer Datenbank dient, in der die Ähnlichkeiten zwischen Proteinsequenzen gespeichert werden.
  
 
== Projektbeschreibung ==
 
== Projektbeschreibung ==
So beschreibt sich das Projekt selbst:
 
  
Was ist SIMAP:
+
Bisher sind mehrere Millionen verschiedene Proteinsequenzen bekannt - zuviel um jedes Protein einzeln eingehend zu untersuchen. Glücklicherweise haben Proteine, die sich ähneln, meist auch ähnliche Eigenschaften und Funktionen. Deshalb überträgt man experimentelle Erkenntnisse, die für ein bestimmtes Protein gewonnen wurden, auch auf dessen Verwandte.
<blockquote style="font-style: italic">
+
 
SIMAP ist eine Datenbank, in der die Ähnlichkeiten aller derzeit bekannten Proteinsequenzen untereinander sowie deren Domänen gespeichert sind. Man kann sich das als Matrix vorstellen, die quadratisch ist bei einer Kantenlänge von ca. 4 Mio Proteinsequenzen die wir momentan speichern. Der Inhalt der Matrix ist symmetrisch, das heißt wenn Protein 1 dem Protein 2 ähnlich ist, dann ist es umgekehrt genauso. SIMAP ist weltweit das einzige derartige Projekt, bei dem wirklich alle Proteine einbezogen werden. Das "Konkurrenzprojekt" clustr am European Bioinformatics Institute beschränkt sich derzeit auf ca. 1/5 unserer Datenmenge.</blockquote>
+
Die Ähnlichkeit von Proteinen wird nicht nur für die Funktionsvorhersage von Proteinen genutzt, sondern auch für viele weitere Methoden der Bioinformatik. Die Ähnlichkeiten nicht jedes Mal neu berechnen zu müssen, würde eine erhebliche Zeitersparnis bedeuten.
Wem nutzt SIMAP?
+
 
<blockquote style="font-style: italic">
+
Jedoch fehlte bisher ein komplettes Verzeichnis aller Proteine und ihrer Ähnlichkeiten untereinander. Das bisher größte Verzeichnis dieser Art, das Projekt clustr am European Bioinformatics Institute, umfasst derzeit ca. 800.000 von ca. 4 Millionen bekannten Proteinen.
Proteinähnlichkeiten geben Hinweise auf die Verwandschaftsverhältnisse zwischen Proteinen. Verwandte Proteine haben oft gleiche oder ähnliche Eigenschaften und Funktionen im Organismus, da sie sich im Lauf der Evolution nur langsam verändern. Da man derzeit viel mehr Proteinsequenzen kennt als man eingehend in Labors untersuchen kann, werden die experimentellen Erkenntnisse über ein Protein auch auf dessen Verwandte übertragen. Ein gutes Beispiel dafür ist die intensive Untersuchung von Mausgenen und -proteinen, deren Ergebnisse oft auch für den Menschen gültig sind.</blockquote>
+
 
Wer betreibt SIMAP?
+
SIMAP erstellt dagegen ein Verzeichnis ''aller'' bekannten Proteine und stellt es Forschung und Lehre vollständig kostenlos zur Verfügung. Man kann sich das Projekt als eine Matrix mit ca. 4 Millionen Spalten und ebenso vielen Zeilen vorstellen. Der Inhalt der Matrix ist symmetrisch, d. h. ist Protein 1 dem Protein 2 ähnlich, so ist auch Protein 2 dem Protein 1 ähnlich.
<blockquote style="font-style: italic">
+
 
SIMAP ist ein Gemeinschaftsprojekt des GSF-Forschungszentrums für Gesundheit und Umwelt in Neuherberg bei München und der Technischen Universität München, Wissenschaftszentrum Weihenstephan. Ansprechpartner ist Thomas Rattei vom Lehrstuhl für Genomorientierte Bioinformatik.
+
Ständig werden neue Proteine entdeckt und auch die Modelle werden ständig erweitert und aktualisiert. Das Verzeichnis aktuell zu halten, erfordert deshalb einen enormen Rechenaufwand, dem die vorhandenen Hochleistungsrechner der TU München nicht gewachsen sind. Deshalb wird auf [[Distributed Computing]] gesetzt.
</blockquote>
+
 
''Copyright © 2007 Genome Oriented Bioinformatics - TU Munich''
+
Betrieben wird SIMAP als Gemeinschaftsprojekt des GSF-Forschungszentrums für Gesundheit und Umwelt in Neuherberg bei München und der Technischen Universität München, Wissenschaftszentrum Weihenstephan. Ansprechpartner ist Thomas Rattei vom Lehrstuhl für Genomorientierte Bioinformatik.<ref>[http://boinc.bio.wzw.tum.de/boincsimap/project.php Über das SIMAP Projekt]</ref>
 +
 
 +
 
 +
'''Am 30.05.2014  wurde von den Betreibern verkündet, dass SIMAP sich Ende 2014 nach 10 Jahren von der BOINC Plattform zurückziehen wird.'''
 +
 
  
=== Erfolge des Projekts ===
+
== Erfolge des Projekts ==
  
 
Dank des grossen Interesses der internationalen Cruncher-Gemeinschaft konnten die Datenbestände des Projekts bereits abgearbeitet werden.
 
Dank des grossen Interesses der internationalen Cruncher-Gemeinschaft konnten die Datenbestände des Projekts bereits abgearbeitet werden.
Zeile 62: Zeile 67:
  
  
Current Release Statistics
+
== Planet 3DNow! ==
  
''Release Date'': 2007-10-17 14:42:28.0
+
Planet 3DNow! nimmt seit dem 13.06.2006 mit einem eigenen Team an SIMAP teil und erreichte am 11.09.2006 Platz 1.
  
Number of Databases: 549
+
Im Oktober 2007 konnte Planet3Dnow! als erstes Team die "Schallmauer" von 10 Millionen [[Credits]] überschreiten.
  
Number of Proteins: 17,558,967
+
SIMAP wurde für den Februar 2008 zum [[Projekt des Monats]] gewählt. Im Verlauf dieser Aktion wurde die Marke von 25 Millionen Credits erreicht.
  
Number of Sequences: 6,275,189
+
Am 12.12. 2010 überschritt das Team die Marke von 100 Millionen errechneten Credits.
  
Number of Residues: 2,092,498,491
+
Zum Ende des Projektes (31.12.2014) im Dc-Bereich wird unser Team mit ~430.000.000 Credits als No.1 das Projekt abschließen
  
Number of processed Sequences: 6,189,008
+
== Teilnahme ==
  
Number of Hits: 90,748,726,442
+
Um an SIMAP teilzunehmen, muss man [[Portal:BOINC/Beschreibung|BOINC]] installieren. Eine Installationsanleitung findet sich im Artikel [[Portal:BOINC/Installation|Installation von BOINC]].
  
''Quelle'': [http://webclu.bio.wzw.tum.de/simap/index2.html  GSF - Forschungszentrum für Umwelt und Gesundheit]
+
SIMAP ist auf nahezu allen Computern lauffähig, profitiert allerdings - im Gegensatz zu vielen anderen Projekten - von erweiterten CPU Befehlssätzen wie [[SSE]].
  
=== Planet 3DNow! ===
+
Clients sind für Windows, Linux, Mac und etliche Unix-Derivate wie etwa Solaris und BSD verfügbar.
  
Planet 3DNow! nimmt seit dem 13.06.2006 mit einem eigenen Team an SIMAP teil und erreichte am 11.09.2006 Platz 1.
+
Die Datenmenge beim Transfer beträgt einmalig knapp 1,5 MB. Bei jeder [[Work-Unit]] werden ca. 2 MB herunter- und 0,5 MB hochgeladen.
  
Im Oktober 2007 konnte Planet3Dnow! als erstes Team die "Schallmauer" von 10 Millionen Credits überschreiten!
+
== Besonderheiten ==
  
=== Teilnahme ===
+
* Das Projekt unterstützt [[Checkpoints]].
 +
* SIMAP vergibt [[Credits#Fixe Credits|fixe Credits]].
 +
* Es gibt zwei verschieden Anwendungen: SIMAP zum Proteinsequenzenvergleich und HMMER (''Hidden Markov Models'') für deren Domänen.
 +
* Die WU Länge fällt in die Kategorie "klein", sie liegt zwischen ~30min (A64 2,5GHz) und ~3h (P3 1GHz).
 +
* Das [[Quorum]] beträgt 2. Eine Work-Unit muss also von zwei Rechnern erfolgreich berechnet werden, bevor diese Rechner Credits gut geschrieben bekommen.
 +
* Die [[Deadline]] bei diesem Projekt beträgt 7 Tage, später abgegebene Work-Units werden nicht mehr akzeptiert. Die Berechnung muss innerhalb dieses Zeitraums abgeschlossen und das Ergebnis dem Projekt vollständig gemeldet werden.
 +
* Die maximale Anzahl an Work-Units liegt bei 60 WUs pro Kern (auch virtuelle).
 +
* SIMAP profitiert wenig von einer hohen Speicherbandbreite und einem großen CPU-Cache, nutzt aber Befehlssatzerweiterungen ([[SSE]], [[SSE2]], [[SSE3]], [[MMX]], [[3DNow!]] etc.).
 +
* Für Rechner, die kein SSE unterstützen (i386 wie z. B. AMD Athlon Thunderbird), können [http://boincsimap.org/boincsimap/appdownloads.php angepasste Anwendungen] manuell installiert werden. Für Linux und Windows gibt es 64-Bit-Clients, die ca. 10-15% schneller sind als der Standard-Client für Windows. Auch für andere Sonderfälle gibt es Anwendungen.
 +
* SIMAP ist ein periodisches Projekt. Es gibt hauptsächlich am Monatsanfang WUs, deren Menge je nach Umfang des Updates des Verzeichnis schwankt. Um eine gleichmäßigere Verteilung zu erhalten werden ~2000 neue WUs dann alle 10 Minuten zum Download freigegeben.
  
Um bei boincSIMAP teilzunehmen muss man [[BOINC]] installieren.
+
== Banner ==
Mehr zur [[Installation von BOINC]] gibt es hier in der DC-Wiki.
 
  
boincSIMAP ist auf nahezu allen Computern lauffähig, profitiert allerdings - im Gegensatz zu vielen anderen Projekten - von erweiterten CPU Befehlssätzen wie [[SSE]].
+
[[Bild:Banner SIMAP.png]]
  
Clients sind für Windows, Linux, Macintosh und etliche Unix-Derivate wie etwa Solaris und BSD verfügbar.
 
  
=== Banner ===
+
== Weblinks ==
 
 
[[Bild:Banner SIMAP.png]]
 
  
=== Weblinks ===
+
* [http://boincsimap.org/boincsimap/ boincsimap.org/boincsimap/] - Internetpräsenz des Projekts
 +
* [http://boincsimap.org/boincsimap/team_display.php?teamid=783 Planet 3DNow! Teamstatistik]
  
* [http://boinc.bio.wzw.tum.de boinc.bio.wzw.tum.de] - Internetpräsenz des Projekts
+
== Quellen ==
* [http://boinc.bio.wzw.tum.de/boincsimap/team_display.php?teamid=783 Planet 3DNow! Teamstatistik]
+
<references />
  
  

Aktuelle Version vom 30. Oktober 2014, 09:21 Uhr

Steckbrief
Kategorie: Biologie & Medizin
Betreiber: Universität Wien, TU München, Helmholtz-Zentrum München
Nationalität: Österreich Flag at.png
Start: Dezember 2005
Status: Stabil
Webseite: http://boincsimap.org/boincsimap/
Anmelde-URL: http://boincsimap.org/boincsimap/
Clients Logo Windows.gif Logo Linux.gif Logo MacOSX.gif Logo android.png Logo raspberry.png
x86 x x x x x
x86-64 x x x - -
PowerPC/PS3 - x x - -
IA64 - x - - -
Alpha - x - - -
Sparc - x - - x
UltraSparc - x - - x
PA-RISC 32Bit - x - - -
PA-RISC 64Bit - x - - -
Planet 3DNow! Teamstatistik
Platzierung Planet 3DNow!: Ajax-loader.gif
(powered by BOINCstats)

SIMAP (Similarity Matrix of Proteins) ist ein Projekt der TU München, welches der Erstellung einer Datenbank dient, in der die Ähnlichkeiten zwischen Proteinsequenzen gespeichert werden.

Projektbeschreibung

Bisher sind mehrere Millionen verschiedene Proteinsequenzen bekannt - zuviel um jedes Protein einzeln eingehend zu untersuchen. Glücklicherweise haben Proteine, die sich ähneln, meist auch ähnliche Eigenschaften und Funktionen. Deshalb überträgt man experimentelle Erkenntnisse, die für ein bestimmtes Protein gewonnen wurden, auch auf dessen Verwandte.

Die Ähnlichkeit von Proteinen wird nicht nur für die Funktionsvorhersage von Proteinen genutzt, sondern auch für viele weitere Methoden der Bioinformatik. Die Ähnlichkeiten nicht jedes Mal neu berechnen zu müssen, würde eine erhebliche Zeitersparnis bedeuten.

Jedoch fehlte bisher ein komplettes Verzeichnis aller Proteine und ihrer Ähnlichkeiten untereinander. Das bisher größte Verzeichnis dieser Art, das Projekt clustr am European Bioinformatics Institute, umfasst derzeit ca. 800.000 von ca. 4 Millionen bekannten Proteinen.

SIMAP erstellt dagegen ein Verzeichnis aller bekannten Proteine und stellt es Forschung und Lehre vollständig kostenlos zur Verfügung. Man kann sich das Projekt als eine Matrix mit ca. 4 Millionen Spalten und ebenso vielen Zeilen vorstellen. Der Inhalt der Matrix ist symmetrisch, d. h. ist Protein 1 dem Protein 2 ähnlich, so ist auch Protein 2 dem Protein 1 ähnlich.

Ständig werden neue Proteine entdeckt und auch die Modelle werden ständig erweitert und aktualisiert. Das Verzeichnis aktuell zu halten, erfordert deshalb einen enormen Rechenaufwand, dem die vorhandenen Hochleistungsrechner der TU München nicht gewachsen sind. Deshalb wird auf Distributed Computing gesetzt.

Betrieben wird SIMAP als Gemeinschaftsprojekt des GSF-Forschungszentrums für Gesundheit und Umwelt in Neuherberg bei München und der Technischen Universität München, Wissenschaftszentrum Weihenstephan. Ansprechpartner ist Thomas Rattei vom Lehrstuhl für Genomorientierte Bioinformatik.[1]


Am 30.05.2014 wurde von den Betreibern verkündet, dass SIMAP sich Ende 2014 nach 10 Jahren von der BOINC Plattform zurückziehen wird.


Erfolge des Projekts

Dank des grossen Interesses der internationalen Cruncher-Gemeinschaft konnten die Datenbestände des Projekts bereits abgearbeitet werden. Inzwischen werden meist nur noch zu Beginn jeden Monats neue Proteinsequenzen zur Berechnung verteilt werden.


Planet 3DNow!

Planet 3DNow! nimmt seit dem 13.06.2006 mit einem eigenen Team an SIMAP teil und erreichte am 11.09.2006 Platz 1.

Im Oktober 2007 konnte Planet3Dnow! als erstes Team die "Schallmauer" von 10 Millionen Credits überschreiten.

SIMAP wurde für den Februar 2008 zum Projekt des Monats gewählt. Im Verlauf dieser Aktion wurde die Marke von 25 Millionen Credits erreicht.

Am 12.12. 2010 überschritt das Team die Marke von 100 Millionen errechneten Credits.

Zum Ende des Projektes (31.12.2014) im Dc-Bereich wird unser Team mit ~430.000.000 Credits als No.1 das Projekt abschließen

Teilnahme

Um an SIMAP teilzunehmen, muss man BOINC installieren. Eine Installationsanleitung findet sich im Artikel Installation von BOINC.

SIMAP ist auf nahezu allen Computern lauffähig, profitiert allerdings - im Gegensatz zu vielen anderen Projekten - von erweiterten CPU Befehlssätzen wie SSE.

Clients sind für Windows, Linux, Mac und etliche Unix-Derivate wie etwa Solaris und BSD verfügbar.

Die Datenmenge beim Transfer beträgt einmalig knapp 1,5 MB. Bei jeder Work-Unit werden ca. 2 MB herunter- und 0,5 MB hochgeladen.

Besonderheiten

  • Das Projekt unterstützt Checkpoints.
  • SIMAP vergibt fixe Credits.
  • Es gibt zwei verschieden Anwendungen: SIMAP zum Proteinsequenzenvergleich und HMMER (Hidden Markov Models) für deren Domänen.
  • Die WU Länge fällt in die Kategorie "klein", sie liegt zwischen ~30min (A64 2,5GHz) und ~3h (P3 1GHz).
  • Das Quorum beträgt 2. Eine Work-Unit muss also von zwei Rechnern erfolgreich berechnet werden, bevor diese Rechner Credits gut geschrieben bekommen.
  • Die Deadline bei diesem Projekt beträgt 7 Tage, später abgegebene Work-Units werden nicht mehr akzeptiert. Die Berechnung muss innerhalb dieses Zeitraums abgeschlossen und das Ergebnis dem Projekt vollständig gemeldet werden.
  • Die maximale Anzahl an Work-Units liegt bei 60 WUs pro Kern (auch virtuelle).
  • SIMAP profitiert wenig von einer hohen Speicherbandbreite und einem großen CPU-Cache, nutzt aber Befehlssatzerweiterungen (SSE, SSE2, SSE3, MMX, 3DNow! etc.).
  • Für Rechner, die kein SSE unterstützen (i386 wie z. B. AMD Athlon Thunderbird), können angepasste Anwendungen manuell installiert werden. Für Linux und Windows gibt es 64-Bit-Clients, die ca. 10-15% schneller sind als der Standard-Client für Windows. Auch für andere Sonderfälle gibt es Anwendungen.
  • SIMAP ist ein periodisches Projekt. Es gibt hauptsächlich am Monatsanfang WUs, deren Menge je nach Umfang des Updates des Verzeichnis schwankt. Um eine gleichmäßigere Verteilung zu erhalten werden ~2000 neue WUs dann alle 10 Minuten zum Download freigegeben.

Banner SIMAP.png


Weblinks

Quellen


BOINC-Projekte

- Astronomie & Astrophysik -

Cosmology@Home | Einstein@Home | MilkyWay@home | orbit@home | SETI@home

- Biologie & Medizin -

BCL@Home | Cels@Home | Docking@Home | DrugDiscovery@Home | Malariacontrol.net | POEM@HOME | Predictor@home* | Proteins@Home | RNA World | Rosetta@home | SIMAP | Superlink@Technion | TANPAKU* | Virtual Prairie

- Chemie -

GPUGRID | Hydrogen@Home | QMC@Home

- Geologie -

Quake-Catcher Network

- Internet -

Anansi | DepSpid*

- Kryptographie -

DistrRTgen | DNETC@HOME | Enigma@Home | SHA-1 Collision Search Graz

- Künstliche Intelligenz -

Artificial Intelligence System* | distributedDataMining | FreeHAL@home | MindModeling@Home

- Mathematik -

3x+1@home* | ABC@home | Collatz Conjecture | Goldbach's Conjecture Project | Genetic Life | NFS@Home | PrimeGrid | Ramsey@Home | Rectilinear Crossing Number | Riesel Sieve* | SZTAKI Desktop Grid | TSP* | WEP-M+2 Project

- Metaprojekte -

AlmereGrid | Leiden Classical | The Lattice Project | World Community Grid | yoyo@home

- Meteorologie -

APS@Home | BBC Climate Change Experiment* | ClimatePrediction.net | Climate Prediction Seasonal Attribution Project

- Nanotechnologie -

NanoHive@Home* | Spinhenge@home

- Physik -

AQUA@home | EDGeS@Home | IBERCIVIS | LHC@home | Magnetism@home | QuantumFIRE | Zivis Superordenador Ciudadano* | µFluids@Home

- Rendering -

BURP | PicEvolvr | Open Rendering Environment

- Spiele -

Chess960@Home | NQueens@Home | pPot Tables* | Sudoku

- Tests der BOINC-Plattform -

Pirates@Home | Project Neuron* | UCT: malariacontrol.net | vtu@home


* Beendetes Projekt
Nicht-BOINC-Projekte

- Astronomie & Astrophysik -

SETI@home Classic*

- Biologie & Medizin -

Folding@Home | Lifemapper*

- Mathematik -

RC5-72


* Beendetes Projekt