hu wissen (pdf) - Exzellenzinitiative - Humboldt-Universität zu Berlin
hu wissen (pdf) - Exzellenzinitiative - Humboldt-Universität zu Berlin
hu wissen (pdf) - Exzellenzinitiative - Humboldt-Universität zu Berlin
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
176<br />
tenascin<br />
K hyki tach ach KA tac hki h<br />
The statistics are alarming:<br />
pp60cpp60c- pp60c-src<br />
tac<br />
Texte angewendet werden können. Dem HU-Forscher und seiner<br />
Arbeitsgruppe gelingt es mittlerweile, alle <strong>hu</strong>manen Gene<br />
in den 19 Millionen Abstracts aus PubMed in einem einzigen<br />
Tag <strong>zu</strong> fi nden.<br />
»Bei Colonet spielen etwa 80 Gene eine wichtige Rolle, unsere<br />
Aufgabe besteht aber nicht nur darin, sie in Publikationen <strong>zu</strong><br />
fi nden, eine weitere Herausforderung ist, sie bezüglich ihrer<br />
potenziellen Bedeutung als Biomarker <strong>zu</strong> ranken, um Relevantes<br />
von Unbedeutendem <strong>zu</strong> trennen«, unterstreicht Leser. Ein<br />
weiteres Problem, das der HU-Wissenscha� ler und viele andere<br />
Bioinformatiker <strong>zu</strong> lösen suchen, ist bei der Suche Bezie<strong>hu</strong>ngen<br />
<strong>zu</strong> anderen »Objekten« wie Proteinen her<strong>zu</strong>stellen. So gibt es im<br />
menschlichen Körper rund 2000 Gene, die andere Gene regulieren<br />
und bei der Suche nach einem Biomarker ebenfalls relevant<br />
sind. Um nun automatisch <strong>zu</strong> erkennen, welche Gene welche<br />
anderen Gene regulieren, müssen nicht nur die Gene selber,<br />
sondern auch ihre Bezie<strong>hu</strong>ng <strong>zu</strong>einander in Sätzen erkannt<br />
werden – ein großes Thema in der weltweiten Bio-Text-Mining-<br />
Community. Und auch für Ulf Leser.<br />
k english<br />
approved cancer drugs are only a real help to about 20 percent of<br />
patients. And in the worst cases they don’t help the remaining 80<br />
percent at all. The patients not only lose precious time, but also<br />
strength combating the side eff ects. Individualized therapies are<br />
therefore increasing coming under scrutiny in biomedical research<br />
laboratories: the scientists’ vision is to develop tests with which<br />
they can check the eff ectiveness of a drug on an individual patient<br />
before beginning a therapy.<br />
»Cancer is not a single disease; rather, we now know that the<br />
disease is caused by a large number of mutations in the genes,«<br />
explains Ulf Leser. A scientist at <strong>Humboldt</strong>-<strong>Universität</strong>, he is neither<br />
a physician nor a biologist, yet his expertise is of enormous<br />
importance for research in the life sciences – in fact it is essential.<br />
Leser is a bioinformatician, and one of his fi elds of research is text<br />
mining.<br />
»One problem faced by modern research is the sheer wealth of<br />
information; this o� en makes it virtually impossible for scientists<br />
to fi lter out a complete overview of the latest information on a<br />
specifi c subject from the available literature,« says the computer<br />
scientist. For example, PubMed/Medline, one of the best-known<br />
databases in the fi eld of life sciences, comprises about 19 million<br />
articles, and about a million new ones are added every year. Another<br />
problem for the scientists is that, when doing a search with<br />
keywords, it’s very diffi cult to distinguish between relevant and<br />
irrelevant hits – for example when you are looking for the latest<br />
information on certain genes or proteins.<br />
»Text mining is a method that enables us, for instance, to<br />
quickly and automatically recognize biologically relevant terms –<br />
such as gene names, mutations or diseases – despite the large