Biotechnologia.pl
łączymy wszystkie strony biobiznesu
Bioinformatyka – niezastąpione narzędzie w pracy Biotechnologa
17.03.2011

Genetyk i biolog ewolucyjny, Theodorius Dobzhansky, wygłosił kiedyś powszechnie znaną obecnie uwagę: „Nic w biologii nie ma sensu, jeśli jest rozpatrywane w oderwaniu od ewolucji”.

Ilość biologicznej informacji dotyczącej sekwencji rośnie w tempie wykładniczym. Metody obliczeniowe odgrywają coraz większą rolę w naukach biologicznych. Koniecznym stał się więc rozwój nowych algorytmów przeznaczonych do analizy takich informacji. Tak powstała nauka, bez której żaden współczesny badacz nie może się obejść. Bioinformatyka, bo o niej mowa, to precyzyjne połączenie dwóch dziedzin informatyki i biologii. Informatyka jest terminem odnoszącym się do naszej wiedzy o własnościach fizycznych i strukturze wszystkich obiektów, a właściwie – jej przetwarzaniem. Słowo bio oznacza „życie”.

Termin bioinformatyka po raz pierwszy został użyty przez Masys'a w 1989 roku. Obecnie na pracach prowadzonych pod szyldem bioinformatyki zyskują zarówno przyrodnicy, jak i informatycy. Ci pierwsi dostają do dyspozycji narzędzia umożliwiające sprawne i szybkie przetwarzane danych opisujących badane przez nich obiekty czy wyniki z eksperymentów,

ci drudzy z kolei – możliwość naśladowania rozwiązań podpatrzonych w naturze, jak i możliwość testowania różnych algorytmów i programów na danych rzeczywistych – a przez to możliwość weryfikacji założeń przyjętych przy projektowaniu różnych algorytmów, systemów informatycznych i aplikacji.

Możemy powiedzieć, że w pewnym sensie szukamy tutaj „zasady i mechanizmu” działania organizmów żywych, przy czym wykorzystujemy moc obliczeniową komputerów między innymi do przeprowadzania modelowania i symulacji działania organizmów żywych.

 

 

Jakie są obszary badań w bioinformatyce? 

Bioinformatyka jako dziedzina interdyscyplinarna jest bardzo rozległa. Pojawienie się programów sekwencjonowania genomów okazało się wielkim sukcesem. Jednocześnie następuje rozwój metod eksperymentalnych, które można określić mianem techniki wysokoprzepustowe. Obejmują one m.in.: mikromacierze, proteomikę i genomikę strukturalną. U podstaw tych metod leży ukierunkowanie badań na jednoczesną analizę ogromnej liczby genów lub białek . Rola tej nauki przejawia się zatem w rozwoju metod statystycznej analizy zbiorów danych i utworzeniu technik pozwalających na zarządzanie tą informacja. Rozmaite aspekty ewolucji leżą u podstaw wielu metod wykorzystywanych w bioinformatyce. Należą do nich: wyznaczanie dopasowań sekwencji, identyfikacja rodzin genów i białek, wykrywanie homologii między genami różnych organizmów. Sama konstrukcja drzewa filogenetycznego jest jednym z zagadnień biologii obliczeniowej. 

Nie jest to wyczerpująca lista zagadnień informatycznych, które mogą być stosowane do wspomagania nauk przyrodniczych – nie uwzględniłam tutaj na przykład metod uczenia maszynowego czy sztucznej inteligencji, programowania (dynamicznego, genetycznego, rozproszonego – ogólnie tworzenie specjalizowanych aplikacji) czy usług sieciowych. Wszystkie jednak te zagadnienia tworzą na dzień dzisiejszy coś, co jest określane jednym pojęciem – bioinformatyka. 

Biologia i informatyka przenikają się w chwili obecnej na wielu płaszczyznach, a przejawów tego nie trzeba szukać daleko. Od oczywistych zastosowań jak komputerowe wspomaganie obliczeń niezbędnych do przeprowadzania eksperymentów natury biologicznej, modelowanie procesów biochemicznych oraz ich symulacje komputerowe in silico, po o wiele bardziej subtelne relacje. Można powiedzieć, że ilości możliwych zastosowań informatyki w biologii jest mierzalna tylko skalą kreatywności badaczy.

Mikromacierze jako przykład wykorzystania wiedzy informatyki i biologii

Jednym ze najciekawszych a za razem najbardziej złożonych zadań bioinformatyki jest analiza danych pochodzących z mikromacierzy DNA. Nić DNA w organizmie pełni rolę nośnika informacji według których funkcjonuje komórka (a w efekcie ich współpracy – cały organizm). W określonych warunkach następuje ekspresja genu, czyli aktywowanie zawartej w nim informacji (często w jej wyniku jest to wytworzenie odpowiedniego białka). Mikromacierz jest narzędziem pozwalającym odczytać stopień tej ekspresji dla tysięcy genów jednocześnie. 

Wynikiem badania za pomocą mikromacierzy jest obraz złożony z punktów, z których każdy ma położenie odpowiadające konkretnemu genowi (lub kilku). Oczywiście wynik w postaci obrazu przed dalszą analizą musi być przetworzony na postać liczbową, a fakt, że nie jest on pozbawiony zakłóceń, już wymaga ingerencji informatyka potrafiącego posłużyć się algorytmami przetwarzania obrazu. Dalsza analiza jest zadaniem jeszcze bardziej złożonym i wymagającym od człowieka dużej dawki inwencji oraz umiejętności poruszania się w zakresie przedmiotu danego badania. Z jednej mikromacierzy otrzymuje się dane o ponad dwudziestu tysiącach genów (obecnie najpowszechniej stosowane, a są już i takie które umożliwiają zebranie kilku milionów odczytów naraz).  Metody statystyczne, grupowanie, eksploracja danych – wszystkie chwyty prowadzące do celu są dozwolone, a celem tym jest wyciągnięcie z analizowanych danych jak największej ilości użytecznych informacji. 

Znaczna część obecnie istniejącego oprogramowania umożliwiającego obróbkę danych mikromacierzowych wykorzystuje środowiska obliczeń naukowych, takie jak Matlab, The R Project, Numerical Python i najczęściej ma formę dodatkowych modułów z nowymi, odpowiednio przygotowanymi, używanymi w tego typu analizach funkcjami. Największą zaletą tego typu oprogramowania jest jego elastyczność. Użytkownik w razie potrzeby może w relatywnie prosty sposób napisać dodatkowe funkcje czy zmodyfikować istniejące dla potrzeb swojej analizy. Z drugiej strony sposób ten jest tylko „relatywnie” prosty ponieważ wymaga umiejętności informatycznych raczej wykraczających ponad poziom przeciętny. Również samo korzystanie z tego rodzaju oprogramowania może nastręczać problemów użytkownikowi komputera przyzwyczajonemu do używania interfejsów graficznych, a z reguły do takich należy człowiek zajmujący się badaniami z zakresu biologii. Dlatego potrzebny mu jest współpracujący bioinformatyk który w razie potrzeby pomoże i doradzi. 

Rynek usług bioinformatycznych

Bioinformatyka opierając się więc jedynie na wiedzy podstawowej w zakresie biologii, chemii, biofizyki i genetyki czy biologii molekularnej, mając do dyspozycji matematykę i statystykę, porządkuje zakresy działań nauk przyrodniczych pomagając w odnajdowaniu uniwersalnych zjawisk, budowie hipotez i teorii. Szacuje się, że obecnie na rynku funkcjonuje ponad 50 przedsiębiorstw oferujących swoje produkty i usługi bioinformatyczne potencjalnym klientom. Szacunkowo wartość całkowita rynku narzędzi i usług bioinformatycznych, włączając w to klasyczne bazy danych, może przewyższyć 2.0 miliardy USD w ciągu pięciu lat. Grupy zajmujące się badaniami rynkowymi: Frontline i Frost & Sullivan, które na podstawie przeglądu ponad 50 programów komputerowych i bioinformatycznych baz danych różnych przedsiębiorstw, oszacowały aktualny rynek w przybliżeniu 300 na milionów dolarów.

 

Bibliografia:

„Inżynieria biomedyczna” pod redakcją Ryszarda Tadeusiewicza, AGH Kraków 2008

„Genetyka molekularna” Piotr Węgieński, PWN Warszawa 2008

„Bioinformatyka i ewolucja molekularna” Paul G. Higgs, Teresa K. Attwood. PWN Warszawa 2008

„Bioinformatyka podręcznik do analizy genów i białek” A.D. Baxevanisa, B.F.F. Ouellette'a, PWN Warszawa 2005

„Cyfrowe przetwarzanie obrazów medycznych Algorytmy technologie zastosowania” Jerzy Cytowski, EXIT Warszawa 2008

red. Blanka Majda  

KOMENTARZE
Newsletter