Friday, September 25, 2009

Cutting Edge Science

Ještě v Galvestonu jsem si stěžoval, jaké je peklo mít dva nadřízené. V Sangeru mám šéfy čtyři a zatím si je nemůžu vynachválit. Nejde totiž o kvantitu, ale o kvalitu :)

Dovolte, abych je představil. Dva z nich jsou vrstevníci a tvoří velitelský tandem naší skupiny Vertebrate Resequencing, Resekvencování Obratlovců. Jsou to vlastně spíš kolegové než šéfové. Mají skvělý smysl pro humor a je s nima legrace. Dále spadám do (a především jsem placený z peněz) projektu Myšího Genomu, Mouse Genomes Project, který vede můj třetí nadřízený, Hlavní Myšák. A konečně nám pevnou rukou vládne Velký Šéf, v minulém roce nejcitovanější Evropský vědec, vedoucí grandiózního mezinárodního projektu 1000 Genomes Project.

A o čem to celé je? Minulý rok byl zahájený projekt 1000 Genomů, který podrobí lidský genom detailní analýze na úrovni, jaká byla ještě před třemi lety nepředstavitelná. (Pro srovnání, první kompletní sekvence lidského genomu byla zveřejněná v roce 2003 po třinácti letech úsilí a 3 miliardách dolarů. Odhadovaný rozpočet současného projektu je 30 milionů dolarů a bude se sekvencovat genom 1200 lidí z různých etnických skupin celého světa.) Cílem je sestavit dosud nejpodrobnější katalog variability lidského genomu schopný zachytit varianty vyskytují se v genech 0.5% lidské populace a častěji.

Projekt takového rozsahu byl umožněný neuvěřitelným pokrokem v sekvenační technologii a bioinformatice a člověk se denně diví, že to celé může fungovat. (Když to zrovna funguje.) Posuďte sami. DNA z odebraného vzorku se fyzikálními procesy (ultrazvukem, nebulizací) náhodně rozláme na spousty malých kousků, které se sekvencují simultánně po stovkách milionů najednou masívně paralelním procesem (video). Z každého fragmentu lze v dostatečné kvalitě nasekvencovat jenom 40-1000 bází (podle použité technologie). Když se jich podaří nastřádat tolik, aby s velkou pravděpodobností několikrát pokryly celý genom, důmyslný software se snaží poskládat střípky na správné místo. Lidský genom má ~3,000,000,000 bází a to už je hodně velké puzzle ;-)

A tady je ukázka jak vypadají skutečná data po zpracování, což mám jako jeden z mnoha mravenečků na starost. Pocházejí ze skromněji financovaného, přitom ale velice důležitého projektu - sekvencování genomu 17 druhů laboratorních myší, které se používají jako modelové organismy při studiu lidských nemocí.

-petr

2 comments:

zuzka v. said...

hezke obrazky :)

Petr said...

no jak psala zuzka - pekne obrazky! a zajimave cteni k tomu...