109: (Default)
109 ([personal profile] 109) wrote2010-05-19 11:55 am

геном человека

я правильно понимаю, что в геноме человека ~3 млрд. нуклеотидов; каждый нуклеотид - это один из четырёх (аденин, цитозин, гуанин, урацил), то есть два бита? то есть весь геном - это 600 мегабайт? да ещё компрессируется небось хорошо.

[identity profile] q-w-z.livejournal.com 2010-05-19 06:58 pm (UTC)(link)
еном человека — это примерно 3 миллиарда нуклеотидов, примерно 20 тысяч генов
http://www.polit.ru/lectures/2010/05/19/bioinformatika.html

[identity profile] plumqqz.livejournal.com 2010-05-19 07:09 pm (UTC)(link)
Я тоже в свое время обиделся

[identity profile] 109.livejournal.com 2010-05-19 07:34 pm (UTC)(link)
всё ещё хуже, оказывается. большая часть генома кодирует белки, а белки - это 20 аминокислот закодированных триплетами (последовательностями из трёх нуклеотидов). а триплет - это потенциально 64 разных последовательности битов. то есть реально информации-то ещё в три раза меньше, 200 MB всего.

[identity profile] anatolix.livejournal.com 2010-05-19 07:18 pm (UTC)(link)
Ну вроде 23andMe за 300 баксов тебе твой собственный геном дадут в гзипованном текстовом файлике размером примерно 700Mb. Но там по-моему по байту на нуклиотид, типа человеко-читаемая форма :)

[personal profile] alll 2010-05-19 07:36 pm (UTC)(link)
Вообще говоря, единицей информации в геноме считается не отдельный нуклеотид, а триплет (кодон), причём все возможные варианты триплетов нужны для кодирования всего 20 аминокислот (~4.5 бита). Кроме того, цепочка ДНК - двойная, информация тупо дублируется. Таким образом на один нуклеотид приходится (~4.5/3)/2=~0.75 бита.

Более того, из этих 3млрд нуклеотидов некоторая часть - служебная, в принципе не отображаемая в белки и служебную РНК, некоторые гены емнип включены в геном по нескольку раз, и ещё некоторая (кстати довольно большая) часть считается мусором, до трансляции которого в белки дело никогда не доходит. Так что хорошо, если собственно информации там хотя бы на 100Мб.

[identity profile] 109.livejournal.com 2010-05-19 07:48 pm (UTC)(link)
да, я уже заметил про белки в другом комменте.

двойная цепочка: насколько я понимаю, комплементарная часть не кодируется, она же жёстко определяется первой половиной.

[personal profile] alll 2010-05-19 08:00 pm (UTC)(link)
> двойная цепочка: насколько я понимаю, комплементарная часть не кодируется

Да там никакая часть не "кодируется", только "содержит код".
Что касается вопроса, с какой из двух "ниток" спирали собственно считывается информация, то, емнип, во времена моей учёбы считалось, что с любой, была бы стартовая последовательность подходящая.

[identity profile] clayrat.livejournal.com 2010-05-19 10:35 pm (UTC)(link)
служебная - не значит бесполезная
я даже больше скажу, эволюция идет преимущественно путем тасования регуляторов, кодирующие последовательности гораздо консервативнее

[identity profile] 109.livejournal.com 2010-05-20 12:06 am (UTC)(link)
регуляторы же тоже кодируются нуклеотидами?

[identity profile] clayrat.livejournal.com 2010-05-20 12:27 am (UTC)(link)
да, это рнковые молекулы
но они не переводятся в белки, там, насколько я знаю, важны все "буквы"

[personal profile] alll 2010-05-20 07:02 am (UTC)(link)
Извините, мужчина, Вас куда-то в степь понесло. Причём не в ту.

[identity profile] clayrat.livejournal.com 2010-05-20 11:46 am (UTC)(link)
почему не в ту
я хотел здесь сказать, что организм далеко не исчерпывается набором своих белков
и сказал

[personal profile] alll 2010-05-20 11:51 am (UTC)(link)
Да ради бога. Непонятно только, зачем Вы захотели это сказать именно в этом месте.

[identity profile] clayrat.livejournal.com 2010-05-20 12:22 pm (UTC)(link)
я был возмущен легкостью, с какой вы отбросили некодирующие последовательности из своих подсчетов

[personal profile] alll 2010-05-20 12:27 pm (UTC)(link)
А я удручён затруднениями, с которым Вы движетесь в направлении давно известного определения информации. Не говоря уж о банальной неспособности внимательно прочитать то, что обсуждаете.

[identity profile] clayrat.livejournal.com 2010-05-20 12:55 pm (UTC)(link)
далеко не все нуклеотидные последовательности кодируют аминокислоты, при этом они несут полезную нагрузку и различаются от организма к организму

так лучше? здесь прошу вас на время воздержаться от дальнейших высказываний, если какие-то сторонние факторы негативно влияют на ваше самочувствие и, соответственно, ваш тон

[personal profile] alll 2010-05-20 02:00 pm (UTC)(link)
Вы действительно не видите в моих словах

> некоторая часть - служебная, в принципе не отображаемая в белки и служебную РНК

ничего, намекающего на то, что я в курсе, что "далеко не все нуклеотидные последовательности кодируют аминокислоты, при этом они несут полезную нагрузку" и что я говорю не о них?

> здесь прошу вас на время воздержаться от дальнейших высказываний

Хм, я правильно понимаю, что Вы пришли в чужой журнал, вмешались в чужой диалог и попросили одного из участников диалога "воздержаться от дальнейших высказываний"? Позвольте выразить своё искреннее восхищение Вашей непосредственностью.

[identity profile] clayrat.livejournal.com 2010-05-20 03:31 pm (UTC)(link)
как я вижу, вы отказываетесь внять моей просьбе
всего доброго

[identity profile] 109.livejournal.com 2010-05-20 06:22 pm (UTC)(link)
вообще говоря, невежливо себя ведёте вы, а не ваш собеседник. я понимаю, что это стиль, но, тем не менее, я бы порекомендовал вести себя повежливее, как в этом журнале, так и вообще.

[personal profile] alll 2010-05-20 06:46 pm (UTC)(link)
Спасибо за рекомендации, я постараюсь учитывать их в этом журнале.

[personal profile] alll 2010-05-19 07:40 pm (UTC)(link)
С другой стороны, если даже примитивные уравнения с числом параметров меньше десятка дают довольно роскошные фракталы, то сотни мегабайт - это ого-го.
pishu: (Default)

+2

[personal profile] pishu 2010-05-19 08:25 pm (UTC)(link)
то-то и оно.
pishu: (Default)

не все так просто.

[personal profile] pishu 2010-05-19 08:10 pm (UTC)(link)
Наука пока не знает как информация кодируется сплайсингом генов, точнее почему сплайсинг срабатывает так и тогда-то. Но это уже детали для программистов. Ну вот ты машину линухом зарядил: он и будет работать если есть электричество. Бессмертный типа. А у человека в разных условиях гены по разному кодируют и вот мы еще и стареем и умираем. Это все непросто.

[identity profile] 109.livejournal.com 2010-05-19 08:14 pm (UTC)(link)
о, я абсолютно уверен, что там дофига чего наука ещё не знает.
pishu: (Default)

зато вот что наука умеет

[personal profile] pishu 2010-05-19 08:24 pm (UTC)(link)
В UK тут полиции достаточно 16 относительно целых любых клеток, чтобы безошибочно идентифицировать потом тебя по ДНК. Уже на 6 млн. граждан базу завели.

[identity profile] clayrat.livejournal.com 2010-05-19 10:21 pm (UTC)(link)
наследуется далеко не одна нуклеотидная последовательность
геном это только БД, а непосредственно "код" непонятно как мерять
плюс информации еще порядком в эпигенетике - форма хроматина и тому подобное