В РНК нашли отвечающие за эффективность синтеза белка участки
Сотрудники Сколтеха вместе с коллегами проанализировали более 30 тысяч вариантов генетических последовательностей, которые кодируют два флуоресцентных белка, чтобы выяснить, какие характеристики мРНК и первого десятка кодонов в ней могут повышать эффективность процесса трансляции.
Также авторы исследования, опубликованного в журнале Nucleic Acids Research, установили, что редкие кодоны в начале последовательности не увеличивают эффективность трансляции, как считалось ранее.
moomath/Flickr
Трансляция — это процесс, в ходе которого на основе матричной РНК рибосома строит цепочку аминокислот, затем превращающуюся в белок. Каждая аминокислота кодируется кодоном — тремя нуклеотидами в последовательности мРНК. Всего возможен 61 кодон, но количество кислот, которые они кодируют, — только 20. Это значит, что некоторые кодоны кодируют одну и ту же аминокислоту.
До сих пор исследователи до конца не уверены в том, что влияет на эффективность работы клеточного «белкового завода». Например, есть свидетельства того, что некоторые вторичные структуры мРНК — ее пространственные конформации — могут мешать рибосоме связываться с ней и выполнять свою работу. Другой возможный фактор — синонимичные кодоны. Более ранние исследования показали, что, возможно, статистически более редко используемые кодоны могут увеличивать эффективность трансляции, если они находятся в начале открытой рамки считывания. Эти кодоны замедляют движение рибосомы по мРНК в ее начале так, что дальше не возникают «очереди» из рибосом.
Изучение эффективности трансляции поможет лучше понять экспрессию генов и повысить эффективность работы биотехнологических бактерий — «рабочих лошадок», которые производят нужные белки. Поэтому российские ученые вместе с коллегами решили провести своеобразное соревнование: они протестировали более 30 тысяч вариантов мРНК, которая кодирует одни и те же белки. Авторы намеревались понять, какие варианты дадут более эффективную трансляцию. Исследователей интересовали кодоны с номерами от 2 до 11.
В качестве модельного организма биологи использовали кишечную палочку Escherichia coli и плазмиды — кольцевые ДНК, кодирующие двойной флуоресцентный репортер. Затем ученые вставляли случайные последовательности из 30 нуклеотидов сразу после стартового кодона так, чтобы в мРНК они стали кодонами со второго по одиннадцатый. Вырастив бактерии и отсортировав их по эффективности производства CER и RFP, ученые использовали метод flowseq, чтобы понять, какие последовательности обеспечили более эффективное производство белка.
Flowseq представляет собой сочетание проточной цитометрии (техники, при которой физические и химические характеристики клеток измеряются через рассеивание луча лазера) и секвенирования разделенных фракций. Этот метод позволяет оценивать эффективность синтеза белка для тысячи вариантов за один раз.