“ZAMONAVIY BIOLOGIYANING DOLZARB MUAMMOLARI VA
RIVOJLANISH ISTIQBOLLARI”
xalqaro ilmiy-amaliy anjuman materiallari
adu.uz
universaljurnal.uz
339
ИДЕНТИФИКАЦИИ
ПОТЕНЦИАЛЬНЫХ
ОБЛАСТЕЙ
КОДИРОВАНИЯ
БЕЛКОВ
В
ПОСЛЕДОВАТЕЛЬНОСТИ
ДНК
Умарова
Диёра
Дилмуроджон
кизи
Магистр
по
направлению
Биотехнология
при
АГУ
diyoraumarova19980212@gmail.com
https://doi.org/10.5281/zenodo.15601783
Аннотация
:
Открытая
рамка
считывания
-
это
последовательность
ДНК
,
начинающаяся
со
старт
-
кодона
и
не
содержащая
в
себе
стоп
-
кодона
,
которая
возможно
кодирует
белок
.
Программа
ORF Finder (Open Reading Frame Finder)
идентифицирует
открытые
рамки
считывания
(ORFs)
на
обеих
цепях
ДНК
.
Эта
программа
ищет
открытые
рамки
считывания
в
геномной
последовательности
ДНК
,
которую
вы
вводите
.
При
помощи
программы
ORF Finder
вы
можете
идентифицировать
открытые
рамки
считывания
на
обеих
цепях
ДНК
.
Ключевые
слова
:
Открытая
рамка
считывания
,
стоп
-
кодон
,
старт
-
кодон
,
последовательность
кодонов
,
белок
, ORF Finder,
генетический
код
,
длинная
рамка
.
Annotation:
An open reading frame is a DNA sequence starting with a start codon and not
containing a stop codon, which may encode a protein. The ORF Finder (Open Reading Frame Finder)
program identifies open reading frames (ORFs) on both DNA strands. This program searches for
open reading frames in the genomic DNA sequence that you are entering. Using the ORF finder
program, you can identify open reading frames on both DNA strands.
Keywords:
Open reading frame, Stop Codon, Start Codon, Codon sequence, Protein, ORF
Finder, Genetic Code, Long frame.
Открытая
рамка
считывания
(
англ
. Open Reading Frame, ORF) —
это
последовательность
нуклеотидов
в
составе
ДНК
или
РНК
,
которая
способна
кодировать
белок
.
Отсутствие
стоп
-
кодонов
(
в
случае
РНК
—
обычно
UAA, UGA
и
UAG)
на
достаточно
длинном
участке
последовательности
после
стартового
кодона
(
в
подавляющем
большинстве
случаев
— AUG),
считается
основным
признаком
того
,
что
на
данном
участке
присутствует
ORF.
При
определении
рамки
считывания
применяются
алгоритмы
,
которые
учитывают
такие
различия
как
,
отличие
стартового
и
терминирующего
кодонов
от
канонических
,
а
также
супрессию
стоп
-
кодонов
при
трансляции
у
некоторых
организмов
.
Наличие
достаточно
протяженной
открытой
рамки
считывания
,
является
знаком
того
,
что
в
данном
участке
гена
,
может
кодироваться
некий
полипептид
.
Важное
и
распространенное
применение
открытых
рамок
считывания
(ORF)
в
предсказании
генов
является
использование
их
в
качестве
доказательств
.
Длинные
ORF
часто
используются
вместе
с
другими
доказательствами
для
первоначальной
идентификации
потенциальных
областей
кодирования
белков
или
функциональных
областей
кодирования
РНК
в
последовательности
ДНК
.
В
качестве
индикаторов
областей
ДНК
,
предположительно
кодирующих
белки
,
можно
использовать
несколько
характеристик
.
Одна
из
таких
характеристик
-
достаточная
длина
открытой
рамки
считывания
.
В
точном
определении
начала
кодирующей
последовательности
может
быть
полезно
также
распознавание
примыкающих
последовательностей
Козак
(5’)-
accaugg-(3’)-
специфического
нуклеотидного
окружения
старт
-
кодона
. «Kozak sequence»
названа
,
в
честь
Марилин
Козак
,
которая
открыла
её
[2].
Хорошим
средством
опознавания
ORF
в
области
,
расположенной
выше
старт
-
кодона
генов
прокариотов
,
является
обнаружение
сайтов
связывания
рибосом
(
которые
помогают
направлять
рибосомы
к
правильным
позициям
начала
трансляции
) [2].
Альтернативный
сплайсинг
у
эукариот
может
привести
к
тому
,
что
потенциальные
продукты
гена
будут
иметь
разные
длины
,
поскольку
в
конечной
транскрибированной
мРНК
могут
быть
оставлены
не
все
экзоны
(
хотя
порядок
расположения
экзонов
всегда
сохраняется
) [2].
“ZAMONAVIY BIOLOGIYANING DOLZARB MUAMMOLARI VA
RIVOJLANISH ISTIQBOLLARI”
xalqaro ilmiy-amaliy anjuman materiallari
adu.uz
universaljurnal.uz
340
Программа
ORF Finder (Open Reading Frame Finder)
идентифицирует
открытые
рамки
считывания
(ORFs)
на
обеих
цепях
ДНК
.
Доступ
к
ней
можно
получить
по
ссылке
http://www.ncbi.nlm.nih.gov. C
копируйте
последовательность
ДНК
(
о
цифрах
и
пробелах
можно
не
беспокоиться
,
программа
их
автоматически
пропустит
)
в
текстовое
поле
формы
,
в
окошке
выбора
генетического
кода
выберите
подходящий
вам
генетический
код
.
Начало
,
конец
и
рамку
для
ORF
длиннее
60
кодонов
занесите
в
таблицу
.
Вы
получите
список
обнаруженных
открытых
рамок
.
Шесть
белых
полосок
в
выдаче
ORF Finder
изображают
исходную
последовательность
в
шести
возможных
рамках
считывания
,
в
порядке
+1, +2, +3
(
прямая
цепь
), –1, –2, –3 (
обратная
цепь
),
а
бирюзовые
полоски
—
найденные
в
данной
рамке
ORFs.
Щёлкните
мышью
найденную
ORF,
чтобы
получить
её
более
подробное
описание
.
Длина
ORF
должна
делиться
на
3,
а
предположительная
функция
белка
описана
по
-
русски
.
Если
одна
рамка
полностью
содержится
внутри
другой
,
можно
рассматривать
только
большую
из
них
.
Если
нажать
кнопку
BLAST
на
страничке
с
подробным
описанием
рамки
,
можно
найти
программой
blastp
предположительные
гомологи
предсказанного
гена
.
На
открывшейся
странице
форматирования
результатов
в
строке
Show
отметьте
Advanced view,
в
строке
Limit results
выставите
во
всех
трёх
полях
50; (
для
начала
)
нажмите
кнопку
View report.
Все
белковые
хиты
будут
расположены
в
порядке
возрастания
e-value.
Чем
меньше
e-value,
тем
лучше
.
Значимыми
можно
считать
хиты
с
e-value <10–4.
Если
из
двух
рамок
со
значительным
перекрытием
(>20
нуклеотидов
)
одна
подтверждается
blast'
ом
,
а
другая
нет
,
последняя
,
скорее
всего
,
не
является
геном
. ORF Finder
ищет
открытые
рамки
считывания
(ORF)
в
последовательности
ДНК
,
которую
вы
вводите
.
Программа
возвращает
диапазон
каждой
ORF
вместе
с
ее
трансляцией
белка
.
Используйте
ORF Finder
для
поиска
недавно
секвенированной
ДНК
для
потенциальных
сегментов
кодирования
белка
. ORF Finder
поддерживает
весь
алфавит
IUPAC
и
несколько
генетических
кодов
[4].
Определить
открытую
рамку
считывания
у
прокариотов
легко
,
не
предъявляет
трудностей
.
У
эукариот
,
наоборот
,
наличие
интронов
усложняет
отыскивание
открытой
рамки
считывания
.
Самая
длинная
рамка
,
не
прерываемая
стоп
-
кодоном
,
считается
правильной
рамкой
считывания
.
Именно
её
допускается
считать
открытой
рамкой
считывания
.
Отыскать
начало
открытой
рамки
считывания
труднее
,
чем
найти
её
конец
.
Программа
ORF finder (Open
Reading Frame finder)
ищет
открытые
рамки
считывания
в
геномной
последовательности
ДНК
,
которую
вы
вводите
.
При
помощи
программы
ORF finder
вы
можете
идентифицировать
открытые
рамки
считывания
на
обеих
цепях
ДНК
.
Одно
из
преимуществ
этой
программы
в
том
,
что
при
копировании
последовательности
ДНК
в
текстовое
поле
формы
,
о
цифрах
и
пробелах
можно
не
беспокоиться
,
программа
сама
их
автоматически
пропустит
.
Ещё
одной
положительной
стороной
программы
ORF finder
является
то
,
что
в
окошке
выбора
генетического
кода
,
программа
сама
предъявляет
список
кодов
,
вам
только
остается
выбрать
подходящий
генетический
код
.
Также
можно
изменять
минимальную
длину
открытой
рамки
считывания
и
ввести
необходимое
вам
количество
нуклеотидов
.
Из
трёх
данных
категорий
можно
выбрать
подходящий
стартовый
кодон
открытой
рамки
считывания
для
использования
.
На
страничке
с
подробным
описанием
рамки
есть
кнопка
BLAST,
при
нажатии
её
можно
найти
предположительные
гомологи
предсказанного
гена
при
помощи
программы
blastp.
Список
использованной
литературы
:
1.
Глик
Б
.,
Пастернак
Дж
.
Молекулярная
биотехнология
.
Принципы
и
применение
:
Пер
.
с
англ
. /
под
ред
.
Н
.
К
.
Янковского
. –
М
.:
Мир
. 2002. 2002
2.
Огурцов
А
.
Н
.
Основы
биоинформатики
.
Харьков
. 2013
3.
Порозов
Ю
.
Б
.
Биоинформатика
.
Санкт
-
Петербург
. 2012
4.
https://www.bioinformatics.org
