Частота рестрикционных сайтов
Формула для случайной ДНК: f = (1/4)ⁿ
где n — длина сайта рестрикции в п.н. Для реалистичной оценки используется композиционная поправка с учётом GC-состава генома.
Как это работает?
Базовая модель (равновероятная ДНК): частота сайта длиной n = (1/4)ⁿ. Это вероятность того, что в случайной позиции все n нуклеотидов будут соответствовать конкретному сайту. Например, для 6-п.н. сайта частота = 1/4096 ≈ 0.000244, т.е. ~1 сайт на 4 кб.
Поправка на GC-состав: для GC-богатых геномов GC-богатые сайты встречаются чаще, AT-богатые — реже. Калькулятор показывает диапазон возможных частот (минимальную для AT-сайтов и максимальную для GC-сайтов) и среднюю ожидаемую частоту для сайта со средним GC-составом.
Примечание: Реальная частота может отличаться из-за неравномерного распределения нуклеотидов и запрещённых последовательностей.
Результат расчёта
📖 Примеры рестриктаз
4-п.н. сайты
AluI (AGCT), частота ~1/256 п.н. (~1 сайт на 256 п.н.)
5-п.н. сайты
EcoRII (CCWGG), частота ~1/1024 п.н.
6-п.н. сайты
EcoRI (GAATTC), частота ~1/4096 п.н. (~4 кб)
7-п.н. сайты
Редкие рестриктазы, частота ~1/16384 п.н.
8-п.н. сайты
NotI (GCGGCCGC), частота ~1/65536 п.н. (~65 кб)
GC-богатый геном (70%)
GC-сайт в GC-богатом геноме встречается чаще
Прямо сейчас идёт набор на курс по Биологии!
А ещё мы раздаём бесплатные промокоды на любой второй курс. Просто выберите и оплатите понравившейся Вам курс и получите второй совершенно бесплатно.
