Расчёт дивергенции последовательностей
p = nd / n, где nd — несовпадения, n — длина без гэпов. Поддерживаются ДНК (A,T,G,C), РНК (A,U,G,C) и белки (A-Z). Гэпы ("-") игнорируются.
Как рассчитывается p-distance?
p-distance (пропорциональная дистанция) — доля позиций, в которых две выравненные последовательности различаются, относительно общего числа позиций (исключая гэпы).
0.00 – 0.05: ██░░░░░░░░ Идентичные / почти идентичные
0.05 – 0.15: ████░░░░░░ Низкая дивергенция
0.15 – 0.30: ██████░░░░ Умеренная дивергенция
0.30 – 0.50: ████████░░ Высокая дивергенция
0.50 – 1.00: ██████████ Очень высокая дивергенция
Формула: p = nd / n, где nd — число несовпадающих позиций, n — общее число сравниваемых позиций (без гэпов).
Важно: p-distance недооценивает истинное эволюционное расстояние при высоком уровне дивергенции (>0.3) из-за множественных замен. Для больших дистанций используйте другие модели (JC69, K80, GTR).
Результат расчёта
📖 Примеры последовательностей
Идентичные
p-distance = 0 (0%)
Одно несовпадение
p-distance = 0.125 (12.5%)
Три различия
p-distance = 0.2 (20%)
Полностью разные
p-distance = 1 (100%)
С гэпом (игнорируется)
Гэп пропущен, p-distance = 0
РНК-последовательности
p-distance = 0.125 (12.5%)
Прямо сейчас идёт набор на курс по Биологии!
А ещё мы раздаём бесплатные промокоды на любой второй курс. Просто выберите и оплатите понравившейся Вам курс и получите второй совершенно бесплатно.
