reciprocal_smallest_distance

Скріншот програми:
reciprocal_smallest_distance
Дані програми:
Версія: 1.1.5
Дата завантаження: 20 Feb 15
Ліцензія: Безкоштовно
Популярність: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance є попарно алгоритм Ортолог, який використовує глобальну вирівнювання послідовності і максимальної правдоподібності еволюційне відстань між послідовностями точно визначає ортологи між геномами.
Установка з архів
Завантажити та розпакувати останньою версією з GitHub:
CD ~
локон -L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Смоли xvz
Встановіть reciprocal_smallest_distance, переконавшись, що використовувати Python 2.7:
CD reciprocal_smallest_distance-версія
Python setup.py встановити
Використання RSD знайти Othologs
У наступному прикладі команди продемонструвати основні способи запуску rsd_search. Кожен виклик rsd_search потрібно вказати місце розташування файлу послідовності FASTA форматі протягом двох геномів, називається запит і тематичні геноми. Їх порядок довільний, але якщо ви використовуєте опцію --ids, ідентифікатори повинні прийти з генома запиту. Ви також повинні вказати файл для запису результатів з Ортолог знайдених алгоритму RSD. Формат вихідного файлу містить один Ортолог в рядку. Кожен рядок містить порядковий ідентифікатор запиту, за умови послідовність ID, і відстань (розраховується за формулою codeml) між послідовностями. Ви можете вказати файл, що містить ідентифікатори, використовуючи опцію --ids. Тоді RSD буде шукати тільки Ортолог для тих ідентифікаторів. Використання --divergence і --evalue, у вас є можливість використовувати різні пороги від значень за замовчуванням.
Отримати допомогу в тому, щоб запустити rsd_search, rsd_blast або rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Знайти ортологи між усіма послідовностями в запиті та за умови геномів, використовуючи дивергенції за замовчуванням і Evalue пороги
приклади rsd_search -q / геноми / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject генома = приклади / геноми / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Знайти ортологи з використанням декількох дивергенції і Evalue пороги не за замовчуванням
приклади rsd_search -q / геноми / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject генома = приклади / геноми / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Це не потрібно відформатувати файл FASTA для вибуху або обчислити Вибух на тому, що rsd_search зробить це за вас.
Однак, якщо ви плануєте запустити rsd_search кілька разів для одних і тих же геномів, особливо для великих геномів, ви можете заощадити час, використовуючи rsd_format в preformatting в FASTA файли і rsd_blast для попереднього обчислення BLAST хітів. При запуску rsd_blast, упевніться, щоб використовувати --evalue як великий, як найбільшого Evalue порога ви збираєтеся дати rsd_search.
Ось як відформатувати пару FASTA файлів на місці:
rsd_format -g приклади / геноми / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g приклади / геноми / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
А от як форматувати FASTA файли, поміщаючи результати в іншу директорію (поточний каталог в даному випадку)
rsd_format -g приклади / геноми / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g приклади / геноми / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Ось, як обчислити вперед і назад Вибух на (з використанням Evalue за замовчуванням):
rsd_blast -v -q приклади / геноми / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject генома = приклади / геноми / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-парад q_s.hits --reverse-парад s_q.hits
Ось, як обчислити прямому і зворотному вибух завдає rsd_search, використовуючи геноми, які вже були відформатовані для вибуху і не за замовчуванням Evalue
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject генома = Mycobacterium_leprae.aa
--forward-парад q_s.hits --reverse-парад s_q.hits
--no-формат --evalue 0,1
Знайти ортологи між усіма послідовностями в запиті і предметних геномів з використанням геномів, які вже відформатований для вибуху
rsd_search -q Mycoplasma_genitalium.aa
--subject генома = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-форматі
Знайти ортологи між усіма послідовностями в запиті і предметних геномів з використанням хітів, які вже були обчислені. Зверніть увагу, що --no-формат включені, тому що, так як Вибух на вже обчислені геноми не повинні бути відформатовані для вибуху.
rsd_search -v --query генома Mycoplasma_genitalium.aa
--subject генома = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-парад q_s.hits --reverse-парад s_q.hits --no-форматі
Знайти ортологи для конкретних послідовностей в геномі запиту. Для знаходження ортологи всього за кілька послідовностей, використовуючи --no-BLAST-кеш може прискорити обчислення. YMMV.
приклади rsd_search -q / геноми / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject генома = приклади / геноми / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-О Приклади / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids Приклади / Mycoplasma_genitalium.aa.ids.txt --no-BLAST-кеш
Вихідні формати
Ортологи можуть бути збережені в різних форматах за допомогою --outfmt можливість rsd_search. Формат за замовчуванням, --outfmt -1, відноситься до --outfmt 3. Натхненний UniProt DAT файлів, набір Ортолог починається з параметрами лінії, тобто 0 або більше Ортолог лінії, тобто кінець лінії. В використовувати параметри є ім'я запиту геном, ім'я суб'єкта геном, поріг розбіжність, і поріг Evalue. Кожен Ортолог знаходиться на одній лінії переліку послідовностей, ідентифікатор запиту, за умови послідовність ID, і максимальну оцінку відстані правдоподібності. Цей формат може представляти ортологи для декількох наборів параметрів в одному файлі, а також наборів параметрів, які не мають Ортолог. Тому він підходить для використання з rsd_search при вказівці декількох дивергенції і Evalue пороги.
Ось приклад, що містить комбінації 2 параметрів, один з яких не має ортологи:
PA tLACJO tYEAS7 t0.2 t1e-15
Або tQ74IU0 tA6ZM40 t1.7016
Або tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Оригінальний формат РСД, --outfmt 1, призначений для забезпечення зворотної сумісності. Кожен рядок містить Ортолог, представлене як суб'єкт послідовність ID, запитів послідовність ID, і максимальній оцінці відстані правдоподібності. Це може представляти тільки один набір Ортолог у файлі.
Приклад:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Також для забезпечення зворотної сумісності є формат використовується всередині Roundup (http://roundup.hms.harvard.edu/), який, як оригінальному форматі RSD, крім Ідентифікатор стовпця послідовності запиту перед предметом послідовності ID.
Приклад:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Вимоги

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4,4
  • Kalign 2,04

Схожі програми

tapir
tapir

11 May 15

RFLP planner
RFLP planner

3 Jun 15

goby
goby

14 Apr 15

LSim
LSim

2 Jun 15

reciprocal_smallest_distance

Коментар не знайдено
додати коментар
Включіть картинки!
Пошук за категоріями