ввод и выравнивание последовательности белка

У меня есть скрипт для поиска мутированных позиций в последовательности белка. Следующий сценарий будет делать это.

import pandas as pd #data analysis python module
data =     'MTAQDDSYSDGKGDYNTIYLGAVFQLN,MTAQDDSYSDGRGDYNTIYLGAVFQLN,MTSQEDSYSDGKGNYNTIMPGAVFQLN,MTAQDDSYSDGRGDYNTIMPGAVFQLN,MKAQDDSYSDGRGNYNTIYLGAVFQLQ,MKSQEDSYSDGRGDYNTIYLGAVFQLN,MTAQDDSYSDGRGDYNTIYPGAVFQLN,MTAQEDSYSDGRGEYNTIYLGAVFQLQ,MTAQDDSYSDGKGDYNTIMLGAVFQLN,MTAQDDSYSDGRGEYNTIYLGAVFQLN' #protein sequences

df = pd.DataFrame(map(list,data.split(',')))

I = df.columns[(df.ix[0] != df).any()] 

J = [pd.get_dummies(df[i], prefix=df[i].name+1, prefix_sep='') for i in I] 

print df[[]].join(J)

Здесь я дал данные (жестко закодированные), то есть входные последовательности белков. Обычно в приложении пользователь должен давать входные последовательности, то есть я имею в виду мягкое кодирование. Также здесь не выполняется выравнивание. Я читаю учебник по биопитону, и у меня есть следующий скрипт, но я не знаю, как добавить эти скрипты выше одного.

from Bio import AlignIO
alignment = AlignIO.read("c:\python27\proj\data1.fasta", "fasta")
print alignment

Как я могу это сделать? То, что я пробовал:

>>> import sys

>>> import pandas as pd

>>> from Bio import AlignIO

>>> data=sys.stdin.read()
    MTAQDDSYSDGKGDYNTIYLGAVFQLN
    MTAQDDSYSDGRGDYNTIYLGAVFQLN
    MTSQEDSYSDGKGNYNTIMPGAVFQLN
    MTAQDDSYSDGRGDYNTIMPGAVFQLN
    MKAQDDSYSDGRGNYNTIYLGAVFQLQ
    MKSQEDSYSDGRGDYNTIYLGAVFQLN
    MTAQDDSYSDGRGDYNTIYPGAVFQLN
    MTAQEDSYSDGRGEYNTIYLGAVFQLQ
    MTAQDDSYSDGKGDYNTIMLGAVFQLN
    MTAQDDSYSDGRGEYNTIYLGAVFQLN
    ^Z
>>> df=pd.DataFrame(map(list,data.split(',')))
>>> I=df.columns[(df.ix[0]!=df).any()]
>>> J=[pd.get_dummies(df[i],prefix=df[i].name+1,prefix_sep='')for i in I]
>>> print df[[]].join(J)

Но он дает пустой DataFrame в качестве вывода.

Я также пробовал следовать, но я не знаю, как загрузить эти последовательности в мой скрипт

while 1:
 var=raw_input("Enter your sequence here:")
 print "you entered ",var

Пожалуйста, помогите мне.

1
Я узнаю этот код (!)
добавлено автор Andy Hayden, источник
Я узнаю этот код (!)
добавлено автор Andy Hayden, источник
для третьего фрагмента кода: убедитесь, что данные разделены запятой, а не пробелом или новой строкой, или измените data.split (',') , например, data.split ('\ n «)
добавлено автор Francesco Montesano, источник
для третьего фрагмента кода: убедитесь, что данные разделены запятой, а не пробелом или новой строкой, или измените data.split (',') , например, data.split ('\ n «)
добавлено автор Francesco Montesano, источник

2 ответы

Когда вы читаете данные через:

sys.stdin.read()

Последовательности отделяются с помощью '\ n' , а не ',' (печать data будет подтверждать, имеет ли это значение, это может зависит от системы), поэтому вы должны разделить, используя это:

df = pd.DataFrame(map(list,data.split('\n')))

Хороший способ проверить это - пройти через строку, где вы увидите, что df - это одна строка DataFrame (которая затем распространяется, чтобы сделать I empty).

Кроме того: что хорошо написанный фрагмент кода , который вы используете! :)

1
добавлено

Когда вы читаете данные через:

sys.stdin.read()

Последовательности отделяются с помощью '\ n' , а не ',' (печать data будет подтверждать, имеет ли это значение, это может зависит от системы), поэтому вы должны разделить, используя это:

df = pd.DataFrame(map(list,data.split('\n')))

Хороший способ проверить это - пройти через строку, где вы увидите, что df - это одна строка DataFrame (которая затем распространяется, чтобы сделать I empty).

Кроме того: что хорошо написанный фрагмент кода , который вы используете! :)

1
добавлено
Python
Python
7 654 участник(ов)

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/577926

Python beginners
Python beginners
4 449 участник(ов)

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Не злоупотребляйте стикерами. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Статистика тут: https://grstats.me/chat/x4qym2k5uvfkr3al6at7

Верстка сайтов HTML/CSS/JS/PHP
Верстка сайтов HTML/CSS/JS/PHP
3 439 участник(ов)

Правила группы: напишите !rules в чате. Группа Вк: vk.com/web_structure Freelancer: @web_fl Веб Дизайн: @dev_design Маркетолог: @topmarkening Автор: @M_Boroda

CSS — русскоговорящее сообщество
CSS — русскоговорящее сообщество
1 502 участник(ов)

Сообщество любителей CSS Возникли проблемы с CSS? – пиши сюда, обсудим и предложим самое лучшее решение Работа: @css_ru_jobs Правила: https://teletype.in/@css_ru/r1EWtQ2w7 Приходите в наши чаты @javascript_ru и @frontend_ru Флуд: @css_flood

pro.python
pro.python
1 090 участник(ов)

Сообщество разработчиков под Python Создатель: @rodgelius

Чат — Типичный Верстальщик
Чат — Типичный Верстальщик
1 080 участник(ов)

Основной канал: @tpverstak Обратная связь: @annblok Все ссылки на соц.сети проекта: http://taplink.cc/tpverstak ПРАВИЛА ЧАТА — https://teletype.in/@annblok/BygPgC3E7

Rude Python
Rude Python
971 участник(ов)

Python без „девочек”, здесь матерятся и унижают Django. Not gay friendly. Правила: t.me/rudepython/114107 @rudepython | t.me/rudepython

rupython
rupython
509 участник(ов)

Группа создана с целью оперативного получения ответов на возникающие вопросы по разработке на яп python, смежные темы, а также человеческого общения. Приветствую!

Python-programming
Python-programming
266 участник(ов)

Чат группы вконтакте https://vk.com/python_community

Веб-Технологи: UI/UX, Вёрстка, Фронтенд
Веб-Технологи: UI/UX, Вёрстка, Фронтенд
167 участник(ов)

Всё про веб-дизайн и вёрстку. А также: HTML, CSS, флекс и бутстрапы, шаблонизаторы, препроцессоры, методологии, аглифаеры, улучшаторы и обфускаторы. Обсуждаем темы юзабилити, устраиваем А/В тесты лендингов, и проводим аудит.

DTP :: @DTPublish
DTP :: @DTPublish
147 участник(ов)

Обсуждаемые темы: полиграфия, препресс, верстка, дизайн, иллюстрации, скрипты, плагины. Канал - @DTPublishing

css_jobs
css_jobs
26 участник(ов)

Чат для вопросов по css и html: @css_ru Флуд: @css_flood Канал с вакансиями и резюме: @css_jobs_feed

css_флуд
css_флуд
10 участник(ов)