如何通过Python程序根据外显子位置构建CDS序列?

2026-06-10 21:322阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计138个文字,预计阅读时间需要1分钟。

如何通过Python程序根据外显子位置构建CDS序列?

已知文件genomic_dna.txt内容如下:TCGATCGTACCGTCGACGATGCTACGATCGTCGATCGTAGTCGATCATCGATCGATCGACTGATCGATCGATCGATCGATATCGATCGATATCATCGATGCATCGATCATCGATCGATCGATCGATCGATCATATGTCAGTCGATGCATCGTAGCATCGTATAGTAGCTACGTAGCTACGATCGATCGATCGATCGTAGCTAGCTAGCT

如何通过Python程序根据外显子位置构建CDS序列?

已知

genomic_dna.txt

TCGATCGTACCGTCGACGATGCTACGATCGTCGATCGTAGTCGATCATCGATCGATCGACTGATCGATCGATCGATCGATCGATATCGATCGATATCATCGATGCATCGATCATCGATCGATCGATCGATCGATCGATCATATGTCAGTCGATGCATCGTAGCATCGTATAGTAGCTACGTAGCTACGATCGATCGATCGATCGTAGCTAGCTAGCTAGATCGATCATCATCGTAGCTAGCTCGACTAGCTACGTACGATCGATGCATCGATCGTAGCTAGTACGATCGCGTAGCTAGCATGCTACGTAGATCGATCGATGCATGCTAGCTAGCTAGCTACGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGTAGCTAGCTACGATCGATGCTACGTAGATCGATCGCTAGTAGATCGATCGCTAGCTAGCTGACTAGTACGCTGCTAGTAGTCAGCTAGATCGATGCTAGTCA

exons.txt

5,58
72,133
190,276
340,398

编码

genomic_dna=open("genomic_dna.txt").read()
exon_locations=open("exons.txt")
output=open("coding_sequence.txt","w")

coding_sequence=""
forlineinexon_locations:
positions=line.split(',')
start=int(positions[0])
stop=int(positions[1])
exon=genomic_dna[start:stop]
coding_sequence=coding_sequence+exon

output.write(coding_sequence)
output.close()

结果

coding_sequence.txt

CGTACCGTCGACGATGCTACGATCGTCGATCGTAGTCGATCATCGATCGATCGCGATCGATCGATATCGATCGATATCATCGATGCATCGATCATCGATCGATCGATCGATCGACGATCGATCGATCGTAGCTAGCTAGCTAGATCGATCATCATCGTAGCTAGCTCGACTAGCTACGTACGATCGATGCATCGATCGTACGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGTAGCTAGCTACGATCG


作者:Bioinfarmer

若要及时了解动态信息,请关注同名微信公众号:Bioinfarmer。

本文共计138个文字,预计阅读时间需要1分钟。

如何通过Python程序根据外显子位置构建CDS序列?

已知文件genomic_dna.txt内容如下:TCGATCGTACCGTCGACGATGCTACGATCGTCGATCGTAGTCGATCATCGATCGATCGACTGATCGATCGATCGATCGATATCGATCGATATCATCGATGCATCGATCATCGATCGATCGATCGATCGATCATATGTCAGTCGATGCATCGTAGCATCGTATAGTAGCTACGTAGCTACGATCGATCGATCGATCGTAGCTAGCTAGCT

如何通过Python程序根据外显子位置构建CDS序列?

已知

genomic_dna.txt

TCGATCGTACCGTCGACGATGCTACGATCGTCGATCGTAGTCGATCATCGATCGATCGACTGATCGATCGATCGATCGATCGATATCGATCGATATCATCGATGCATCGATCATCGATCGATCGATCGATCGATCGATCATATGTCAGTCGATGCATCGTAGCATCGTATAGTAGCTACGTAGCTACGATCGATCGATCGATCGTAGCTAGCTAGCTAGATCGATCATCATCGTAGCTAGCTCGACTAGCTACGTACGATCGATGCATCGATCGTAGCTAGTACGATCGCGTAGCTAGCATGCTACGTAGATCGATCGATGCATGCTAGCTAGCTAGCTACGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGTAGCTAGCTACGATCGATGCTACGTAGATCGATCGCTAGTAGATCGATCGCTAGCTAGCTGACTAGTACGCTGCTAGTAGTCAGCTAGATCGATGCTAGTCA

exons.txt

5,58
72,133
190,276
340,398

编码

genomic_dna=open("genomic_dna.txt").read()
exon_locations=open("exons.txt")
output=open("coding_sequence.txt","w")

coding_sequence=""
forlineinexon_locations:
positions=line.split(',')
start=int(positions[0])
stop=int(positions[1])
exon=genomic_dna[start:stop]
coding_sequence=coding_sequence+exon

output.write(coding_sequence)
output.close()

结果

coding_sequence.txt

CGTACCGTCGACGATGCTACGATCGTCGATCGTAGTCGATCATCGATCGATCGCGATCGATCGATATCGATCGATATCATCGATGCATCGATCATCGATCGATCGATCGATCGACGATCGATCGATCGTAGCTAGCTAGCTAGATCGATCATCATCGTAGCTAGCTCGACTAGCTACGTACGATCGATGCATCGATCGTACGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGTAGCTAGCTACGATCG


作者:Bioinfarmer

若要及时了解动态信息,请关注同名微信公众号:Bioinfarmer。