54973
vcfファイルには最初の何行にも渡って#で書かれた箇所があり、読み込んだ時に#も一緒に出力してしまいます。その結果、counterでは{('3':987, '7':654, ・・・'#~~':1, '#~~':1)}といった感じに#のものまでカウントされてしまいます。この#を消す方法はあるのでしょうか?
また、カウントの順番を多い順ではなく、1,2,3と番号順にすることはできるのでしょうか?
import sys
import os
from collections import Counter
count = []
with open('test.vcf','r') as file:
lines = file.read().split('\n')
for line in lines:
a = line.split('\t')
CHR = a[0]
count.append(CHR)
c = Counter(count)
print(c)