HISAT2 Bowtie2 提取唯一比對 unique mapping reads
時(shí)間:2026-05-05 02:52:19HISAT2和Bowtie2是比對兩種??常用的基因組比對工具,用于提取唯一比對的比對unique mapp(′?`)ing reads。
HISAT2 Bowtie2 提取唯一比對(dui) unique mapping reads
在生物信息學(xué)中,比對比對是比對分析RNA-seq數據的關(guān)鍵步??驟之一,比對是比對將測序數據與參考基因組進(jìn)行匹配的過(guò)程,以確定每個(gè)reads在基因組上的比對位置,HISAT2和Bowtie2是比對常用的比對工具,它們可以有效地將reads與參考基因組進(jìn)行比對,比對在本┐(′?`)┌篇文章中,比對我們將介紹如何使用HISAT2和Bowtie2提取唯一比對的比對unique mapping reads。
1、比對HISAT2簡(jiǎn)介
HISAT2是比對一個(gè)快速而準確的RNA-seq比對工具??,它使用了一種稱(chēng)為k-mer的比對方法來(lái)加速比對過(guò)程(cheng),HISAT2支持多種比對模式,比對包括雙末端比對、比對單末端比對和多重比對??等,HISAT2還提供了豐富的參數選項,可以根據不同的需求進(jìn)行調整。
2、Bowtie2簡(jiǎn)介
Bowtie2是一個(gè)高性能的比對工具,它可以將reads與參考基因組進(jìn)行比對,并??輸(′ω`*)出比對結果,Bowtie2ヽ(′ー`)ノ支持多種比對模式,包括雙末端比對、單末端比對和多重??比對等,Bowtie2還提???供了豐富的??參數選項,可以根據不同的需求進(jìn)行調整。
3、提取唯一比對的uniqu(′?_?`)e mapping reads
在使用HISAT2或Bowtie2進(jìn)行比對后,我們可以使用一些工具(ju)來(lái)提取唯一比對的unique mapping reads,這些工具可以幫助我們篩選出只與參考基因組匹配一次的reads,從(cong)而減少??冗余的比對結果。
3、1 使用Samtools提取unique mapping reads
Samtools是一個(gè)用于處理SAM/??BAM文件的工具集,它提供了許多有??用的功能,包括提取unique mapping reads,我們可以使用以下命令來(lái)提取unique mapping reads:
samtools view -b -f 4 inp??ut.bam > output.bam
input.bam是輸入的SAM/BAM文件,output.bam是輸出的SAM/BAM文件。-b選項表示只輸出讀取的堿基序列??,-f 4選項表示只輸出unique mapping reads。
3、2 使用Picard提取unique mapping reads
Picard是一個(gè)用于處理SAM/BAM文件的工具集,它提供了許多有用的功能,包括提取uniqu(′ω`*)e mapping reads,我們可以使用以下ヽ(′▽?zhuān)?ノ命令來(lái)提取uni??que mapping reads:
java -jar picard.jヾ(′ω`)?ar ExtractIlluminaBases --IN?PUT input.bam --OUTPUT output.bam --VALIDATION_STRINGENCY(′_ゝ`) LENIENT --MAX_RECORDS_IN_RAM 500000000 --MINIMUM_BASE_QUALITY 20 --EXCLUDE_INDELS true --OVERWRITE --CREATE_INDEX true --VALIDATION_LEVEL SILENT --ASSUME_S(/ω\)ORTED true --METRICS_F(′?_?`)ILE metrics.txt --READ_GROUP_TAGS RG:Z:sample --VALIDATION_REGIONS regions.bed --FILTERING_MODE AUTOMATIC --FILTERING_THRESHOLD 100??0000 --FILTERING_QUE?RY_NAME(′ω`*) "adapter" --FILTERING_MULTIMAP_DISTANCE 1000000 --FILTERING_MULTIMAP_PROBABILITY 0.95 --FILTERING_NOT_FOUND_RATE 0.1 --FILTE??RING_DUPLIヽ(′▽?zhuān)?ノCATE_RATE 0.1 --FILTER┐(′д`)┌ING_MISMATCHED_RATE 0.1 --FILTERING_LOW_QUALITY_BASES NONE --FILTERINGヽ(′ー`)ノ_Iヽ(′ー`)ノLLUMINACLIP TruSeq3-PE.fa:2:30:10 --FILTERING_INTERVAL 100 --FILTER(′;д;`)ING_ADAPTER_SHヽ(′▽?zhuān)?ノIFT 10 --FILTERING_ADA???PTER_SIZE 3 --FILTERING_MAX_N_CON(′?ω?`)SE??CUTIVE_ADAPTERS 1 --FILTEヾ(′?`)?RING_MIN_L??ENGTH 36 --FILTERING_MAX_LENGTH(╯°□°)╯︵ ┻━┻ 150 --FILTERING_MINIMUM_BASEQUALITY 20 --FILTERING_SKI??P_STRANDED true --FILTERING_FORCECAR┐(′д`)┌D true --FILTERING_REMOVE_DUPLICATES true --FILTERING_MAPQ 20 --FILTERING_DISCARD_SECONDARY true --FILTERING_PRIMARY_ALIGNMENTS true --FILTERING_OVERLAPPING_???READS false --FILTERINGヾ(′?`)?_INTERVALS file:in??tervals.list --FILT??ERING_INTERVALS file:intervals.list
input.bam是輸入的SAM/BAM文件,output.bam是輸出的SAM/BAM文件,其他選項可以根據需要進(jìn)行設置。
4、相關(guān)問(wèn)題與解答
4、1 Q: 什么是k-mer?
A: k-mer是指長(cháng)度為k的連續DNA序列,在比對過(guò)程中,k-mer可以用于快速定位reads在參考基因組上的位置,如果(???)一個(gè)read的長(cháng)度為100bp,那么它的k-m??er就是所有長(cháng)度為100bp的連續DNA序列。
4、2 Q: 什么是unique map(′?ω?`)ping reads?
4、3 Q: 為什么需要提取unique mapping reads?
A: unique mappiヽ(′▽?zhuān)?ノng reads可以減少冗余的比對結果,從而提高分析的準確性和效率,如果不去除冗余的比對結果,可能會(huì )導致分析結果的誤差和不確定性。
客服電話(huà)18905391541
Copyright ? 2012-2018 天津九安特機電工程有限公司 版權所有 備案號:
客服電話(huà)15338521262