NCBI Triticum urartu Annotation Release 100

The RefSeq genome records for Triticum urartu were annotated by the NCBI Eukaryotic Genome Annotation Pipeline, an automated pipeline that annotates genes, transcripts and proteins on draft and finished genome assemblies. This report presents statistics on the annotation products, the input data used in the pipeline and intermediate alignment results.

The annotation products are available in the sequence databases and on the FTP site.

This report provides:

Annotation Release information: The name of the release, important dates, the software version
Assemblies: A brief description of the annotated assembly(ies)
Gene and feature statistics: The counts and characteristics of the annotated features
BUSCO results: Annotation completeness assessed with BUSCO
Alignment of the annotated proteins to a set of high-quality proteins: The number of annotated proteins with hits to a set of high-quality proteins
Masking of genomic sequence: How much of the genome was masked
Transcript and protein alignments: The number and type of evidence retrieved from public databases and used for gene prediction

For more information on the annotation process, please visit the NCBI Eukaryotic Genome Annotation Pipeline page.

Annotation Release information

This annotation should be referred to as NCBI Triticum urartu Annotation Release 100

Annotation release ID: 100
Date of Entrez queries for transcripts and proteins: Jun 8 2022
Date of submission of annotation to the public databases: Jun 16 2022
Software version: 9.0

Assemblies

The following assemblies were included in this annotation run:

Assembly name	Assembly accession	Submitter	Assembly date	Reference/Alternate	Assembly content
Tu2.1	GCF_003073215.2	Institute of Genetics and Developmental Biology Chinese Academy of Sciences	04-30-2018	Reference	8 assembled chromosomes; unplaced scaffolds

Gene and feature statistics

Counts and length of annotated features are provided below for each assembly.

Feature counts

Feature	Tu2.1
Genes and pseudogenes	50,810
protein-coding	35,768
non-coding	8,533
Transcribed pseudogenes	0
Non-transcribed pseudogenes	6,509
genes with variants	9,597
Immunoglobulin/T-cell receptor gene segments	0
other	0
mRNAs	48,501
fully-supported	45,069
with > 5% ab initio	2,042
partial	1,451
with filled gap(s)	854
known RefSeq (NM_)	0
model RefSeq (XM_)	48,501
non-coding RNAs	23,893
fully-supported	21,526
with > 5% ab initio	0
partial	27
with filled gap(s)	27
known RefSeq (NR_)	0
model RefSeq (XR_)	22,606
pseudo transcripts	0
fully-supported	0
with > 5% ab initio	0
partial	0
with filled gap(s)	0
known RefSeq (NR_)	0
model RefSeq (XR_)	0
CDSs	48,561
fully-supported	45,069
with > 5% ab initio	2,229
partial	1,332
with major correction(s)	237
known RefSeq (NP_)	0
model RefSeq (XP_)	48,561

Detailed reports

The counts below do not include pseudogenes.

Feature lengths

Feature	Count	Mean length (bp)	Median length (bp)	Min length (bp)	Max length (bp)
Genes	44,301	3,887	2,688	57	223,438
All transcripts	72,394	2,047	1,732	57	31,940
mRNA	48,501	1,991	1,677	102	17,651
misc_RNA	6,640	2,487	2,179	115	18,403
tRNA	1,283	75	73	57	88
lncRNA	14,891	2,344	2,011	94	31,940
snoRNA	790	105	95	60	225
snRNA	249	148	159	98	200
rRNA	40	648	155	95	3,388
Single-exon transcripts	6,633	1,390	1,191	102	9,687
coding transcripts (NM_/XM_ )	6,633	1,390	1,191	102	9,687
CDSs	48,561	1,357	1,125	90	16,086
Exons	240,338	384	194	1	23,118
in coding transcripts (NM_/XM_ )	197,442	359	182	1	12,283
in non-coding transcripts (NR_/XR_ )	51,286	460	241	2	23,118
Introns	185,710	634	161	30	142,682
in coding transcripts (NM_/XM_ )	156,641	614	149	30	142,682
in non-coding transcripts (NR_/XR_ )	36,910	706	253	30	76,231

Transcripts per gene, exons per transcript

	Mean	Median	Min	Max
Number of transcripts per gene	1.66	1	1	50
Number of exons per transcript	5.81	5	1	66

BUSCO analysis of gene annotation

BUSCO v4.1.4 was run in "protein" mode on the annotated gene set picking one longest protein per gene, and run using the poales_odb10 lineage dataset. Results are reported for the gene set from the primary assembly unit, and presented in BUSCO notation.

Alignment of the annotated proteins to a set of high-quality proteins

The final set of annotated proteins was searched with BLASTP against the Arabidopsis thaliana known RefSeq proteins, using the annotated proteins as the query and the high-quality proteins as the target. Out of 35708 coding genes, 28187 genes had a protein with an alignment covering 50% or more of the query and 8308 had an alignment covering 95% or more of the query.

Definition of query and target coverage. The query coverage is the percentage of the annotated protein length that is included in the alignment. The target coverage is the percentage of the target length that is included in the alignment.

Below is a cumulative graph displaying the number of genes with alignments above a given query or target coverage threshold. For comparison, corresponding statistics for other organisms annotated by the NCBI eukaryotic annotation pipeline were added to the graph.

Query: annotated proteins
Target: Arabidopsis thaliana known RefSeq proteins

Masking of genomic sequence

Transcript and protein alignments are performed on the repeat-masked genome. Below are the percentages of genomic sequence masked by WindowMasker and RepeatMasker (if calculated), for each assembly. RepeatMasker results are only calculated for organisms with complete Dfam HMM model collections.

For this annotation run, transcripts and proteins were aligned to the genome masked with WindowMasker only.

Assembly name	Assembly accession	% Masked with WindowMasker
Tu2.1	GCF_003073215.2	71.17%

Transcript and protein alignments

The annotation pipeline relies heavily on alignments of experimental evidence for gene prediction. Below are the sets of transcripts and proteins that were retrieved from Entrez, aligned to the genome by Splign, minimap2, or ProSplign and passed to Gnomon, NCBI's gene prediction software.

Transcript alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by Splign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Same-species Genbank	78	75 (96.15%)	63 (80.77%)	99.10%	97.93%
Same-species EST	1	1 (100.00%)	1 (100.00%)	99.87%	99.87%

RNA-Seq alignments

The following RNA-Seq reads from the Sequence Read Archive were also used for gene prediction:

Hide alignments statistics, by sample (SAME, SAMN, SAMD, DRS)

Sample Id	Publication	Track name	Number of reads	Percent aligned reads	Percent of aligned reads with introns	Number of introns
All	NA	Aggregate of all aligned samples	9,114,877,541	81%	25%	230,516
SAMD00149522	31187273	seedling (Triticum urartu, 10 days after sowing, SAMD00149522)	8,728,224	68%	43%	117,636
SAMD00149523	31187273	seedling (Triticum urartu, 10 days after sowing, SAMD00149523)	10,497,826	69%	48%	129,715
SAMD00149524	31187273	seedling (Triticum urartu, 10 days after sowing, SAMD00149524)	10,612,710	58%	46%	122,022
SAMN00013420	NA	Triticum urartu (Triticum urartu, SAMN00013420)	51,278	30%	40%	4,182
SAMN01940676	23800085	Generic sample from Triticum urartu (Triticum urartu, SAMN01940676)	91,002,888	79%	23%	165,589
SAMN01940677	23800085	Generic sample from Triticum urartu (Triticum urartu, SAMN01940677)	34,131,018	77%	23%	147,279
SAMN01940678	23800085	Generic sample from Triticum urartu (Triticum urartu, SAMN01940678)	81,090,136	79%	18%	158,777
SAMN01940679	23800085	Generic sample from Triticum urartu (Triticum urartu, SAMN01940679)	42,308,754	77%	18%	144,565
SAMN03856565	NA	leaf (Triticum urartu, SAMN03856565)	80,642,120	86%	21%	152,964
SAMN03856566	NA	leaf (Triticum urartu, SAMN03856566)	67,384,852	86%	22%	151,839
SAMN03856567	NA	leaf (Triticum urartu, SAMN03856567)	66,123,918	87%	21%	148,046
SAMN03856568	NA	leaf (Triticum urartu, SAMN03856568)	62,472,466	86%	22%	151,068
SAMN03856569	NA	leaf (Triticum urartu, SAMN03856569)	71,914,510	86%	21%	151,049
SAMN03856570	NA	leaf (Triticum urartu, SAMN03856570)	74,271,966	85%	22%	148,808
SAMN03856571	NA	leaf (Triticum urartu, SAMN03856571)	44,426,728	87%	15%	134,686
SAMN03856572	NA	leaf (Triticum urartu, SAMN03856572)	62,202,384	85%	21%	153,078
SAMN03856573	NA	leaf (Triticum urartu, SAMN03856573)	81,439,054	86%	21%	154,591
SAMN03856574	NA	leaf (Triticum urartu, SAMN03856574)	74,987,720	86%	22%	152,847
SAMN03856575	NA	leaf (Triticum urartu, SAMN03856575)	71,845,220	85%	21%	153,129
SAMN03856576	NA	leaf (Triticum urartu, SAMN03856576)	62,702,692	85%	22%	150,848
SAMN03856577	NA	leaf (Triticum urartu, SAMN03856577)	68,159,662	86%	21%	150,877
SAMN03856578	NA	leaf (Triticum urartu, SAMN03856578)	72,867,296	86%	20%	148,877
SAMN03856579	NA	leaf (Triticum urartu, SAMN03856579)	68,427,422	86%	21%	154,127
SAMN03856580	NA	leaf (Triticum urartu, SAMN03856580)	70,398,990	86%	22%	150,987
SAMN03856581	NA	leaf (Triticum urartu, SAMN03856581)	63,919,968	86%	20%	149,494
SAMN03856582	NA	leaf (Triticum urartu, SAMN03856582)	71,199,718	86%	22%	152,839
SAMN03856583	NA	leaf (Triticum urartu, SAMN03856583)	72,647,032	86%	22%	152,388
SAMN03856584	NA	leaf (Triticum urartu, SAMN03856584)	63,884,836	86%	20%	141,712
SAMN03856585	NA	leaf (Triticum urartu, SAMN03856585)	71,478,664	86%	20%	143,732
SAMN03856586	NA	leaf (Triticum urartu, SAMN03856586)	54,374,788	85%	22%	145,070
SAMN03856587	NA	leaf (Triticum urartu, SAMN03856587)	64,567,230	86%	22%	151,248
SAMN03856588	NA	leaf (Triticum urartu, SAMN03856588)	71,754,584	85%	22%	152,789
SAMN03856589	NA	leaf (Triticum urartu, SAMN03856589)	49,657,428	86%	22%	143,972
SAMN03856590	NA	leaf (Triticum urartu, SAMN03856590)	59,382,162	85%	22%	145,027
SAMN03856591	NA	leaf (Triticum urartu, SAMN03856591)	52,127,400	84%	22%	144,123
SAMN03856592	NA	leaf (Triticum urartu, SAMN03856592)	55,357,586	86%	22%	151,590
SAMN03856593	NA	leaf (Triticum urartu, SAMN03856593)	59,226,308	85%	21%	149,471
SAMN03856594	NA	leaf (Triticum urartu, SAMN03856594)	58,499,278	85%	22%	147,041
SAMN03856595	NA	leaf (Triticum urartu, SAMN03856595)	62,078,214	86%	19%	150,593
SAMN03856596	NA	leaf (Triticum urartu, SAMN03856596)	51,896,192	85%	23%	145,460
SAMN03856597	NA	leaf (Triticum urartu, SAMN03856597)	61,026,518	86%	22%	150,379
SAMN03856598	NA	leaf (Triticum urartu, SAMN03856598)	58,831,082	85%	22%	148,621
SAMN03856599	NA	leaf (Triticum urartu, SAMN03856599)	55,377,778	86%	19%	142,345
SAMN03856600	NA	leaf (Triticum urartu, SAMN03856600)	59,857,154	86%	20%	144,183
SAMN03856601	NA	leaf (Triticum urartu, SAMN03856601)	65,454,030	85%	23%	149,718
SAMN03856602	NA	leaf (Triticum urartu, SAMN03856602)	68,020,872	86%	22%	149,055
SAMN03856603	NA	leaf (Triticum urartu, SAMN03856603)	58,467,310	86%	22%	147,005
SAMN03856604	NA	leaf (Triticum urartu, SAMN03856604)	54,325,936	86%	22%	143,811
SAMN03856606	NA	leaf (Triticum urartu, SAMN03856606)	55,428,618	87%	20%	144,070
SAMN03856607	NA	leaf (Triticum urartu, SAMN03856607)	46,124,932	87%	20%	142,528
SAMN03856608	NA	leaf (Triticum urartu, SAMN03856608)	50,078,172	87%	20%	140,416
SAMN03856609	NA	leaf (Triticum urartu, SAMN03856609)	50,229,764	86%	20%	138,609
SAMN03856610	NA	leaf (Triticum urartu, SAMN03856610)	53,422,898	86%	22%	147,867
SAMN03856611	NA	leaf (Triticum urartu, SAMN03856611)	53,059,482	87%	21%	142,778
SAMN03856612	NA	leaf (Triticum urartu, SAMN03856612)	54,614,888	86%	21%	146,784
SAMN03856613	NA	leaf (Triticum urartu, SAMN03856613)	61,527,668	87%	20%	148,649
SAMN03856614	NA	leaf (Triticum urartu, SAMN03856614)	54,928,230	86%	21%	147,873
SAMN03856615	NA	leaf (Triticum urartu, SAMN03856615)	56,212,598	86%	20%	142,596
SAMN03856616	NA	leaf (Triticum urartu, SAMN03856616)	63,335,142	85%	21%	151,042
SAMN03856617	NA	leaf (Triticum urartu, SAMN03856617)	64,381,842	86%	18%	147,384
SAMN03856618	NA	leaf (Triticum urartu, SAMN03856618)	67,473,948	85%	21%	152,277
SAMN03856619	NA	leaf (Triticum urartu, SAMN03856619)	63,806,674	87%	20%	146,663
SAMN03856620	NA	leaf (Triticum urartu, SAMN03856620)	61,082,440	86%	20%	149,618
SAMN03856621	NA	leaf (Triticum urartu, SAMN03856621)	54,414,304	86%	19%	144,105
SAMN03856622	NA	leaf (Triticum urartu, SAMN03856622)	61,524,596	86%	19%	147,719
SAMN03856623	NA	leaf (Triticum urartu, SAMN03856623)	62,297,214	86%	20%	144,303
SAMN03856624	NA	leaf (Triticum urartu, SAMN03856624)	52,843,580	86%	20%	142,401
SAMN03856625	NA	leaf (Triticum urartu, SAMN03856625)	46,566,174	86%	19%	136,578
SAMN06116921	NA	Leaf 30D (Triticum urartu, 30 days, SAMN06116921)	53,864,834	85%	19%	135,091
SAMN06116922	NA	Leaf 30D (Triticum urartu, 30 days, SAMN06116922)	51,331,830	83%	19%	114,698
SAMN08959314	NA	shoots/roots (Triticum urartu, 7, SAMN08959314)	794,923,017	83%	35%	201,927
SAMN12786939	31995554	young leaves (Triticum urartu, SAMN12786939)	56,085,216	96%	8%	52,913
SAMN14253917	NA	leaf (Triticum urartu, SAMN14253917)	53,037,394	83%	35%	146,751
SAMN14253918	NA	leaf (Triticum urartu, SAMN14253918)	51,233,698	83%	35%	144,516
SAMN17715113	NA	Endosperm (Triticum urartu, SAMN17715113)	19,594,750	64%	4%	82,341
SAMN17715114	NA	Endosperm (Triticum urartu, SAMN17715114)	22,439,694	65%	5%	92,042
SAMN17715115	NA	Endosperm (Triticum urartu, SAMN17715115)	20,650,010	66%	5%	87,199
SAMN17715116	NA	Flag leaf (Triticum urartu, SAMN17715116)	22,185,442	71%	11%	108,644
SAMN17715117	NA	Flag leaf (Triticum urartu, SAMN17715117)	21,474,674	72%	8%	102,575
SAMN17715118	NA	Flag leaf (Triticum urartu, SAMN17715118)	19,985,666	70%	3%	64,666
SAMN17715119	NA	Endosperm (Triticum urartu, SAMN17715119)	23,816,242	68%	9%	109,897
SAMN17715120	NA	Endosperm (Triticum urartu, SAMN17715120)	24,339,102	66%	9%	106,206
SAMN17715121	NA	Endosperm (Triticum urartu, SAMN17715121)	24,165,272	66%	9%	110,052
SAMN17715122	NA	Endosperm (Triticum urartu, SAMN17715122)	24,900,170	75%	16%	134,409
SAMN17715123	NA	Endosperm (Triticum urartu, SAMN17715123)	25,234,252	78%	17%	134,064
SAMN17715124	NA	Endosperm (Triticum urartu, SAMN17715124)	24,590,424	78%	17%	137,413
SAMN17715125	NA	Endosperm (Triticum urartu, SAMN17715125)	19,527,124	69%	9%	89,907
SAMN17715126	NA	Endosperm (Triticum urartu, SAMN17715126)	20,738,926	70%	8%	94,983
SAMN18026046	34503979	seedling (Triticum urartu, SAMN18026046)	56,937,954	93%	11%	137,080
SAMN18026047	34503979	seedling (Triticum urartu, SAMN18026047)	56,885,240	94%	9%	135,009
SAMN18026048	34503979	seedling (Triticum urartu, SAMN18026048)	56,868,352	92%	9%	138,493
SAMN18026049	34503979	seedling (Triticum urartu, SAMN18026049)	58,374,876	93%	9%	128,533
SAMN18026050	34503979	seedling (Triticum urartu, SAMN18026050)	67,943,502	94%	8%	128,953
SAMN18026051	34503979	seedling (Triticum urartu, SAMN18026051)	52,902,068	94%	9%	130,397
SAMN18026052	34503979	seedling (Triticum urartu, SAMN18026052)	82,424,144	95%	8%	137,991
SAMN18026053	34503979	seedling (Triticum urartu, SAMN18026053)	62,110,880	96%	7%	131,564
SAMN18026054	34503979	seedling (Triticum urartu, SAMN18026054)	58,178,388	94%	6%	125,770
SAMN18026055	34503979	seedling (Triticum urartu, SAMN18026055)	57,426,830	95%	8%	129,654
SAMN18026056	34503979	seedling (Triticum urartu, SAMN18026056)	53,085,444	94%	9%	130,535
SAMN18026057	34503979	seedling (Triticum urartu, SAMN18026057)	65,169,856	94%	9%	134,865
SAMN18026058	34503979	seedling (Triticum urartu, SAMN18026058)	56,487,136	94%	7%	120,875
SAMN18026059	34503979	seedling (Triticum urartu, SAMN18026059)	61,429,174	85%	33%	161,764
SAMN18026060	34503979	seedling (Triticum urartu, SAMN18026060)	55,607,896	84%	34%	163,035
SAMN18026061	34503979	seedling (Triticum urartu, SAMN18026061)	64,925,142	85%	33%	155,674
SAMN18026062	34503979	seedling (Triticum urartu, SAMN18026062)	53,848,530	85%	33%	154,478
SAMN18026071	34503979	seedling (Triticum urartu, SAMN18026071)	55,813,148	93%	9%	135,170
SAMN26090086	NA	leaf (Triticum urartu, SAMN26090086)	2,688,886,178	72%	37%	216,567

Show alignments statistics, by run (ERR, SRR, DRR)

Run	Experiment	Project	Sample	Number of reads	Percent aligned reads	Percent of aligned reads with introns
DRR157887	DRX148559	DRP005541	SAMD00149522	8,728,224	68%	43%
DRR157888	DRX148560	DRP005541	SAMD00149523	10,497,826	69%	48%
DRR157889	DRX148561	DRP005541	SAMD00149524	10,612,710	58%	46%
SRR043331	SRX020417	SRP002455	SAMN00013420	19,797	30%	37%
SRR043332	SRX020417	SRP002455	SAMN00013420	31,481	30%	42%
SRR769750	SRX247595	SRP019054	SAMN01940676	91,002,888	79%	23%
SRR769749	SRX247596	SRP019054	SAMN01940677	34,131,018	77%	23%
SRR863375	SRX283692	SRP019054	SAMN01940678	81,090,136	79%	18%
SRR863376	SRX283693	SRP019054	SAMN01940679	42,308,754	77%	18%
SRR3274663	SRX1651787	SRP072147	SAMN03856565	80,642,120	86%	21%
SRR3274664	SRX1651788	SRP072147	SAMN03856566	67,384,852	86%	22%
SRR3274675	SRX1651799	SRP072147	SAMN03856567	66,123,918	87%	21%
SRR3274687	SRX1651810	SRP072147	SAMN03856568	62,472,466	86%	22%
SRR3274707	SRX1651824	SRP072147	SAMN03856569	71,914,510	86%	21%
SRR3274743	SRX1651839	SRP072147	SAMN03856570	74,271,966	85%	22%
SRR3274783	SRX1651863	SRP072147	SAMN03856571	44,426,728	87%	15%
SRR3274784	SRX1651864	SRP072147	SAMN03856572	62,202,384	85%	21%
SRR3274785	SRX1651865	SRP072147	SAMN03856573	81,439,054	86%	21%
SRR3274786	SRX1651866	SRP072147	SAMN03856574	74,987,720	86%	22%
SRR3274665	SRX1651789	SRP072147	SAMN03856575	71,845,220	85%	21%
SRR3274666	SRX1651790	SRP072147	SAMN03856576	62,702,692	85%	22%
SRR3274667	SRX1651791	SRP072147	SAMN03856577	68,159,662	86%	21%
SRR3274668	SRX1651792	SRP072147	SAMN03856578	72,867,296	86%	20%
SRR3274669	SRX1651793	SRP072147	SAMN03856579	68,427,422	86%	21%
SRR3274670	SRX1651794	SRP072147	SAMN03856580	70,398,990	86%	22%
SRR3274671	SRX1651795	SRP072147	SAMN03856581	63,919,968	86%	20%
SRR3274672	SRX1651796	SRP072147	SAMN03856582	71,199,718	86%	22%
SRR3274673	SRX1651797	SRP072147	SAMN03856583	72,647,032	86%	22%
SRR3274674	SRX1651798	SRP072147	SAMN03856584	63,884,836	86%	20%
SRR3274676	SRX1651800	SRP072147	SAMN03856585	71,478,664	86%	20%
SRR3274678	SRX1651801	SRP072147	SAMN03856586	54,374,788	85%	22%
SRR3274679	SRX1651802	SRP072147	SAMN03856587	64,567,230	86%	22%
SRR3274680	SRX1651803	SRP072147	SAMN03856588	71,754,584	85%	22%
SRR3274681	SRX1651804	SRP072147	SAMN03856589	49,657,428	86%	22%
SRR3274682	SRX1651805	SRP072147	SAMN03856590	59,382,162	85%	22%
SRR3274683	SRX1651806	SRP072147	SAMN03856591	52,127,400	84%	22%
SRR3274684	SRX1651807	SRP072147	SAMN03856592	55,357,586	86%	22%
SRR3274685	SRX1651808	SRP072147	SAMN03856593	59,226,308	85%	21%
SRR3274686	SRX1651809	SRP072147	SAMN03856594	58,499,278	85%	22%
SRR3274688	SRX1651811	SRP072147	SAMN03856595	62,078,214	86%	19%
SRR3274689	SRX1651812	SRP072147	SAMN03856596	51,896,192	85%	23%
SRR3274690	SRX1651813	SRP072147	SAMN03856597	61,026,518	86%	22%
SRR3274691	SRX1651814	SRP072147	SAMN03856598	58,831,082	85%	22%
SRR3274692	SRX1651815	SRP072147	SAMN03856599	55,377,778	86%	19%
SRR3274693	SRX1651816	SRP072147	SAMN03856600	59,857,154	86%	20%
SRR3274694	SRX1651817	SRP072147	SAMN03856601	65,454,030	85%	23%
SRR3274697	SRX1651818	SRP072147	SAMN03856602	68,020,872	86%	22%
SRR3274702	SRX1651822	SRP072147	SAMN03856603	58,467,310	86%	22%
SRR3274706	SRX1651823	SRP072147	SAMN03856604	54,325,936	86%	22%
SRR3274708	SRX1651825	SRP072147	SAMN03856606	55,428,618	87%	20%
SRR3274709	SRX1651826	SRP072147	SAMN03856607	46,124,932	87%	20%
SRR3274710	SRX1651827	SRP072147	SAMN03856608	50,078,172	87%	20%
SRR3274711	SRX1651828	SRP072147	SAMN03856609	50,229,764	86%	20%
SRR3274712	SRX1651829	SRP072147	SAMN03856610	53,422,898	86%	22%
SRR3274713	SRX1651830	SRP072147	SAMN03856611	53,059,482	87%	21%
SRR3274714	SRX1651831	SRP072147	SAMN03856612	54,614,888	86%	21%
SRR3274717	SRX1651832	SRP072147	SAMN03856613	61,527,668	87%	20%
SRR3274738	SRX1651837	SRP072147	SAMN03856614	54,928,230	86%	21%
SRR3274742	SRX1651838	SRP072147	SAMN03856615	56,212,598	86%	20%
SRR3274764	SRX1651840	SRP072147	SAMN03856616	63,335,142	85%	21%
SRR3274765	SRX1651841	SRP072147	SAMN03856617	64,381,842	86%	18%
SRR3274766	SRX1651842	SRP072147	SAMN03856618	67,473,948	85%	21%
SRR3274767	SRX1651843	SRP072147	SAMN03856619	63,806,674	87%	20%
SRR3274768	SRX1651844	SRP072147	SAMN03856620	61,082,440	86%	20%
SRR3274769	SRX1651845	SRP072147	SAMN03856621	54,414,304	86%	19%
SRR3274771	SRX1651846	SRP072147	SAMN03856622	61,524,596	86%	19%
SRR3274774	SRX1651847	SRP072147	SAMN03856623	62,297,214	86%	20%
SRR3274775	SRX1651861	SRP072147	SAMN03856624	52,843,580	86%	20%
SRR3274781	SRX1651862	SRP072147	SAMN03856625	46,566,174	86%	19%
SRR5096895	SRX2413718	SRP094879	SAMN06116921	53,864,834	85%	19%
SRR5096873	SRX2413696	SRP094879	SAMN06116922	51,331,830	83%	19%
SRR7047511	SRX3979397	SRP141362	SAMN08959314	50,183,684	84%	34%
SRR7047510	SRX3979398	SRP141362	SAMN08959314	46,775,502	83%	35%
SRR7047509	SRX3979399	SRP141362	SAMN08959314	41,389,066	85%	34%
SRR7047508	SRX3979400	SRP141362	SAMN08959314	40,695,846	84%	33%
SRR7047507	SRX3979401	SRP141362	SAMN08959314	41,931,616	80%	36%
SRR7047506	SRX3979402	SRP141362	SAMN08959314	44,434,998	79%	37%
SRR7047505	SRX3979403	SRP141362	SAMN08959314	43,970,834	83%	37%
SRR7047504	SRX3979404	SRP141362	SAMN08959314	51,357,908	85%	35%
SRR7047503	SRX3979405	SRP141362	SAMN08959314	43,437,514	85%	36%
SRR7047502	SRX3979406	SRP141362	SAMN08959314	42,880,262	82%	35%
SRR7047501	SRX3979407	SRP141362	SAMN08959314	40,582,394	85%	35%
SRR7047500	SRX3979408	SRP141362	SAMN08959314	44,467,690	81%	36%
SRR7047499	SRX3979409	SRP141362	SAMN08959314	45,101,874	82%	36%
SRR7047498	SRX3979410	SRP141362	SAMN08959314	20,431,951	84%	36%
SRR7047497	SRX3979411	SRP141362	SAMN08959314	20,431,951	86%	36%
SRR7047496	SRX3979412	SRP141362	SAMN08959314	44,612,336	84%	36%
SRR7047495	SRX3979413	SRP141362	SAMN08959314	23,453,538	84%	34%
SRR7047494	SRX3979414	SRP141362	SAMN08959314	20,431,951	84%	36%
SRR7047493	SRX3979415	SRP141362	SAMN08959314	43,149,684	85%	36%
SRR7047492	SRX3979416	SRP141362	SAMN08959314	45,202,418	82%	37%
SRR10143729	SRX6871648	SRP222498	SAMN12786939	56,085,216	96%	8%
SRR11292283	SRX7897883	SRP252452	SAMN14253917	53,037,394	83%	35%
SRR11292282	SRX7897884	SRP252452	SAMN14253918	51,233,698	83%	35%
SRR13592937	SRX9987530	SRP304011	SAMN17715113	19,594,750	64%	4%
SRR13592936	SRX9987529	SRP304011	SAMN17715114	22,439,694	65%	5%
SRR13592935	SRX9987528	SRP304011	SAMN17715115	20,650,010	66%	5%
SRR13592934	SRX9987527	SRP304011	SAMN17715116	22,185,442	71%	11%
SRR13592933	SRX9987526	SRP304011	SAMN17715117	21,474,674	72%	8%
SRR13592932	SRX9987525	SRP304011	SAMN17715118	19,985,666	70%	3%
SRR13592931	SRX9987524	SRP304011	SAMN17715119	23,816,242	68%	9%
SRR13592930	SRX9987523	SRP304011	SAMN17715120	24,339,102	66%	9%
SRR13592929	SRX9987522	SRP304011	SAMN17715121	24,165,272	66%	9%
SRR13592928	SRX9987521	SRP304011	SAMN17715122	24,900,170	75%	16%
SRR13592927	SRX9987520	SRP304011	SAMN17715123	25,234,252	78%	17%
SRR13592926	SRX9987519	SRP304011	SAMN17715124	24,590,424	78%	17%
SRR13592943	SRX9987536	SRP304011	SAMN17715125	19,527,124	69%	9%
SRR13592942	SRX9987535	SRP304011	SAMN17715126	20,738,926	70%	8%
SRR13762873	SRX10149540	SRP307514	SAMN18026046	56,937,954	93%	11%
SRR13762872	SRX10149539	SRP307514	SAMN18026047	56,885,240	94%	9%
SRR13762871	SRX10149538	SRP307514	SAMN18026048	56,868,352	92%	9%
SRR13762870	SRX10149537	SRP307514	SAMN18026049	58,374,876	93%	9%
SRR13762869	SRX10149536	SRP307514	SAMN18026050	67,943,502	94%	8%
SRR13762868	SRX10149535	SRP307514	SAMN18026051	52,902,068	94%	9%
SRR13762867	SRX10149534	SRP307514	SAMN18026052	82,424,144	95%	8%
SRR13762866	SRX10149533	SRP307514	SAMN18026053	62,110,880	96%	7%
SRR13762865	SRX10149532	SRP307514	SAMN18026054	58,178,388	94%	6%
SRR13762864	SRX10149531	SRP307514	SAMN18026055	57,426,830	95%	8%
SRR13762863	SRX10149530	SRP307514	SAMN18026056	53,085,444	94%	9%
SRR13762862	SRX10149529	SRP307514	SAMN18026057	65,169,856	94%	9%
SRR13762861	SRX10149528	SRP307514	SAMN18026058	56,487,136	94%	7%
SRR13762860	SRX10149527	SRP307514	SAMN18026059	61,429,174	85%	33%
SRR13762859	SRX10149526	SRP307514	SAMN18026060	55,607,896	84%	34%
SRR13762858	SRX10149525	SRP307514	SAMN18026061	64,925,142	85%	33%
SRR13762857	SRX10149524	SRP307514	SAMN18026062	53,848,530	85%	33%
SRR13762874	SRX10149541	SRP307514	SAMN18026071	55,813,148	93%	9%
SRR18085357	SRX14236780	SRP360715	SAMN26090086	17,728,796	84%	35%
SRR18085356	SRX14236781	SRP360715	SAMN26090086	20,956,376	85%	35%
SRR18085355	SRX14236782	SRP360715	SAMN26090086	20,212,582	86%	34%
SRR18085354	SRX14236783	SRP360715	SAMN26090086	20,848,816	85%	32%
SRR18085353	SRX14236784	SRP360715	SAMN26090086	20,832,964	86%	35%
SRR18085352	SRX14236785	SRP360715	SAMN26090086	21,501,258	86%	35%
SRR18085351	SRX14236786	SRP360715	SAMN26090086	20,458,860	85%	34%
SRR18085350	SRX14236787	SRP360715	SAMN26090086	15,559,792	86%	35%
SRR18085349	SRX14236788	SRP360715	SAMN26090086	19,914,780	86%	36%
SRR18085348	SRX14236789	SRP360715	SAMN26090086	21,175,200	86%	36%
SRR18085347	SRX14236790	SRP360715	SAMN26090086	21,125,922	86%	36%
SRR18085346	SRX14236791	SRP360715	SAMN26090086	19,690,668	86%	36%
SRR18085345	SRX14236792	SRP360715	SAMN26090086	20,084,666	84%	35%
SRR18085344	SRX14236793	SRP360715	SAMN26090086	22,117,106	85%	34%
SRR18085343	SRX14236794	SRP360715	SAMN26090086	22,064,204	86%	35%
SRR18085342	SRX14236795	SRP360715	SAMN26090086	21,062,540	86%	35%
SRR18085341	SRX14236796	SRP360715	SAMN26090086	22,987,546	86%	35%
SRR18085340	SRX14236797	SRP360715	SAMN26090086	17,523,358	86%	34%
SRR18085339	SRX14236798	SRP360715	SAMN26090086	17,290,786	86%	34%
SRR18085338	SRX14236799	SRP360715	SAMN26090086	19,858,454	86%	34%
SRR18085337	SRX14236800	SRP360715	SAMN26090086	52,322,424	73%	36%
SRR18085336	SRX14236801	SRP360715	SAMN26090086	46,575,888	72%	35%
SRR18085335	SRX14236802	SRP360715	SAMN26090086	39,695,322	73%	34%
SRR18085334	SRX14236803	SRP360715	SAMN26090086	19,998,402	85%	34%
SRR18085333	SRX14236804	SRP360715	SAMN26090086	47,402,628	72%	37%
SRR18085332	SRX14236805	SRP360715	SAMN26090086	52,173,860	72%	37%
SRR18085331	SRX14236806	SRP360715	SAMN26090086	57,406,620	73%	38%
SRR18085330	SRX14236807	SRP360715	SAMN26090086	63,075,506	72%	38%
SRR18085329	SRX14236808	SRP360715	SAMN26090086	55,152,052	70%	38%
SRR18085328	SRX14236809	SRP360715	SAMN26090086	57,017,960	69%	38%
SRR18085327	SRX14236810	SRP360715	SAMN26090086	51,749,516	72%	37%
SRR18085326	SRX14236811	SRP360715	SAMN26090086	67,072,192	72%	36%
SRR18085325	SRX14236812	SRP360715	SAMN26090086	67,879,910	72%	35%
SRR18085324	SRX14236813	SRP360715	SAMN26090086	58,178,512	72%	37%
SRR18085323	SRX14236814	SRP360715	SAMN26090086	20,926,850	85%	35%
SRR18085322	SRX14236815	SRP360715	SAMN26090086	59,129,088	73%	37%
SRR18085321	SRX14236816	SRP360715	SAMN26090086	64,274,858	73%	37%
SRR18085320	SRX14236817	SRP360715	SAMN26090086	63,478,374	72%	37%
SRR18085319	SRX14236818	SRP360715	SAMN26090086	60,261,160	72%	37%
SRR18085318	SRX14236819	SRP360715	SAMN26090086	61,171,708	72%	37%
SRR18085317	SRX14236820	SRP360715	SAMN26090086	61,025,842	72%	37%
SRR18085316	SRX14236821	SRP360715	SAMN26090086	64,362,856	72%	37%
SRR18085315	SRX14236822	SRP360715	SAMN26090086	59,579,376	72%	37%
SRR18085314	SRX14236823	SRP360715	SAMN26090086	59,902,234	72%	37%
SRR18085313	SRX14236824	SRP360715	SAMN26090086	56,941,252	71%	37%
SRR18085312	SRX14236825	SRP360715	SAMN26090086	20,118,494	85%	34%
SRR18085311	SRX14236826	SRP360715	SAMN26090086	59,544,412	72%	37%
SRR18085310	SRX14236827	SRP360715	SAMN26090086	56,537,672	72%	36%
SRR18085309	SRX14236828	SRP360715	SAMN26090086	55,955,204	72%	36%
SRR18085308	SRX14236829	SRP360715	SAMN26090086	54,361,816	72%	37%
SRR18085307	SRX14236830	SRP360715	SAMN26090086	23,093,208	63%	36%
SRR18085306	SRX14236831	SRP360715	SAMN26090086	20,702,428	64%	36%
SRR18085305	SRX14236832	SRP360715	SAMN26090086	19,942,858	63%	36%
SRR18085304	SRX14236833	SRP360715	SAMN26090086	23,982,858	60%	39%
SRR18085303	SRX14236834	SRP360715	SAMN26090086	19,169,240	61%	39%
SRR18085302	SRX14236835	SRP360715	SAMN26090086	20,412,016	60%	38%
SRR18085301	SRX14236836	SRP360715	SAMN26090086	19,411,352	83%	35%
SRR18085300	SRX14236837	SRP360715	SAMN26090086	20,885,010	59%	41%
SRR18085299	SRX14236838	SRP360715	SAMN26090086	20,271,170	58%	40%
SRR18085298	SRX14236839	SRP360715	SAMN26090086	20,192,396	59%	41%
SRR18085297	SRX14236840	SRP360715	SAMN26090086	20,016,514	61%	39%
SRR18085296	SRX14236841	SRP360715	SAMN26090086	23,018,730	58%	38%
SRR18085295	SRX14236842	SRP360715	SAMN26090086	24,058,408	59%	39%
SRR18085294	SRX14236843	SRP360715	SAMN26090086	19,046,688	59%	39%
SRR18085293	SRX14236844	SRP360715	SAMN26090086	21,871,492	60%	40%
SRR18085292	SRX14236845	SRP360715	SAMN26090086	23,447,118	59%	39%
SRR18085291	SRX14236846	SRP360715	SAMN26090086	24,274,646	60%	40%
SRR18085290	SRX14236847	SRP360715	SAMN26090086	15,287,068	82%	36%
SRR18085289	SRX14236848	SRP360715	SAMN26090086	24,378,288	60%	40%
SRR18085288	SRX14236849	SRP360715	SAMN26090086	23,510,352	60%	40%
SRR18085287	SRX14236850	SRP360715	SAMN26090086	24,574,032	60%	40%
SRR18085286	SRX14236851	SRP360715	SAMN26090086	25,802,468	60%	40%
SRR18085285	SRX14236852	SRP360715	SAMN26090086	25,022,964	60%	39%
SRR18085284	SRX14236853	SRP360715	SAMN26090086	25,349,762	60%	40%
SRR18085283	SRX14236854	SRP360715	SAMN26090086	22,346,598	60%	40%
SRR18085282	SRX14236855	SRP360715	SAMN26090086	21,841,970	60%	40%
SRR18085281	SRX14236856	SRP360715	SAMN26090086	20,359,816	60%	37%
SRR18085280	SRX14236857	SRP360715	SAMN26090086	21,659,456	59%	38%
SRR18085279	SRX14236858	SRP360715	SAMN26090086	16,300,400	82%	36%
SRR18085278	SRX14236859	SRP360715	SAMN26090086	21,466,000	59%	37%
SRR18085277	SRX14236860	SRP360715	SAMN26090086	20,924,210	85%	34%

Protein alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by ProSplign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Pooideae GenBank	37,230	34,570 (92.86%)	34,570 (92.86%)	75.37%	85.68%
Pooideae known RefSeq (NP_)	228	225 (98.68%)	225 (98.68%)	77.75%	84.38%
Arabidopsis thaliana known RefSeq (NP_)	48,147	38,785 (80.56%)	38,785 (80.56%)	65.41%	67.27%
Oryza sativa GenBank	20,769	19,016 (91.56%)	19,016 (91.56%)	71.00%	80.47%
Oryza sativa known RefSeq (NP_)	1,423	1,382 (97.12%)	1,382 (97.12%)	72.71%	82.08%
Same-species GenBank	65	53 (81.54%)	53 (81.54%)	76.64%	79.94%
Zea mays GenBank	50,566	44,235 (87.48%)	44,235 (87.48%)	72.31%	79.95%
Zea mays known RefSeq (NP_)	20,302	19,023 (93.70%)	19,023 (93.70%)	70.65%	79.04%

References

RefSeq: Pruitt KD, Brown GR, Hiatt SM, Thibaud-Nissen F, Astashyn A, Ermolaeva O, Farrell CM, Hart J, Landrum MJ, McGarvey KM, Murphy MR, O'Leary NA, Pujar S, Rajput B, Rangwala SH, Riddick LD, Shkeda A, Sun H, Tamez P, Tully RE, Wallin C, Webb D, Weber J, Wu W, Dicuccio M, Kitts P, Maglott DR, Murphy TD, Ostell JM. Nucleic Acids Research 2014, 42(Database issue):D756-63
BUSCO: Manni M, Berkeley MR, Seppey M, Simão FA, Zdobnov EM. Molecular biology and evolution 2021.38(10):4647-4654
RepeatMasker: Smit AFA, Hubley R, Green P. RepeatMasker Open-3.0. 1996–2004. http://www.repeatmasker.org
WindowMasker: Morgulis A, Gertz EM, Schäffer AA, Agarwala R. Bioinformatics 2006, 2:134-41
Splign: Kapustin Y, Souvorov A, Tatusova T, Lipman D. Biology Direct 2008, 3:20
Minimap2: Li H. Bioinformatics 2018 Sep 15;34(18):3094-3100

RefSeq

Integrated reference sequences