NCBI Conserved Domain Search

Conserved domains on [gi|1479333747|gb|RIW14097|]

View

PKD domain-containing protein [Algoriphagus lacus]

Protein Classification

Graphical summary

Zoom to residue level

show extra options »

Show site features Horizontal zoom: ×

List of domain hits

Name

Accession

Description

Interval

E-value

ThuA

pfam06283

Trehalose utilization; This family consists of several bacterial ThuA-like proteins. ThuA ...

33-250

3.19e-98

Trehalose utilization; This family consists of several bacterial ThuA-like proteins. ThuA appears to be involved in utilization of trehalose. The thuA and thuB genes form part of the trehalose/sucrose transport operon thuEFGKAB, which is located on the pSymB megaplasmid. The thuA and thuB genes are induced in vitro by trehalose but not by sucrose and the extent of its induction depends on the concentration of trehalose available in the medium. ThuA is involved in the conversion of of disaccharides to their respective 3-keto derivatives.

Pssm-ID: 461867 [Multi-domain] Cd Length: 213 Bit Score: 310.33 E-value: 3.19e-98

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   33 KVLVFSKTAGFYHESIPDGIAAIQKLGAENGFQVDTTKNAENINEENLAQYAAVIFLSTTGDVLNNYQEADFERYIQSGG 112
Cdd:pfam06283    1 RVLVFSGTAGWRHESIPAGIEAIRKLGAENGFEVDATEDAAVFTDENLAQYDVVVFLNTTGDVLDEEQEAAFQRYVQAGG 80

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  113 GYVGIHAAADTEYEWGWYNRLVGGYFSDHpgindpHPNVQPGKITKTAEKHPSTDFLPETWERTDEWYSYKQVSPDTKKL 192
Cdd:pfam06283   81 GFVGLHSAADTEYDWPWYGKLVGARFVAH------DPAPQQATVDVEDRSHPITAGLPAEWERTDEWYNFKPNPPGNHVL 154

                          170       180       190       200       210
                   ....*....|....*....|....*....|....*....|....*....|....*....
gi 1479333747  193 LMLDESSYQGGMDMG-EHPIAWYHDFDGGRAFYTGGGHTKESYSENDFLKHLLAGIQYA 250
Cdd:pfam06283  155 ATTDESSYDGGGNMGvDHPVAWTREDGAGRVFYTALGHTTESYEDPEFRKHLLGGIRWA 213

YliI

COG2133

Glucose/arabinose dehydrogenase, beta-propeller fold [Carbohydrate transport and metabolism];

266-699

4.99e-91

Glucose/arabinose dehydrogenase, beta-propeller fold [Carbohydrate transport and metabolism];

Pssm-ID: 441736 [Multi-domain] Cd Length: 365 Bit Score: 296.84 E-value: 4.99e-91

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  266 RVPEENRFTKTMLsVGEFTEPTEMTILPNLDILVAQRRGEIYLYNNATQELKEVAKLDVYwktevkgVNAEEGLMGIQKD 345
Cdd:COG2133     20 TPTLPPGFTVEVV-ADGLDHPWGLAFLPDGRLLVTERAGRIRLLDDDGKLSTPVADLPVF-------AGGEGGLLGVALD 91

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  346 PNYATNNWVYAFYAPTGDKEiNRLSRFKFANGVWdMASEQVILELYSQrDICCHTGGSIAFDKEGNLYLSTGDNSTPFnq 425
Cdd:COG2133     92 PDFATNGYLYVAYTDPGGAG-TRVARFTLSDGDT-LTSEEVILDGLPA-GGGNHNGGRLAFGPDGKLYVSVGDRGNAC-- 166

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  426 pgskytlngyapldgregnkqwDARRSSGNSNDLRGKILRIKVaeDGSytIPEGNLYPqGTEGTRPEIYVQGLRNPYRIS 505
Cdd:COG2133    167 ----------------------EARGNAQDLNSLRGKILRIDP--DGS--IPADNPFV-GTPGARPEIYAYGHRNPQGLA 219

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  506 VDQKTSFLYWGEVGPDanndsldikgprGYDEVNQARKAGHFGWPYTIGknfayrefnyetgqtGPAFDvagPTNNSPNN 585
Cdd:COG2133    220 FDPETGELWATEHGPD------------GGDELNRIEPGGNYGWPYCEG---------------GQNYD---PIGDSTPD 269

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  586 TGLKQlpPVepafIYYPYAVSPefpqlgtggrnaMAGPVYYSDMypaetrFPDYFDGKLFIYDWIRGWIKVVTMKENGDF 665
Cdd:COG2133    270 AGLTD--PV----ATWPPGHAP------------SGLAFYTGDA------FPAEYRGGLFVADLGSRRVVRVPLDGDGKV 325

                          410       420       430
                   ....*....|....*....|....*....|....
gi 1479333747  666 DKMEPFMKGTkFNAMIDMEMGPDGKIYILEYGNG 699
Cdd:COG2133    326 VGEEDFLTGA-GGRPRDVAQGPDGALYVLDDNDG 358

CytC552

COG4654

Cytochrome c551/c552 [Energy production and conversion];

875-957

7.73e-34

Cytochrome c551/c552 [Energy production and conversion];

Pssm-ID: 443692 [Multi-domain] Cd Length: 88 Bit Score: 125.01 E-value: 7.73e-34

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  875 AMNGKALVQSLTCKTCHKEAEKSVGPAYTEVAKKYRER--DRDYLLNKIKNGGGGVWGETAMPANPDLKSADANALVTYI 952
Cdd:COG4654      4 AAAGKALAKKSGCLACHAVDKKLVGPSYKDVAKKYKGKadAVAKLAKKIKKGGSGVWGDVPMPPHPQLSDAEAKALVKWI 83


                   ....*
gi 1479333747  953 LSLRN 957
Cdd:COG4654     84 LSLKK 88

PKD

pfam00801

PKD domain; This domain was first identified in the Polycystic kidney disease protein PKD1. ...

726-793

1.46e-14

PKD domain; This domain was first identified in the Polycystic kidney disease protein PKD1. This domain has been predicted to contain an Ig-like fold.

Pssm-ID: 395646 [Multi-domain] Cd Length: 70 Bit Score: 69.34 E-value: 1.46e-14

                           10        20        30        40        50        60
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*...
gi 1479333747  726 LTVDKTSGKNPLTVTLTATSADPekDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAG 793
Cdd:pfam00801    1 VSASGTVVAAGQPVTFTATLADG--SNVTYTWDFGDSPGTSGSGPTVTHTYLSPGTYTVTLTASNAVG 66

myxo_dep_M36 super family

cl45606

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-865

1.69e-05

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family have an M36 family metallopeptidase domain, like fungalysin (see PF02128), and a C-terminal MYXO-CTERM domain (see TIGR03901), suggesting processing and surface-anchoring by the still-unknown putative transpeptidase, myxosortase. Members of this family include MXAN_3564 (mepA), part of the effector cargo of outer membrane vesicles that the species produces in large numbers during predation on other microbes.

The actual alignment was detected with superfamily member NF038112:

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 49.27 E-value: 1.69e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVVSS---LTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGET---KSTTEPTLTHTYNAVGEYE---IKVTA 788
Cdd:NF038112  1280 NRAPVAVAgapATVDERS-----TVTLDGSGTDADGDALTYAWTQTSGPAvtlTGATTATATFTAPEVTADTqltFTLTV 1354

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  789 ADpaGMTGVSAPVSVYSGNV--APVVSIqieGNKSFYFPGKKVGYSVAVTDEDhPDAASDLSTLVV-SADYLQGIDQAEA 865
Cdd:NF038112  1355 SD--GTASATDTVTVTVRNVnrAPVANA---GADQTVDERSTVTLSGSATDPD-GDALTYAWTQTAgPTVTLTGADTATA 1428

CBM6-CBM35-CBM36_like super family

cl14880

Carbohydrate Binding Module 6 (CBM6) and CBM35_like superfamily; Carbohydrate binding module ...

1045-1132

1.96e-05

Carbohydrate Binding Module 6 (CBM6) and CBM35_like superfamily; Carbohydrate binding module family 6 (CBM6, family 6 CBM), also known as cellulose binding domain family VI (CBD VI), and related CBMs (CBM35 and CBM36). These are non-catalytic carbohydrate binding domains found in a range of enzymes that display activities against a diverse range of carbohydrate targets, including mannan, xylan, beta-glucans, cellulose, agarose, and arabinans. These domains facilitate the strong binding of the appended catalytic modules to their dedicated, insoluble substrates. Many of these CBMs are associated with glycoside hydrolase (GH) domains. CBM6 is an unusual CBM as it represents a chimera of two distinct binding sites with different modes of binding: binding site I within the loop regions and binding site II on the concave face of the beta-sandwich fold. CBM36s are calcium-dependent xylan binding domains. CBM35s display conserved specificity through extensive sequence similarity, but divergent function through their appended catalytic modules. This alignment model also contains the C-terminal domains of bacterial insecticidal toxins, where they may be involved in determining insect specificity through carbohydrate binding functionality.

The actual alignment was detected with superfamily member cd04084:

Pssm-ID: 449372 Cd Length: 123 Bit Score: 45.31 E-value: 1.96e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747 1045 AVPSIDLTNigSITMITATIAPVTQTFTFEVYLDSPTGTKVGEGTFKQRAINEGepipyYTPVNIAITGaPDGnKHTLYF 1124
Cdd:cd04084     36 AFKNVDFGS--GATSFTARVASAGAGGTIEVRLDSPDGPLIGTLEVPNTGGWQT-----WTTVSAPVTG-VTG-VHDLYL 106


                   ....*...
gi 1479333747 1125 VSKQNGEG 1132
Cdd:cd04084    107 VFKGGGGD 114

Name

Accession

Description

Interval

E-value

ThuA

pfam06283

Trehalose utilization; This family consists of several bacterial ThuA-like proteins. ThuA ...

33-250

3.19e-98

Pssm-ID: 461867 [Multi-domain] Cd Length: 213 Bit Score: 310.33 E-value: 3.19e-98

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   33 KVLVFSKTAGFYHESIPDGIAAIQKLGAENGFQVDTTKNAENINEENLAQYAAVIFLSTTGDVLNNYQEADFERYIQSGG 112
Cdd:pfam06283    1 RVLVFSGTAGWRHESIPAGIEAIRKLGAENGFEVDATEDAAVFTDENLAQYDVVVFLNTTGDVLDEEQEAAFQRYVQAGG 80

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  113 GYVGIHAAADTEYEWGWYNRLVGGYFSDHpgindpHPNVQPGKITKTAEKHPSTDFLPETWERTDEWYSYKQVSPDTKKL 192
Cdd:pfam06283   81 GFVGLHSAADTEYDWPWYGKLVGARFVAH------DPAPQQATVDVEDRSHPITAGLPAEWERTDEWYNFKPNPPGNHVL 154

                          170       180       190       200       210
                   ....*....|....*....|....*....|....*....|....*....|....*....
gi 1479333747  193 LMLDESSYQGGMDMG-EHPIAWYHDFDGGRAFYTGGGHTKESYSENDFLKHLLAGIQYA 250
Cdd:pfam06283  155 ATTDESSYDGGGNMGvDHPVAWTREDGAGRVFYTALGHTTESYEDPEFRKHLLGGIRWA 213

YliI

COG2133

Glucose/arabinose dehydrogenase, beta-propeller fold [Carbohydrate transport and metabolism];

266-699

4.99e-91

Glucose/arabinose dehydrogenase, beta-propeller fold [Carbohydrate transport and metabolism];

Pssm-ID: 441736 [Multi-domain] Cd Length: 365 Bit Score: 296.84 E-value: 4.99e-91

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  266 RVPEENRFTKTMLsVGEFTEPTEMTILPNLDILVAQRRGEIYLYNNATQELKEVAKLDVYwktevkgVNAEEGLMGIQKD 345
Cdd:COG2133     20 TPTLPPGFTVEVV-ADGLDHPWGLAFLPDGRLLVTERAGRIRLLDDDGKLSTPVADLPVF-------AGGEGGLLGVALD 91

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  346 PNYATNNWVYAFYAPTGDKEiNRLSRFKFANGVWdMASEQVILELYSQrDICCHTGGSIAFDKEGNLYLSTGDNSTPFnq 425
Cdd:COG2133     92 PDFATNGYLYVAYTDPGGAG-TRVARFTLSDGDT-LTSEEVILDGLPA-GGGNHNGGRLAFGPDGKLYVSVGDRGNAC-- 166

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  426 pgskytlngyapldgregnkqwDARRSSGNSNDLRGKILRIKVaeDGSytIPEGNLYPqGTEGTRPEIYVQGLRNPYRIS 505
Cdd:COG2133    167 ----------------------EARGNAQDLNSLRGKILRIDP--DGS--IPADNPFV-GTPGARPEIYAYGHRNPQGLA 219

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  506 VDQKTSFLYWGEVGPDanndsldikgprGYDEVNQARKAGHFGWPYTIGknfayrefnyetgqtGPAFDvagPTNNSPNN 585
Cdd:COG2133    220 FDPETGELWATEHGPD------------GGDELNRIEPGGNYGWPYCEG---------------GQNYD---PIGDSTPD 269

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  586 TGLKQlpPVepafIYYPYAVSPefpqlgtggrnaMAGPVYYSDMypaetrFPDYFDGKLFIYDWIRGWIKVVTMKENGDF 665
Cdd:COG2133    270 AGLTD--PV----ATWPPGHAP------------SGLAFYTGDA------FPAEYRGGLFVADLGSRRVVRVPLDGDGKV 325

                          410       420       430
                   ....*....|....*....|....*....|....
gi 1479333747  666 DKMEPFMKGTkFNAMIDMEMGPDGKIYILEYGNG 699
Cdd:COG2133    326 VGEEDFLTGA-GGRPRDVAQGPDGALYVLDDNDG 358

COG3828

Type 1 glutamine amidotransferase (GATase1)-like domain [General function prediction only];

27-255

8.49e-90

Type 1 glutamine amidotransferase (GATase1)-like domain [General function prediction only];

Pssm-ID: 443040 [Multi-domain] Cd Length: 222 Bit Score: 287.95 E-value: 8.49e-90

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   27 KREGNPKVLVFSKtaGFYHEsIPDGIAAIQKLGAENGFQVDTTKNAENINEENLAQYAAVIFLSTTGDVLNNYQEADFER 106
Cdd:COG3828      2 KAAKKKKVLVFSG--GFRHD-IEAGVPALKELLEENGFEVDVTEDAADFTPENLAKYDLVVFNNTTGDVLTDEQQAALED 78

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  107 YIQSGGGYVGIHAAADTEYEWGWYNRLVGGYFSDHPGIndphpnvQPGKITKTAEKHPSTDFLPETWERTDEWYSYKQV- 185
Cdd:COG3828     79 YVEAGGGFVGIHAATDTFRDWPWYGELVGGQFVSHPPI-------QEATVTVEDPDHPITKGLPDEFTVTDEWYNFLRDp 151

                          170       180       190       200       210       220       230
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  186 SPDTKKLLMLDESSYQGGMDMGEHPIAWYHDFDGGRAFYTGGGHTKESYSENDFLKHLLAGIQYAVGENE 255
Cdd:COG3828    152 RPDVTVLATTDESTYPGGGMGGDHPVAWTREYGKGRVFYTALGHDEESFEDPGFRTLLLRGILWAAGGKV 221

GSDH

pfam07995

Glucose / Sorbosone dehydrogenase; Members of this family are glucose/sorbosone dehydrogenases ...

283-695

5.53e-35

Glucose / Sorbosone dehydrogenase; Members of this family are glucose/sorbosone dehydrogenases that possess a beta-propeller fold.

Pssm-ID: 429776 [Multi-domain] Cd Length: 327 Bit Score: 136.53 E-value: 5.53e-35

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  283 FTEPTEMTILPNLDILVAQRRGEIYLYNNATQELKEVAKL-DVYWKtevkgvnAEEGLMGIQKDPNYATNNWVYAFYAPT 361
Cdd:pfam07995    1 LEHPWGLAFLPDGRMLVTERPGRLRIVDADGKLSTPIAGVpEVAAR-------GQGGLLDVALHPDFAENRWVYLSYAEA 73

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  362 GDKEI-NRLSRFKFANGVWDMASEQVILELYSQRDICCHTGGSIAFDKEGNLYLSTGDNSTpfnqpgskytlngyapldg 440
Cdd:pfam07995   74 GGGGAgTAVARARLSDDGTALEDVEVIFRQIPKVSGGGHFGSRLVFGPDGTLFVTTGDRGD------------------- 134

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  441 regnkqwdaRRSSGNSNDLRGKILRIKvaEDGSytIPEGNlyPQ-GTEGTRPEIYVQGLRNPYRISVDQKTSFLYWGEvg 519
Cdd:pfam07995  135 ---------RDLAQDLDSHLGKILRLN--PDGS--IPADN--PFvGRPGALPEIWSYGHRNPQGLAFDPDTGRLWEHE-- 197

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  520 pdanndsldiKGPRGYDEVNQARKAGHFGWP-YTIGKNFayrefnyetgqTGPAFdvagptnnspnnTGLKQLPPVEPAF 598
Cdd:pfam07995  198 ----------HGPRGGDEINLIEAGKNYGWPvVSYGDNY-----------SGTPI------------GDGTTRPGMEQPV 244

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  599 IYYPYAVSPefpqlgtGGrnaMAgpVYYSDMYPAetrfpdyFDGKLFIYDWIRGWIKVVTMKENGDFDKMEPFMKGtkFN 678
Cdd:pfam07995  245 YYWTPSIAP-------SG---MA--FYTGDAFPE-------WKGDLFVGALKSQALVRLTLDGGGRVVEEERLLGD--LG 303

                          410
                   ....*....|....*...
gi 1479333747  679 AMI-DMEMGPDGKIYILE 695
Cdd:pfam07995  304 QRIrDVRQGPDGALYVLT 321

CytC552

COG4654

Cytochrome c551/c552 [Energy production and conversion];

875-957

7.73e-34

Cytochrome c551/c552 [Energy production and conversion];

Pssm-ID: 443692 [Multi-domain] Cd Length: 88 Bit Score: 125.01 E-value: 7.73e-34

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  875 AMNGKALVQSLTCKTCHKEAEKSVGPAYTEVAKKYRER--DRDYLLNKIKNGGGGVWGETAMPANPDLKSADANALVTYI 952
Cdd:COG4654      4 AAAGKALAKKSGCLACHAVDKKLVGPSYKDVAKKYKGKadAVAKLAKKIKKGGSGVWGDVPMPPHPQLSDAEAKALVKWI 83


                   ....*
gi 1479333747  953 LSLRN 957
Cdd:COG4654     84 LSLKK 88

PKD

pfam00801

PKD domain; This domain was first identified in the Polycystic kidney disease protein PKD1. ...

726-793

1.46e-14

PKD domain; This domain was first identified in the Polycystic kidney disease protein PKD1. This domain has been predicted to contain an Ig-like fold.

Pssm-ID: 395646 [Multi-domain] Cd Length: 70 Bit Score: 69.34 E-value: 1.46e-14

                           10        20        30        40        50        60
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*...
gi 1479333747  726 LTVDKTSGKNPLTVTLTATSADPekDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAG 793
Cdd:pfam00801    1 VSASGTVVAAGQPVTFTATLADG--SNVTYTWDFGDSPGTSGSGPTVTHTYLSPGTYTVTLTASNAVG 66

PKD

cd00146

polycystic kidney disease I (PKD) domain; similar to other cell-surface modules, with an ...

721-803

1.98e-13

polycystic kidney disease I (PKD) domain; similar to other cell-surface modules, with an IG-like fold; domain probably functions as a ligand binding site in protein-protein or protein-carbohydrate interactions; a single instance of the repeat is presented here. The domain is also found in microbial collagenases and chitinases.

Pssm-ID: 238084 [Multi-domain] Cd Length: 81 Bit Score: 66.75 E-value: 1.98e-13

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  721 PVVSSLTVDKTSGKNPLTVTLTATSADpekDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAGMTGV-SA 799
Cdd:cd00146      1 PTASVSAPPVAELGASVTFSASDSSGG---SIVSYKWDFGDGEVSSSGEPTVTHTYTKPGTYTVTLTVTNAVGSSSTkTT 77


                   ....
gi 1479333747  800 PVSV 803
Cdd:cd00146     78 TVVV 81

PKD

smart00089

Repeats in polycystic kidney disease 1 (PKD1) and other proteins; Polycystic kidney disease 1 ...

723-804

3.72e-13

Repeats in polycystic kidney disease 1 (PKD1) and other proteins; Polycystic kidney disease 1 protein contains 14 repeats, present elsewhere such as in microbial collagenases.

Pssm-ID: 214510 [Multi-domain] Cd Length: 79 Bit Score: 65.94 E-value: 3.72e-13

                            10        20        30        40        50        60        70        80
                    ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   723 VSSLTVDKTSGKNPLTVTLTATSADPEkDPMTYTWDLGNGETksTTEPTLTHTYNAVGEYEIKVTAADPAGmtGVSAPVS 802
Cdd:smart00089    1 VADVSASPTVGVAGESVTFTATSSDDG-SIVSYTWDFGDGTS--STGPTVTHTYTKPGTYTVTLTVTNAVG--SASATVT 75


                    ..
gi 1479333747   803 VY 804
Cdd:smart00089   76 VV 77

COG3291

Uncharacterized conserved protein, PKD repeat domain [Function unknown];

727-826

3.28e-08

Uncharacterized conserved protein, PKD repeat domain [Function unknown];

Pssm-ID: 442520 [Multi-domain] Cd Length: 333 Bit Score: 56.99 E-value: 3.28e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  727 TVDKTSGKNPLTVTLTATSadpEKDPMTYTWDLGNGETksTTEPTLTHTYNAVGEYEIKVTAADPAGMTG-VSAPVSVYS 805
Cdd:COG3291      2 TATPTSGCAPLTVQFTDTS---SGNATSYEWDFGDGTT--STEANPSHTYTTPGTYTVTLTVTDAAGCSDtTTKTITVGA 76

                           90       100
                   ....*....|....*....|.
gi 1479333747  806 GNVAPVVSIQIEGNKSFYFPG 826
Cdd:COG3291     77 PNPGVTTVTTSTTVTTLANTA 97

Cytochrom_C

pfam00034

Cytochrome c; The Pfam entry does not include all Prosite members. The cytochrome 556 and ...

877-955

3.09e-07

Cytochrome c; The Pfam entry does not include all Prosite members. The cytochrome 556 and cytochrome c' families are not included. All these are now in a new clan together. The C-terminus of DUF989, pfam06181, has now been merged into this family.

Pssm-ID: 459641 [Multi-domain] Cd Length: 89 Bit Score: 49.46 E-value: 3.09e-07

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  877 NGKALVQsLTCKTCHKEAEKSV---GPAYTEVAKKYRERDRDYLLNKIKNGGGGVWG------ETAMPANPDLKSADANA 947
Cdd:pfam00034    2 RGKKLFA-ANCAACHGVNGEGAgagGPDLAGLAARYPGDALGAIRENKHAIGGGGVDraggppGTGMPAFDGLTDEEIAD 80


                   ....*...
gi 1479333747  948 LVTYILSL 955
Cdd:pfam00034   81 LVAYLLSL 88

PCC

TIGR00864

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) ...

723-811

1.19e-06

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) Polycystin is a huge protein of 4303aas. Its repeated leucine-rich (LRR) segment is found in many proteins. It contains 16 polycystic kidney disease (PKD) domains, one LDL-receptor class A domain, one C-type lectin family domain, and 16-18 putative TMSs in positions between residues 2200 and 4100. Polycystin-L has been shown to be a cation (Na+, K+ and Ca2+) channel that is activated by Ca2+. Two members of the PCC family (polycystin 1 and 2) are mutated in autosomal dominant polycystic kidney disease, and polycystin-L is deleted in mice with renal and retinal defects. Note: this model is restricted to the amino half.

Pssm-ID: 188093 [Multi-domain] Cd Length: 2740 Bit Score: 53.16 E-value: 1.19e-06

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  723 VSSLTVDKTSG---KNPLTVTLTATSADPekdpMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAGMTGVSA 799
Cdd:TIGR00864 1173 IEGLSADMSLAtelGAATTVRAALQSGDN----ITWTFDMGDGKSLSGPEATVEHKYAKAGNCTVNIGAANAAGHGARII 1248

                           90
                   ....*....|..
gi 1479333747  800 PVSVYSGNVAPV 811
Cdd:TIGR00864 1249 HVEVFVFEVAGI 1260

myxo_dep_M36

NF038112

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-865

1.69e-05

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 49.27 E-value: 1.69e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVVSS---LTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGET---KSTTEPTLTHTYNAVGEYE---IKVTA 788
Cdd:NF038112  1280 NRAPVAVAgapATVDERS-----TVTLDGSGTDADGDALTYAWTQTSGPAvtlTGATTATATFTAPEVTADTqltFTLTV 1354

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  789 ADpaGMTGVSAPVSVYSGNV--APVVSIqieGNKSFYFPGKKVGYSVAVTDEDhPDAASDLSTLVV-SADYLQGIDQAEA 865
Cdd:NF038112  1355 SD--GTASATDTVTVTVRNVnrAPVANA---GADQTVDERSTVTLSGSATDPD-GDALTYAWTQTAgPTVTLTGADTATA 1428

CBM6_xylanase-like

cd04084

Carbohydrate Binding Module 6 (CBM6); many are appended to glycoside hydrolase (GH) family 11 ...

1045-1132

1.96e-05

Carbohydrate Binding Module 6 (CBM6); many are appended to glycoside hydrolase (GH) family 11 and GH43 xylanase domains; This family includes carbohydrate binding module 6 (CBM6) domains that are appended mainly to glycoside hydrolase (GH) family domains, including GH3, GH11, and GH43 domains. These CBM6s are non-catalytic carbohydrate binding domains that facilitate the strong binding of the GH catalytic modules with their dedicated, insoluble substrates. Examples of proteins having CMB6s belonging to this family are Microbispora bispora GghA, a 1,4-beta-D-glucan glucohydrolase (GH3); Clostridium thermocellum xylanase U (GH11), and Penicillium purpurogenum ABF3, a bifunctional alpha-L-arabinofuranosidase/xylobiohydrolase (GH43). GH3 comprises enzymes with activities including beta-glucosidase (hydrolyzes beta-galactosidase) and beta-xylosidase (hydrolyzes 1,4-beta-D-xylosidase). GH11 family comprises enzymes with xylanase (endo-1,4-beta-xylanase) activity which catalyze the hydrolysis of beta-1,4 bonds of xylan, the major component of hemicelluloses, to generate xylooligosaccharides and xylose. GH43 includes beta-xylosidases and beta-xylanases, using aryl-glycosides as substrates. CBM6 is an unusual CBM as it represents a chimera of two distinct binding sites with different modes of binding: binding site I within the loop regions and binding site II on the concave face of the beta-sandwich fold.

Pssm-ID: 271150 Cd Length: 123 Bit Score: 45.31 E-value: 1.96e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747 1045 AVPSIDLTNigSITMITATIAPVTQTFTFEVYLDSPTGTKVGEGTFKQRAINEGepipyYTPVNIAITGaPDGnKHTLYF 1124
Cdd:cd04084     36 AFKNVDFGS--GATSFTARVASAGAGGTIEVRLDSPDGPLIGTLEVPNTGGWQT-----WTTVSAPVTG-VTG-VHDLYL 106


                   ....*...
gi 1479333747 1125 VSKQNGEG 1132
Cdd:cd04084    107 VFKGGGGD 114

myxo_dep_M36

NF038112

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-810

1.14e-04

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 46.57 E-value: 1.14e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVVS---SLTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGET---KSTTEPTLTHT---YNAVGEYEIKVTA 788
Cdd:NF038112  1467 NRAPVAHageSITVDEGS-----TVTLDASATDPDGDTLTYAWTQVAGPSvtlTGADSAKLTFTapeVSADTTLTFSLTV 1541

                           90       100
                   ....*....|....*....|...
gi 1479333747  789 ADPAGMTGVS-APVSVYSGNVAP 810
Cdd:NF038112  1542 TDGSGSSGPVvVTVTVKNVNRAP 1564

PCC

TIGR00864

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) ...

671-825

3.11e-04

Pssm-ID: 188093 [Multi-domain] Cd Length: 2740 Bit Score: 45.07 E-value: 3.11e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  671 FMKGTK----FNAMIDMEmgPDGKIYILEyGNGWFSKNRDSGLSRIDFNGGNrapVVSSLTVDKT-------------SG 733
Cdd:TIGR00864 1632 FKDGTNlsfsWNAILDNE--PDGPAFAGS-GKGAKLNPLEAGPCDIFLQAAN---LLGQATADCTidflepagnlmlaAS 1705

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  734 KNPLTV--TLTATSADPEKDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAGMTGVSAPVSVYsgnvAPV 811
Cdd:TIGR00864 1706 DNPAAVnaLINLSAELAEGSGLQYRWFLEEGDDLETSEPFMSHSFPSAGLHLVTMKAFNELGSANASEEVDVQ----EPI 1781

                          170
                   ....*....|....*..
gi 1479333747  812 VSIQI---EGNKSFYFP 825
Cdd:TIGR00864 1782 SGLKIraaDAGEQNFFA 1798

myxo_dep_M36

NF038112

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-840

4.08e-04

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 44.65 E-value: 4.08e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVV---SSLTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGETKS-TTEPTLTHTYNA-------VGEYEIKV 786
Cdd:NF038112  1373 NRAPVAnagADQTVDERS-----TVTLSGSATDPDGDALTYAWTQTAGPTVTlTGADTATASFTApevaadtELTFQLTV 1447

                           90       100       110       120       130
                   ....*....|....*....|....*....|....*....|....*....|....
gi 1479333747  787 TaADPAGMTGVSAPVSVYSGNVAPVVSiqiEGNKSFYFPGKKVGYSVAVTDEDH 840
Cdd:NF038112  1448 S-ADGQASADVTVTVTVRNVNRAPVAH---AGESITVDEGSTVTLDASATDPDG 1497

Name

Accession

Description

Interval

E-value

ThuA

pfam06283

Trehalose utilization; This family consists of several bacterial ThuA-like proteins. ThuA ...

33-250

3.19e-98

Pssm-ID: 461867 [Multi-domain] Cd Length: 213 Bit Score: 310.33 E-value: 3.19e-98

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   33 KVLVFSKTAGFYHESIPDGIAAIQKLGAENGFQVDTTKNAENINEENLAQYAAVIFLSTTGDVLNNYQEADFERYIQSGG 112
Cdd:pfam06283    1 RVLVFSGTAGWRHESIPAGIEAIRKLGAENGFEVDATEDAAVFTDENLAQYDVVVFLNTTGDVLDEEQEAAFQRYVQAGG 80

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  113 GYVGIHAAADTEYEWGWYNRLVGGYFSDHpgindpHPNVQPGKITKTAEKHPSTDFLPETWERTDEWYSYKQVSPDTKKL 192
Cdd:pfam06283   81 GFVGLHSAADTEYDWPWYGKLVGARFVAH------DPAPQQATVDVEDRSHPITAGLPAEWERTDEWYNFKPNPPGNHVL 154

                          170       180       190       200       210
                   ....*....|....*....|....*....|....*....|....*....|....*....
gi 1479333747  193 LMLDESSYQGGMDMG-EHPIAWYHDFDGGRAFYTGGGHTKESYSENDFLKHLLAGIQYA 250
Cdd:pfam06283  155 ATTDESSYDGGGNMGvDHPVAWTREDGAGRVFYTALGHTTESYEDPEFRKHLLGGIRWA 213

YliI

COG2133

Glucose/arabinose dehydrogenase, beta-propeller fold [Carbohydrate transport and metabolism];

266-699

4.99e-91

Glucose/arabinose dehydrogenase, beta-propeller fold [Carbohydrate transport and metabolism];

Pssm-ID: 441736 [Multi-domain] Cd Length: 365 Bit Score: 296.84 E-value: 4.99e-91

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  266 RVPEENRFTKTMLsVGEFTEPTEMTILPNLDILVAQRRGEIYLYNNATQELKEVAKLDVYwktevkgVNAEEGLMGIQKD 345
Cdd:COG2133     20 TPTLPPGFTVEVV-ADGLDHPWGLAFLPDGRLLVTERAGRIRLLDDDGKLSTPVADLPVF-------AGGEGGLLGVALD 91

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  346 PNYATNNWVYAFYAPTGDKEiNRLSRFKFANGVWdMASEQVILELYSQrDICCHTGGSIAFDKEGNLYLSTGDNSTPFnq 425
Cdd:COG2133     92 PDFATNGYLYVAYTDPGGAG-TRVARFTLSDGDT-LTSEEVILDGLPA-GGGNHNGGRLAFGPDGKLYVSVGDRGNAC-- 166

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  426 pgskytlngyapldgregnkqwDARRSSGNSNDLRGKILRIKVaeDGSytIPEGNLYPqGTEGTRPEIYVQGLRNPYRIS 505
Cdd:COG2133    167 ----------------------EARGNAQDLNSLRGKILRIDP--DGS--IPADNPFV-GTPGARPEIYAYGHRNPQGLA 219

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  506 VDQKTSFLYWGEVGPDanndsldikgprGYDEVNQARKAGHFGWPYTIGknfayrefnyetgqtGPAFDvagPTNNSPNN 585
Cdd:COG2133    220 FDPETGELWATEHGPD------------GGDELNRIEPGGNYGWPYCEG---------------GQNYD---PIGDSTPD 269

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  586 TGLKQlpPVepafIYYPYAVSPefpqlgtggrnaMAGPVYYSDMypaetrFPDYFDGKLFIYDWIRGWIKVVTMKENGDF 665
Cdd:COG2133    270 AGLTD--PV----ATWPPGHAP------------SGLAFYTGDA------FPAEYRGGLFVADLGSRRVVRVPLDGDGKV 325

                          410       420       430
                   ....*....|....*....|....*....|....
gi 1479333747  666 DKMEPFMKGTkFNAMIDMEMGPDGKIYILEYGNG 699
Cdd:COG2133    326 VGEEDFLTGA-GGRPRDVAQGPDGALYVLDDNDG 358

COG3828

Type 1 glutamine amidotransferase (GATase1)-like domain [General function prediction only];

27-255

8.49e-90

Type 1 glutamine amidotransferase (GATase1)-like domain [General function prediction only];

Pssm-ID: 443040 [Multi-domain] Cd Length: 222 Bit Score: 287.95 E-value: 8.49e-90

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   27 KREGNPKVLVFSKtaGFYHEsIPDGIAAIQKLGAENGFQVDTTKNAENINEENLAQYAAVIFLSTTGDVLNNYQEADFER 106
Cdd:COG3828      2 KAAKKKKVLVFSG--GFRHD-IEAGVPALKELLEENGFEVDVTEDAADFTPENLAKYDLVVFNNTTGDVLTDEQQAALED 78

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  107 YIQSGGGYVGIHAAADTEYEWGWYNRLVGGYFSDHPGIndphpnvQPGKITKTAEKHPSTDFLPETWERTDEWYSYKQV- 185
Cdd:COG3828     79 YVEAGGGFVGIHAATDTFRDWPWYGELVGGQFVSHPPI-------QEATVTVEDPDHPITKGLPDEFTVTDEWYNFLRDp 151

                          170       180       190       200       210       220       230
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  186 SPDTKKLLMLDESSYQGGMDMGEHPIAWYHDFDGGRAFYTGGGHTKESYSENDFLKHLLAGIQYAVGENE 255
Cdd:COG3828    152 RPDVTVLATTDESTYPGGGMGGDHPVAWTREYGKGRVFYTALGHDEESFEDPGFRTLLLRGILWAAGGKV 221

GSDH

pfam07995

Glucose / Sorbosone dehydrogenase; Members of this family are glucose/sorbosone dehydrogenases ...

283-695

5.53e-35

Glucose / Sorbosone dehydrogenase; Members of this family are glucose/sorbosone dehydrogenases that possess a beta-propeller fold.

Pssm-ID: 429776 [Multi-domain] Cd Length: 327 Bit Score: 136.53 E-value: 5.53e-35

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  283 FTEPTEMTILPNLDILVAQRRGEIYLYNNATQELKEVAKL-DVYWKtevkgvnAEEGLMGIQKDPNYATNNWVYAFYAPT 361
Cdd:pfam07995    1 LEHPWGLAFLPDGRMLVTERPGRLRIVDADGKLSTPIAGVpEVAAR-------GQGGLLDVALHPDFAENRWVYLSYAEA 73

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  362 GDKEI-NRLSRFKFANGVWDMASEQVILELYSQRDICCHTGGSIAFDKEGNLYLSTGDNSTpfnqpgskytlngyapldg 440
Cdd:pfam07995   74 GGGGAgTAVARARLSDDGTALEDVEVIFRQIPKVSGGGHFGSRLVFGPDGTLFVTTGDRGD------------------- 134

                          170       180       190       200       210       220       230       240
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  441 regnkqwdaRRSSGNSNDLRGKILRIKvaEDGSytIPEGNlyPQ-GTEGTRPEIYVQGLRNPYRISVDQKTSFLYWGEvg 519
Cdd:pfam07995  135 ---------RDLAQDLDSHLGKILRLN--PDGS--IPADN--PFvGRPGALPEIWSYGHRNPQGLAFDPDTGRLWEHE-- 197

                          250       260       270       280       290       300       310       320
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  520 pdanndsldiKGPRGYDEVNQARKAGHFGWP-YTIGKNFayrefnyetgqTGPAFdvagptnnspnnTGLKQLPPVEPAF 598
Cdd:pfam07995  198 ----------HGPRGGDEINLIEAGKNYGWPvVSYGDNY-----------SGTPI------------GDGTTRPGMEQPV 244

                          330       340       350       360       370       380       390       400
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  599 IYYPYAVSPefpqlgtGGrnaMAgpVYYSDMYPAetrfpdyFDGKLFIYDWIRGWIKVVTMKENGDFDKMEPFMKGtkFN 678
Cdd:pfam07995  245 YYWTPSIAP-------SG---MA--FYTGDAFPE-------WKGDLFVGALKSQALVRLTLDGGGRVVEEERLLGD--LG 303

                          410
                   ....*....|....*...
gi 1479333747  679 AMI-DMEMGPDGKIYILE 695
Cdd:pfam07995  304 QRIrDVRQGPDGALYVLT 321

CytC552

COG4654

Cytochrome c551/c552 [Energy production and conversion];

875-957

7.73e-34

Cytochrome c551/c552 [Energy production and conversion];

Pssm-ID: 443692 [Multi-domain] Cd Length: 88 Bit Score: 125.01 E-value: 7.73e-34

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  875 AMNGKALVQSLTCKTCHKEAEKSVGPAYTEVAKKYRER--DRDYLLNKIKNGGGGVWGETAMPANPDLKSADANALVTYI 952
Cdd:COG4654      4 AAAGKALAKKSGCLACHAVDKKLVGPSYKDVAKKYKGKadAVAKLAKKIKKGGSGVWGDVPMPPHPQLSDAEAKALVKWI 83


                   ....*
gi 1479333747  953 LSLRN 957
Cdd:COG4654     84 LSLKK 88

PKD

pfam00801

PKD domain; This domain was first identified in the Polycystic kidney disease protein PKD1. ...

726-793

1.46e-14

PKD domain; This domain was first identified in the Polycystic kidney disease protein PKD1. This domain has been predicted to contain an Ig-like fold.

Pssm-ID: 395646 [Multi-domain] Cd Length: 70 Bit Score: 69.34 E-value: 1.46e-14

                           10        20        30        40        50        60
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*...
gi 1479333747  726 LTVDKTSGKNPLTVTLTATSADPekDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAG 793
Cdd:pfam00801    1 VSASGTVVAAGQPVTFTATLADG--SNVTYTWDFGDSPGTSGSGPTVTHTYLSPGTYTVTLTASNAVG 66

PKD

cd00146

polycystic kidney disease I (PKD) domain; similar to other cell-surface modules, with an ...

721-803

1.98e-13

Pssm-ID: 238084 [Multi-domain] Cd Length: 81 Bit Score: 66.75 E-value: 1.98e-13

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  721 PVVSSLTVDKTSGKNPLTVTLTATSADpekDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAGMTGV-SA 799
Cdd:cd00146      1 PTASVSAPPVAELGASVTFSASDSSGG---SIVSYKWDFGDGEVSSSGEPTVTHTYTKPGTYTVTLTVTNAVGSSSTkTT 77


                   ....
gi 1479333747  800 PVSV 803
Cdd:cd00146     78 TVVV 81

PKD

smart00089

Repeats in polycystic kidney disease 1 (PKD1) and other proteins; Polycystic kidney disease 1 ...

723-804

3.72e-13

Repeats in polycystic kidney disease 1 (PKD1) and other proteins; Polycystic kidney disease 1 protein contains 14 repeats, present elsewhere such as in microbial collagenases.

Pssm-ID: 214510 [Multi-domain] Cd Length: 79 Bit Score: 65.94 E-value: 3.72e-13

                            10        20        30        40        50        60        70        80
                    ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   723 VSSLTVDKTSGKNPLTVTLTATSADPEkDPMTYTWDLGNGETksTTEPTLTHTYNAVGEYEIKVTAADPAGmtGVSAPVS 802
Cdd:smart00089    1 VADVSASPTVGVAGESVTFTATSSDDG-SIVSYTWDFGDGTS--STGPTVTHTYTKPGTYTVTLTVTNAVG--SASATVT 75


                    ..
gi 1479333747   803 VY 804
Cdd:smart00089   76 VV 77

PKD_4

pfam18911

PKD domain; This entry is composed of PKD domains found in bacterial surface proteins.

718-803

2.86e-09

PKD domain; This entry is composed of PKD domains found in bacterial surface proteins.

Pssm-ID: 436824 [Multi-domain] Cd Length: 85 Bit Score: 54.97 E-value: 2.86e-09

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVVSSLTVDKTSGknPLTVTLTAT-SADPEKDPMTYTWDLGNGETksTTEPTLTHTYNAVGEYEIKVTAADPAGMTG 796
Cdd:pfam18911    1 NAAPVADAGGDRIVAE--GETVTFDASaSDDPDGDILSYRWDFGDGTT--ATGANVSHTYAAPGTYTVTLTVTDDSGASN 76


                   ....*..
gi 1479333747  797 VSAPVSV 803
Cdd:pfam18911   77 STATDTV 83

COG3291

Uncharacterized conserved protein, PKD repeat domain [Function unknown];

727-826

3.28e-08

Uncharacterized conserved protein, PKD repeat domain [Function unknown];

Pssm-ID: 442520 [Multi-domain] Cd Length: 333 Bit Score: 56.99 E-value: 3.28e-08

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  727 TVDKTSGKNPLTVTLTATSadpEKDPMTYTWDLGNGETksTTEPTLTHTYNAVGEYEIKVTAADPAGMTG-VSAPVSVYS 805
Cdd:COG3291      2 TATPTSGCAPLTVQFTDTS---SGNATSYEWDFGDGTT--STEANPSHTYTTPGTYTVTLTVTDAAGCSDtTTKTITVGA 76

                           90       100
                   ....*....|....*....|.
gi 1479333747  806 GNVAPVVSIQIEGNKSFYFPG 826
Cdd:COG3291     77 PNPGVTTVTTSTTVTTLANTA 97

Cytochrom_C

pfam00034

Cytochrome c; The Pfam entry does not include all Prosite members. The cytochrome 556 and ...

877-955

3.09e-07

Pssm-ID: 459641 [Multi-domain] Cd Length: 89 Bit Score: 49.46 E-value: 3.09e-07

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  877 NGKALVQsLTCKTCHKEAEKSV---GPAYTEVAKKYRERDRDYLLNKIKNGGGGVWG------ETAMPANPDLKSADANA 947
Cdd:pfam00034    2 RGKKLFA-ANCAACHGVNGEGAgagGPDLAGLAARYPGDALGAIRENKHAIGGGGVDraggppGTGMPAFDGLTDEEIAD 80


                   ....*...
gi 1479333747  948 LVTYILSL 955
Cdd:pfam00034   81 LVAYLLSL 88

PCC

TIGR00864

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) ...

723-811

1.19e-06

Pssm-ID: 188093 [Multi-domain] Cd Length: 2740 Bit Score: 53.16 E-value: 1.19e-06

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  723 VSSLTVDKTSG---KNPLTVTLTATSADPekdpMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAGMTGVSA 799
Cdd:TIGR00864 1173 IEGLSADMSLAtelGAATTVRAALQSGDN----ITWTFDMGDGKSLSGPEATVEHKYAKAGNCTVNIGAANAAGHGARII 1248

                           90
                   ....*....|..
gi 1479333747  800 PVSVYSGNVAPV 811
Cdd:TIGR00864 1249 HVEVFVFEVAGI 1260

myxo_dep_M36

NF038112

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-865

1.69e-05

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 49.27 E-value: 1.69e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVVSS---LTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGET---KSTTEPTLTHTYNAVGEYE---IKVTA 788
Cdd:NF038112  1280 NRAPVAVAgapATVDERS-----TVTLDGSGTDADGDALTYAWTQTSGPAvtlTGATTATATFTAPEVTADTqltFTLTV 1354

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  789 ADpaGMTGVSAPVSVYSGNV--APVVSIqieGNKSFYFPGKKVGYSVAVTDEDhPDAASDLSTLVV-SADYLQGIDQAEA 865
Cdd:NF038112  1355 SD--GTASATDTVTVTVRNVnrAPVANA---GADQTVDERSTVTLSGSATDPD-GDALTYAWTQTAgPTVTLTGADTATA 1428

CBM6_xylanase-like

cd04084

Carbohydrate Binding Module 6 (CBM6); many are appended to glycoside hydrolase (GH) family 11 ...

1045-1132

1.96e-05

Pssm-ID: 271150 Cd Length: 123 Bit Score: 45.31 E-value: 1.96e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747 1045 AVPSIDLTNigSITMITATIAPVTQTFTFEVYLDSPTGTKVGEGTFKQRAINEGepipyYTPVNIAITGaPDGnKHTLYF 1124
Cdd:cd04084     36 AFKNVDFGS--GATSFTARVASAGAGGTIEVRLDSPDGPLIGTLEVPNTGGWQT-----WTTVSAPVTG-VTG-VHDLYL 106


                   ....*...
gi 1479333747 1125 VSKQNGEG 1132
Cdd:cd04084    107 VFKGGGGD 114

COG4285

Uncharacterized conserved protein, conains N-terminal glutamine amidotransferase (GATase1) ...

32-128

9.72e-05

Uncharacterized conserved protein, conains N-terminal glutamine amidotransferase (GATase1)-like domain [General function prediction only];

Pssm-ID: 443426 [Multi-domain] Cd Length: 221 Bit Score: 45.03 E-value: 9.72e-05

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747   32 PKVLVFSKTAGfYHESIPDGIAAIQKLGaeNGFQVDTTkNAENINEENLAQYAAVIF----LSTTGDVLNNYQEADFERY 107
Cdd:COG4285      9 PRVLVYRGPGA-SDDCVEALVRALKQLN--LGFKVRYV-TAEDITAGTLANADLLIQpgggDLPYYKALGGEGNAAIREF 84

                           90       100
                   ....*....|....*....|....
gi 1479333747  108 IQSGGGYVGIHA---AADTEYEWG 128
Cdd:COG4285     85 VENGGGYLGICAgayLASKYVGFG 108

myxo_dep_M36

NF038112

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-810

1.14e-04

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 46.57 E-value: 1.14e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVVS---SLTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGET---KSTTEPTLTHT---YNAVGEYEIKVTA 788
Cdd:NF038112  1467 NRAPVAHageSITVDEGS-----TVTLDASATDPDGDTLTYAWTQVAGPSvtlTGADSAKLTFTapeVSADTTLTFSLTV 1541

                           90       100
                   ....*....|....*....|...
gi 1479333747  789 ADPAGMTGVS-APVSVYSGNVAP 810
Cdd:NF038112  1542 TDGSGSSGPVvVTVTVKNVNRAP 1564

PCC

TIGR00864

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) ...

701-823

1.41e-04

Pssm-ID: 188093 [Multi-domain] Cd Length: 2740 Bit Score: 46.23 E-value: 1.41e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  701 FSKNRDSGLSRIDFNGGNRAPVVSSLTVDKTSGKnpltVTLTA--------------TSADPEKdPMTYTWDLGNGETKS 766
Cdd:TIGR00864 1310 FRGNGTFPLALTISSGVNKAHFFTQICVEPELGK----ISLQAekqffalgdeaqfqACAEPEF-NYRYEWDFGGEEAAP 1384

                           90       100       110       120       130
                   ....*....|....*....|....*....|....*....|....*....|....*....
gi 1479333747  767 TTE--PTLTHTYNAVGEYEIKVTAADPAGMTGVSAPVSVYSgnvaPVVSIQIEGNKSFY 823
Cdd:TIGR00864 1385 LPAagAEVTFIYNDPGCYLVTVAASNNISAANDSALIEVLE----PVGATSFKHNGSHG 1439

PCC

TIGR00864

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) ...

745-841

2.84e-04

Pssm-ID: 188093 [Multi-domain] Cd Length: 2740 Bit Score: 45.46 E-value: 2.84e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  745 SADPEKDPMTYTWDLGNGETksTTEPTLTHTYNAVGEYEIKVTAADPAGMTGVSAPVSV---YSGNVAPVVSIQIEGNKS 821
Cdd:TIGR00864 1451 SAFGRARNASYLWDFGDGGL--LEGPEILHAFNSPGDFNIRLAAANEVGKNEATLNVAVkarVRGLTINASLTNVPLNGS 1528

                           90       100
                   ....*....|....*....|....*
gi 1479333747  822 FYF-----PGKKVGYSVAVTDEDHP 841
Cdd:TIGR00864 1529 VHFeahldAGDDVRFSWILCDHCTP 1553

PCC

TIGR00864

polycystin cation channel protein; The Polycystin Cation Channel (PCC) Family (TC 1.A.5) ...

671-825

3.11e-04

Pssm-ID: 188093 [Multi-domain] Cd Length: 2740 Bit Score: 45.07 E-value: 3.11e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  671 FMKGTK----FNAMIDMEmgPDGKIYILEyGNGWFSKNRDSGLSRIDFNGGNrapVVSSLTVDKT-------------SG 733
Cdd:TIGR00864 1632 FKDGTNlsfsWNAILDNE--PDGPAFAGS-GKGAKLNPLEAGPCDIFLQAAN---LLGQATADCTidflepagnlmlaAS 1705

                           90       100       110       120       130       140       150       160
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  734 KNPLTV--TLTATSADPEKDPMTYTWDLGNGETKSTTEPTLTHTYNAVGEYEIKVTAADPAGMTGVSAPVSVYsgnvAPV 811
Cdd:TIGR00864 1706 DNPAAVnaLINLSAELAEGSGLQYRWFLEEGDDLETSEPFMSHSFPSAGLHLVTMKAFNELGSANASEEVDVQ----EPI 1781

                          170
                   ....*....|....*..
gi 1479333747  812 VSIQI---EGNKSFYFP 825
Cdd:TIGR00864 1782 SGLKIraaDAGEQNFFA 1798

myxo_dep_M36

NF038112

myxosortase-dependent M36 family metallopeptidase; Members of this bacterial protein family ...

718-840

4.08e-04

Pssm-ID: 468355 [Multi-domain] Cd Length: 1597 Bit Score: 44.65 E-value: 4.08e-04

                           10        20        30        40        50        60        70        80
                   ....*....|....*....|....*....|....*....|....*....|....*....|....*....|....*....|
gi 1479333747  718 NRAPVV---SSLTVDKTSgknplTVTLTATSADPEKDPMTYTWDLGNGETKS-TTEPTLTHTYNA-------VGEYEIKV 786
Cdd:NF038112  1373 NRAPVAnagADQTVDERS-----TVTLSGSATDPDGDALTYAWTQTAGPTVTlTGADTATASFTApevaadtELTFQLTV 1447

                           90       100       110       120       130
                   ....*....|....*....|....*....|....*....|....*....|....
gi 1479333747  787 TaADPAGMTGVSAPVSVYSGNVAPVVSiqiEGNKSFYFPGKKVGYSVAVTDEDH 840
Cdd:NF038112  1448 S-ADGQASADVTVTVTVRNVNRAPVAH---AGESITVDEGSTVTLDASATDPDG 1497

Blast search parameters

Data Source:	Precalculated data, version = cdd.v.3.21
Preset Options:	Database: CDSEARCH/cdd Low complexity filter: no Composition Based Adjustment: yes E-value threshold: 0.01