Accueil / Information / Aller plus loin... / Comprendre les allergènes / Allergènes et allergénicité / Structure des allergènes protéiques
Structure des allergènes protéiques
vendredi 21 novembre 2008, par
Les allergènes protéiques ont-ils une structure caractéristique ?
Malgré les multiples études entreprises pour tenter de trouver une caractéristique qui différencierait un allergène d’une protéine banale, il n’a pu être montré jusqu’à présent pourquoi certaines protéines sont des allergènes, ni pourquoi certaines portions des protéines allergéniques sont des épitopes.
On observe bien que certains allergènes partagent une même fonction biochimique, une activité enzymatique par exemple, mais ni cela, ni la stabilité ou non des protéines, ni leur glycosylation ou non (cf. Les CCD) ne permettent de définir une caractéristique fiable pour pouvoir assurer qu’une protéine est un allergène (cf. Prédiction de l’allergénicité).
Malgré tout, la structure des protéines et la nature des épitopes est importante à connaître pour mieux comprendre les allergènes, leurs homologies et leurs réactivités croisées .
Protéines et peptides
Les protéines sont formées d’un assemblage linéaire d’acides aminés. Elles se distinguent en cela des polysaccharides qui peuvent former des macromolécules ramifiées.
Il est convenu de nommer « protéines » les polypeptides d’au moins 100 acides aminés et « peptides » ceux qui sont plus courts.
Cette notion tend à s’effacer s’agissant des allergènes protéiques car la limite basse permettant encore une réactivité avec les cellules cibles est de l’ordre de 35 acides aminés. Par exemple l’un des principaux allergènes du latex d’hévéa, l’hévéine Hev b 6.02, n’a que 43 acides aminés.
Cette limite basse correspond à une nécessité : présenter au moins 2 épitopes B, c’est-à-dire 2 épitopes IgE-réactifs. Ceux-ci étant constitués d’une dizaine d’acides aminés, des contraintes stériques (= volume dans l’espace) empêchent probablement la liaison de 2 IgE adjacentes à la surface d’une cellule cible avec un polypeptide de seulement une vingtaine d’acides aminés.
Il faut souligner que, très généralement, les protéines acquièrent sitôt leur synthèse une conformation globulaire indispensable à leur stabilité aussi bien qu’à leur fonction biochimique. Ce repliement sur soi du polypeptide aboutit à placer certaines portions de la protéine en position d’être des épitopes B s’ils sont situés en surface de la molécule, tandis que d’autres portions seront, le plus souvent, inaccessibles à une liaison avec les IgE.
On voit qu’une partie des acides aminés dans une protéine native a un rôle indispensable, à savoir la formation et le maintien d’une structure donnée dans l’espace, mais ne participe pas directement aux épitopes B de cette protéine.
Il faut donc un minimum de ces acides aminés « accessoires » pour compléter la présence d’au moins 2 épitopes sur une même molécule. Ce qui explique la limite basse d’environ 35 acides aminés au total pour un allergène.
Caractéristiques des protéines : leurs masses
Il est habituel de décrire les allergènes avec une autre mesure que le nombre de leurs acides aminés. On utilise une notion de masse. Celle-ci dérive en partie du nombre des acides aminés, chacun d’eux « pesant » environ 110 g/mole.
L’unité de masse des protéines est le kilo-Dalton, abrégé en kDa (ou kD), et 1 kDa est quasiment égal à 1 kg/mole. Par exemple, un peptide de 10 acides aminés aura une masse d’environ 10x110/1000 = 1,1 kDa.
Les allergènes ont des masses allant de 3,5-4 kDa à plus de 150 kDa.
La masse d’un allergène n’est pas la somme exacte de ses acides aminés car des modifications sont souvent apportées au polypeptide sitôt sa synthèse par le système ribosomique.
Ces transformations « post-traductionnelles » comprennent notamment une glycosylation, c’est-à-dire la fixation de glucides plus ou moins complexes à des endroits précis du polypeptide (cf. Les CCD). On obtient une protéine glycosylée, une glycoprotéine.
L’adjonction de ces chaînes glucidiques alourdit la protéine. Cela est visible, par exemple, quand on compare un allergène glycosylé à l’état naturel et son équivalent sous forme d’un recombinant issu d’E. coli : la bactérie ne pouvant glycosyler la protéine, cette dernière sera quelques kDa plus légère que la protéine naturelle.
Mais on connaît aussi des allergènes qui, à l’état naturel, se présentent sous 2 formes, l’une glycosylée et l’autre non glycosylée. C’est le cas, par exemple, pour l’allergène principal du pollen d’olivier, Ole e 1, qui a une masse de 20 kDa quand il est glycosylé et de 18,5 kDa quand il ne l’est pas .
S’agissant de la masse, enfin, il faut bien faire la distinction entre la masse réelle et la masse apparente, celle que l’on observe avec les techniques de séparation électrophorétique comme le « SDS-PAGE ».
Il est fréquent de trouver dans les résultats publiés la notion de « bande » IgE-réactive à x kDa ; ou, dans les tests de réactivité croisée, l’effacement de la bande de y kDa qui était présente avant addition de l’inhibiteur (cf. Réactivité croisée : méthodes). Ces masses observées en SDS-PAGE n’ont qu’une valeur indicative et ne peuvent servir à tout coup pour reconnaître tel ou tel allergène.
La masse apparente dépend des conditions opératoires, au premier rang desquelles le pré-traitement ou non de l’extrait (ou de l’allergène) par un agent réducteur. La migration des protéines est bouleversée si ce qui représentait une seule molécule se transforme en 2 ou 3 morceaux après traitement par un agent réducteur, à savoir si la protéine d’origine était un assemblage de sous-unités liées par des ponts disulfure (ponts « SS »).
Il arrive aussi que 2 allergènes se retrouvent superposés au même endroit (= avec la même masse apparente), et que l’on interprète improprement les IgE-réactivités correspondantes. Cela a été le cas pour 2 allergènes du latex d’hévéa, Hev b 7 et Hev b 13 qui, tous les deux, migraient à 42-44 kDa (cf. les allergènes du latex).
C’est pourquoi les méthodes de séparation « bidirectionnelles » sont de plus en plus utilisées.
Elles allient une séparation électrophorétique de type SDS-PAGE à une séparation dans une autre direction et basée sur le principe de l’électro-focalisation . Cette dernière sépare les macromolécules en fonction de leur point isoélectrique (leur « pI »), c’est-à-dire l’endroit dans une gamme de pH où la macromolécule montre autant d’ions + que d’ions -.
La figure ci-dessous, reproduite avec l’aimable autorisation de Pascal Poncet , donne un exemple de la séparation bidimensionnelle des protéines du pollen de frêne (Fraxinus excelsior). Les spots de couleur brune correspondent à une révélation de l’ensemble des protéines par une coloration à l’argent. Les ronds bleus correspondent aux protéines IgE-réactives révélées si par le sérum d’un patient. Cette révélation constitue une " immuno-empreinte ". On parle couramment d’ " immunoblot " ou tout simplement de " blot ".
Caractéristiques des protéines : leurs séquences
La caractéristique la plus utilisée pour décrire ou comparer les protéines est la séquence polypeptidique, c’est-à-dire quels sont les acides aminés qui composent le polypeptide en commençant par l’acide aminé N-terminal (celui qui, au bout, est lié par sa fonction acide à l’acide aminé suivant).
L’écriture de cette séquence utilise des lettres pour désigner les acides aminés. Dans le cas d’Hev b 6.02, l’hévéine du latex d’hévéa, on a la symbolisation suivante pour la séquence polypeptidique, avec numérotation à partir de l’acide aminé N-terminal :
La séquence en acides aminés définit la structure primaire de la protéine. C’est la signature de la protéine.
Les isoformes d’un même allergène se caractérisent par des acides aminés différents ici ou là sur la séquence, celle-ci étant globalement similaire. On parle de « conservation » des acides aminés pour ceux qui sont identiques au même emplacement sur la chaîne polypeptidique.
On se sert de la séquence des acides aminés pour comparer les allergènes entre eux ou pour comparer un allergène connu à une protéine dont l’allergénicité est pour l’instant ignorée. On opère un « alignement de séquences ». En reprenant l’exemple de l’hévéine du latex, la comparaison de séquences avec la portion N-terminale (dite « domaine hévéine ») de 2 allergènes alimentaires croisant avec l’hévéine est figurée ci-dessous :
Sont représentés ici en rouge les acides aminés qui sont identiques parmi les 3 séquences. En bleu ont été notés les acides aminés qui diffèrent dans les 2 chitinases par rapport à Hev b 6.02. La proportion de ces acides aminés identiques permet de calculer un pourcentage d’identité et ce dernier fait partie des indices pour une éventuelle réactivité croisée entre les 2 protéines concernées.
Dans ces alignements de séquence, il est souvent nécessaire d’introduire des « gaps », ici marqués par une étoile *. Ces trous sont placés non pas pour optimiser le % d’identité mais pour reconstituer au mieux le « motif » d’acides aminés caractéristique de la famille ou du domaine protéique (cf. Allergènes : nomenclature, classification).
On voit dans l’exemple ci-dessus que les acides aminés identiques sont répartis de place en place le long de la chaîne polypeptidique et que beaucoup ont la lettre « C », le symbole pour la cystéine. Ainsi qu’il sera expliqué plus loin, cet acide aminé joue un grand rôle dans l’obtention et le maintien de la forme sous laquelle la protéine peut jouer son rôle dans l’organisme : le structure tertiaire.
Les autres acides aminés ne sont pas que des figurants : leur nature et leur place est importante tant pour certaines propriétés de la protéine (ils peuvent être essentiels au niveau du site actif dans le cas d’une enzyme), que pour le niveau immédiatement supérieur de la conformation d’une protéine, la structure secondaire.
Les différents niveaux de structure
On distingue 4 niveaux de structure pour les protéines.
La structure primaire est, on l’a vu, l’ordonnancement des acides aminés, la séquence polypeptidique.
La structure secondaire correspond au résultat local de la présence d’acides aminés capables de créer entre eux des interactions. Ce sont des liaisons faibles, qui sont perdues notamment si la température s’élève et retrouvées (pas toujours) au cours du refroidissement.
La cuisson d’un aliment, par exemple, peut aboutir à une altération de la structure secondaire avec, pour certains allergènes, diminution de l’IgE-réactivité.
La structure secondaire consiste en des contractions de la chaîne polypeptidique sous des formes hélicoïdales ou en feuillets. La vue ci-après donne un exemple de ces configurations :
Toutes les protéines ne se contractent pas ainsi. Certaines adoptent une conformation imprécise et se présentent sous la forme d’une chaîne allongée et déformable.
C’est le cas, par exemple, pour des gluténines dans le grain de blé ou pour des caséines dans le lait. Cette conformation lâche facilite la constitution de réseaux macromoléculaires du fait de l’exposition de nombreux acides aminés capables de former des liaisons d’une molécule à une autre.
Elle est par ailleurs moins sujette à l’altération des épitopes par suite du chauffage de la protéine.
On connaît aussi des protéines mixtes ayant une partie de leur molécule avec une structure secondaire précise et une autre qui n’en a pas. Par exemple Art v 1, l’allergène principal du pollen d’armoise (Artemisia vulgaris), présente un long domaine C-terminal associé à un domaine N-terminal replié, globulaire.
La contraction des protéines leur procure une économie thermodynamique, c’est-à-dire une meilleure stabilité. Elle ne s’arrête pas aux hélices et aux feuillets comme il est visible dans la vue présentée plus haut : une part importante des propriétés des protéines est acquise par un second niveau de contraction, le repliement de la molécule sur elle-même (le « folding »).
La protéine représentée ci-dessous est Bet v 1 du pollen de bouleau (référence 1BV1 dans PDB ) :
Ce repliement donne une forme plus ou moins globulaire à la protéine et celle-ci acquiert ainsi sa structure tertiaire.
La présence de cystéines est essentielle pour générer cette structure compacte car ces acides aminés s’associent 2 à 2 pour former des ponts disulfures, ou « ponts SS », qui résistent très bien à l’agression thermique.
Plus une protéine possède de cystéines pour une même longueur de polypeptide et plus elle est apte à constituer des ponts SS qui favorisent sa stabilité.
Le schéma suivant montre un exemple de petites protéines riches en ponts SS (une LTP et une 2S albumine), d’une protéine dénuée de pont SS (une PR-10 ou Bet v 1-like) et d’une protéine ayant des ponts SS sur une partie seulement de sa chaîne (chitinase classe 1) :
La présence de ces ponts SS va déterminer en grande partie la modification de la conformation de la protéine après chauffage (ex. cuisson) et, du même coup, le maintien ou non d’épitopes B fonctionnels.
Les LTP (ex. Pru p 3 dans la pêche) et les 2S albumines (ex. Ara h 2 dans l’arachide) gardent leur IgE-réactivité après chauffage, les PR-10 (ex. pomme) voient leur IgE-réactivité fortement diminuée et les chitinases également (ex. avocat).
Ces changements peuvent être ralentis quand la protéine est « protégée » par un milieu favorable, souvent des lipides, comme cela a été remarqué pour les PR-10 de soja ou d’arachide .
La protéolyse est, elle aussi, plus facile avec des protéines dénuées de ponts SS. Au cours de la digestion, une protéine PR-10 est rapidement dégradée, tandis que le domaine hévéine des chitinases, riche en ponts SS, va résister plus longtemps .
En schématisant, on a des protéines capables de se limiter à un syndrome oral à l’état cru (ex. Mal d 1, la PR-10 de pomme), des protéines capables de générer des réactions systémiques car partiellement résistantes à la protéolyse mais quand même fragiles au chauffage (ex. la chitinase de banane) et des protéines susceptibles de produire volontiers des réactions systémiques car résistant et au chauffage et à la digestion (ex. Pru p 3, la LTP de pêche).
La structure tertiaire est une composante primordiale de l’allergénicité de beaucoup de protéines : en effet, dans les interactions avec les molécules qui, à la surface des cellules, détectent les protéines et décodent leur nature, la conformation spatiale joue un grand rôle.
C’est très certainement le cas lors du contact avec les cellules présentatrices (par ex. les cellules dendritiques), même si les récepteurs responsables de la reconnaissance d’un allergène potentiel et le rôle adjuvant des glucides et des lipides associés à la protéine sont encore à élucider.
La reconnaissance d’un allergène par les cellules effectrices (mastocytes, basophiles) ou les cellules B est, elle, beaucoup mieux connue : elle s’opère par la liaison d’un épitope de la protéine avec une immunoglobuline fixée sur la membrane cellulaire. L’épitope et la zone correspondante sur l’immunoglobuline, le paratope, peuvent légèrement améliorer leur interaction au cours d’un processus dynamique .
Mais cette malléabilité a des limites et, du côté de l’allergène, la structure tertiaire va gouverner la plus ou moins grande affinité de l’épitope avec l’IgE. C’est bien une « image en 3D » qui constitue ce que le paratope reconnaît.
La structure tertiaire , et notamment celle au niveau des épitopes B, est un élément clé pour comprendre les réactivités ou non-réactivités croisées entre allergènes (cf. Epitopes : structure et homologies).
Il faut souligner, par ailleurs, que l’adjonction de chaînes glucidiques au polypeptide sitôt sa synthèse ribosomale participe également à la stabilité de la structure tertiaire de la protéine. Ces chaînes glucidiques peuvent aussi générer des épitopes IgE-réactifs (cf. Les CCD).
Mais l’organisation spatiale des allergènes ne se limite pas à une contraction de la molécule sur elle-même car, pour de nombreux allergènes, la forme native est une association de polypeptides :
- certains allergènes sont bien des monomères mais résultent d’un réarrangement au moment de leur synthèse : le polypeptide parent (le « pro-peptide ») est clivé par des protéases en 2 morceaux ou plus, et ces morceaux se couplent 2 à 2 en formant des ponts SS. L’allergène est alors composé de « sous-unités » liées ensemble (ex. la plupart des 2S albumines comme Ara h 2 de l’arachide).
Ce genre d’assemblage complique le repérage des allergènes en immunoblot si ce dernier a été pratiqué après traitement de l’extrait allergénique par un agent réducteur. Ce dernier rompt en effet les ponts SS et on ne retrouvera pas sur la migration la bande à la place où on l’attend, à savoir au niveau de la masse totale de l’allergène : celui migrera en des bandes de masse inférieure, celles des sous-unités de la protéine.
- de nombreux allergènes se présentent à l’état naturel sous forme de dimères (2 molécules liées ensemble), de trimères (3 molécules), voire d’hexamères (6) : des profilines, Bet v 1, les tropomyosines, certaines lipocalines (phanères de mammifères), des polcalcines, plusieurs sortes de protéines de stockage des graines (trimères pour vicilines, hexamères pour légumines), etc.. etc.. sont ainsi à l’état naturel sous des formes plus complexes.
Ces assemblages constituent le niveau supérieur de structure pour les allergènes : leur structure quaternaire.
La protéine représentée ci-dessous est Phl p 7, la polcalcine du pollen de fléole (référence 1K9U dans PDB ). C’est un dimère :
On ne connaît pas bien le devenir de ces assemblages au moment du contact avec le patient : sont-ils facilement rompus ? Cela découvre-t-il des épitopes qui ne sont pas visibles (testables) avec la forme native ? Que reste-t-il des dimères, trimères, etc.. dans les extraits ?
La présence de ces polymères dans le produit natif pourrait influencer la réponse observée au cours des prick-tests : on peut imaginer qu’une liaison dégranulante soit plus fréquente avec un dimère qu’avec le monomère de ce même allergène car le dimère permet à la fois des liaisons hétérogènes (= 2 épitopes différents sur la molécule monomérique) et des liaisons homogènes (= 2 épitopes identiques sur chacun des monomères) comme le schématise la figure ci-après :
Si cela est le cas on comprend que les prick-tests avec le produit natif soient fréquemment plus sensibles que les pricks utilisant un extrait aqueux du même produit (que l’extrait soit commercial ou « fait maison », d’ailleurs).
Sachant que la conformation spatiale d’une protéine peut être influencée par la présence ou non de son ligand naturel, on serait en droit d’ajouter à cette différence pour les réponses cutanées le fait que le plus souvent les ligands présents dans le produit natif (ex. lipides, calcium) sont perdus au cours des procédés de fabrication des extraits aqueux. Le travaux de Gabriel Peltre ont montré que des extraits non aqueux comportaient aussi de nombreuses protéines IgE-réactives .
Nos connaissances sur cette dimension de l’IgE-réactivité in vivo mériteraient d’être approfondies.