sasava

Metaproteomica microbiană: de la procesarea probelor, colectarea datelor până la analiza datelor

Wu Enhui, Qiao Liang*

Departamentul de Chimie, Universitatea Fudan, Shanghai 200433, China

 

 

 

Microorganismele sunt strâns legate de bolile și sănătatea umană. Cum se înțelege compoziția comunităților microbiene și funcțiile acestora este o problemă majoră care trebuie studiată urgent. În ultimii ani, metaproteomica a devenit un mijloc tehnic important de a studia compoziția și funcția microorganismelor. Cu toate acestea, datorită complexității și eterogenității ridicate a probelor din comunitatea microbiană, procesarea probelor, achiziția de date prin spectrometrie de masă și analiza datelor au devenit cele trei provocări majore cu care se confruntă în prezent metaproteomica. În analiza metaproteomică, este adesea necesară optimizarea pretratării diferitelor tipuri de probe și adoptarea diferitelor scheme microbiene de separare, îmbogățire, extracție și liză. Similar cu proteomul unei singure specii, modurile de achiziție a datelor spectrometriei de masă în metaproteomică includ modul de achiziție dependentă de date (DDA) și modul de achiziție independentă de date (DIA). Modul de achiziție a datelor DIA poate colecta complet informațiile peptidice ale probei și are un potențial mare de dezvoltare. Cu toate acestea, datorită complexității probelor de metaproteome, analiza datelor sale DIA a devenit o problemă majoră care împiedică acoperirea profundă a metaproteomicelor. În ceea ce privește analiza datelor, cel mai important pas este construirea unei baze de date de secvențe de proteine. Dimensiunea și caracterul complet al bazei de date nu numai că au un impact mare asupra numărului de identificări, ci afectează și analiza la nivel de specie și funcțional. În prezent, standardul de aur pentru construirea unei baze de date metaproteome este o bază de date cu secvențe de proteine ​​bazată pe metagenom. În același timp, s-a dovedit că metoda de filtrare a bazelor de date publice bazată pe căutare iterativă are o valoare practică puternică. Din perspectiva strategiilor specifice de analiză a datelor, metodele de analiză a datelor DIA centrate pe peptide au ocupat un curent principal absolut. Odată cu dezvoltarea învățării profunde și a inteligenței artificiale, va promova foarte mult acuratețea, acoperirea și viteza de analiză a analizei datelor macroproteomice. În ceea ce privește analiza bioinformatică în aval, în ultimii ani au fost dezvoltate o serie de instrumente de adnotare, care pot realiza adnotarea speciilor la nivel de proteine, nivel de peptidă și nivel de genă pentru a obține compoziția comunităților microbiene. În comparație cu alte metode omice, analiza funcțională a comunităților microbiene este o caracteristică unică a macroproteomicei. Macroproteomica a devenit o parte importantă a analizei multi-omice a comunităților microbiene și are încă un potențial mare de dezvoltare în ceea ce privește adâncimea acoperirii, sensibilitatea de detecție și exhaustivitatea analizei datelor.

 

01Pretratarea probei

În prezent, tehnologia metaproteomică a fost utilizată pe scară largă în cercetarea microbiomului uman, a solului, a alimentelor, a oceanelor, a nămolului activ și a altor domenii. În comparație cu analiza proteomului unei singure specii, pretratarea eșantionului de metaproteom a probelor complexe se confruntă cu mai multe provocări. Compoziția microbiană din probele reale este complexă, intervalul dinamic de abundență este mare, structura peretelui celular al diferitelor tipuri de microorganisme este foarte diferită, iar probele conțin adesea o cantitate mare de proteine ​​gazdă și alte impurități. Prin urmare, în analiza metaproteomului, este adesea necesară optimizarea diferitelor tipuri de probe și adoptarea diferitelor scheme de separare microbiană, îmbogățire, extracție și liză.

Extracția metaproteomilor microbieni din diferite probe are anumite asemănări, precum și unele diferențe, dar în prezent există o lipsă a unui proces unificat de pre-procesare pentru diferite tipuri de probe de metaproteom.

 

02Achiziție de date prin spectrometrie de masă

În analiza proteomului cu pușcă, amestecul de peptide după pretratare este mai întâi separat în coloana cromatografică și apoi intră în spectrometrul de masă pentru achiziția de date după ionizare. Similar cu analiza proteomului cu o singură specie, modurile de achiziție a datelor spectrometriei de masă în analiza macroproteomului includ modul DDA și modul DIA.

 

Odată cu iterarea și actualizarea continuă a instrumentelor de spectrometrie de masă, instrumentele de spectrometrie de masă cu sensibilitate și rezoluție mai mari sunt aplicate metaproteomului, iar adâncimea de acoperire a analizei metaproteomului este, de asemenea, îmbunătățită continuu. Pentru o lungă perioadă de timp, o serie de instrumente de spectrometrie de masă de înaltă rezoluție conduse de Orbitrap au fost utilizate pe scară largă în metaproteome.

 

Tabelul 1 al textului original prezintă câteva studii reprezentative despre metaproteomică din 2011 până în prezent în ceea ce privește tipul de eșantion, strategia de analiză, instrumentul de spectrometrie de masă, metoda de achiziție, software-ul de analiză și numărul de identificări.

 

03 Analiza datelor prin spectrometrie de masă

3.1 Strategia de analiză a datelor DDA

3.1.1 Căutare în baze de date

3.1.2de novostrategia de secvențiere

3.2 Strategia de analiză a datelor DIA

 

04Clasificarea speciilor și adnotarea funcțională

Compoziția comunităților microbiene la diferite niveluri taxonomice este unul dintre domeniile cheie de cercetare în cercetarea microbiomului. În ultimii ani, au fost dezvoltate o serie de instrumente de adnotare pentru a adnota speciile la nivel de proteine, peptide și gene pentru a obține compoziția comunităților microbiene.

 

Esența adnotării funcționale este de a compara secvența proteinei țintă cu baza de date a secvenței de proteine ​​funcționale. Folosind baze de date cu funcții genetice, cum ar fi GO, COG, KEGG, eggNOG etc., pot fi efectuate diferite analize de adnotare funcțională pe proteinele identificate de macroproteomi. Instrumentele de adnotare includ Blast2GO, DAVID, KOBAS etc.

 

05 Rezumat și Outlook

Microorganismele joacă un rol important în sănătatea umană și boli. În ultimii ani, metaproteomica a devenit un mijloc tehnic important de a studia funcția comunităților microbiene. Procesul analitic al metaproteomicii este similar cu cel al proteomicii cu o singură specie, dar datorită complexității obiectului de cercetare al metaproteomicii, trebuie adoptate strategii specifice de cercetare în fiecare etapă de analiză, de la pretratarea probei, achiziția datelor până la analiza datelor. În prezent, datorită îmbunătățirii metodelor de pretratare, inovației continue a tehnologiei spectrometriei de masă și dezvoltării rapide a bioinformaticii, metaproteomica a făcut progrese mari în adâncimea identificării și domeniul de aplicare.

 

În procesul de pretratare a probelor de macroproteom, natura probei trebuie luată în considerare mai întâi. Modul de separare a microorganismelor de celulele și proteinele din mediu este una dintre provocările cheie cu care se confruntă macroproteomele, iar echilibrul dintre eficiența separării și pierderea microbiană este o problemă urgentă care trebuie rezolvată. În al doilea rând, extracția proteică a microorganismelor trebuie să țină cont de diferențele cauzate de eterogenitatea structurală a diferitelor bacterii. Probele de macroproteom din intervalul de urme necesită, de asemenea, metode specifice de pretratare.

 

În ceea ce privește instrumentele de spectrometrie de masă, instrumentele de spectrometrie de masă curente au suferit o tranziție de la spectrometrele de masă bazate pe analizoare de masă Orbitrap, cum ar fi LTQ-Orbitrap și Q Exactive, la spectrometre de masă bazate pe analizoare de masă cuplate cu mobilitate ionică, cum ar fi timsTOF Pro . Seria timsTOF de instrumente cu informații despre dimensiunea mobilității ionice au o precizie ridicată de detecție, o limită scăzută de detecție și o repetabilitate bună. Ele au devenit treptat instrumente importante într-o varietate de domenii de cercetare care necesită detectarea prin spectrometrie de masă, cum ar fi proteomul, metaproteomul și metabolomul unei singure specii. Este de remarcat faptul că pentru o lungă perioadă de timp, gama dinamică a instrumentelor de spectrometrie de masă a limitat adâncimea de acoperire a proteinelor în cercetarea metaproteomelor. În viitor, instrumentele de spectrometrie de masă cu un interval dinamic mai mare pot îmbunătăți sensibilitatea și acuratețea identificării proteinelor în metaproteomi.

 

Pentru achiziția de date prin spectrometrie de masă, deși modul de achiziție a datelor DIA a fost adoptat pe scară largă în proteomul unei singure specii, majoritatea analizelor actuale de macroproteom încă folosesc modul de achiziție a datelor DDA. Modul de achiziție de date DIA poate obține pe deplin informațiile de ioni de fragmente ale probei și, în comparație cu modul de achiziție de date DDA, are potențialul de a obține pe deplin informațiile peptidice ale probei de macroproteom. Cu toate acestea, din cauza complexității ridicate a datelor DIA, analiza datelor macroproteomului DIA se confruntă încă cu mari dificultăți. Se așteaptă ca dezvoltarea inteligenței artificiale și a învățării profunde să îmbunătățească acuratețea și completitudinea analizei datelor DIA.

 

În analiza datelor metaproteomice, unul dintre pașii cheie este construirea unei baze de date cu secvențe de proteine. Pentru domenii de cercetare populare, cum ar fi flora intestinală, se pot folosi baze de date microbiene intestinale, cum ar fi IGC și HMP, și s-au obținut rezultate bune de identificare. Pentru majoritatea altor analize metaproteomice, cea mai eficientă strategie de construcție a bazei de date este încă de a stabili o bază de date de secvențe de proteine ​​​​specifice probei bazată pe datele de secvențiere metagenomică. Pentru probele de comunitate microbiană cu complexitate mare și gamă dinamică mare, este necesară creșterea adâncimii de secvențiere pentru a crește identificarea speciilor cu abundență scăzută, îmbunătățind astfel acoperirea bazei de date de secvențe de proteine. Atunci când datele de secvențiere lipsesc, o metodă de căutare iterativă poate fi utilizată pentru a optimiza baza de date publică. Cu toate acestea, căutarea iterativă poate afecta controlul calității FDR, așa că rezultatele căutării trebuie verificate cu atenție. În plus, aplicabilitatea modelelor tradiționale de control al calității FDR în analiza metaproteomică merită încă explorată. În ceea ce privește strategia de căutare, strategia bibliotecii spectrale hibride poate îmbunătăți adâncimea de acoperire a metaproteomicelor DIA. În ultimii ani, biblioteca spectrală prezisă generată pe baza învățării profunde a arătat performanțe superioare în proteomica DIA. Cu toate acestea, bazele de date metaproteome conțin adesea milioane de intrări de proteine, ceea ce are ca rezultat o scară mare de biblioteci spectrale prezise, ​​consumă o mulțime de resurse de calcul și are ca rezultat un spațiu mare de căutare. În plus, asemănarea dintre secvențele de proteine ​​din metaproteoame variază foarte mult, ceea ce face dificilă asigurarea acurateței modelului de predicție a bibliotecii spectrale, astfel încât bibliotecile spectrale prezise nu au fost utilizate pe scară largă în metaproteomică. În plus, trebuie dezvoltate noi strategii de inferență și clasificare a proteinelor pentru a se aplica analizei metaproteomice a proteinelor foarte asemănătoare secvenței.

 

Pe scurt, ca tehnologie emergentă de cercetare a microbiomului, tehnologia metaproteomică a obținut rezultate semnificative de cercetare și, de asemenea, are un potențial uriaș de dezvoltare.


Ora postării: 30-aug-2024