Die Kombination von Metabolom- und klinischen Indikatoren mit maschinellem Lernen liefert einige vielversprechende diagnostische Marker zur präzisen Erkennung von Abstrichen
HeimHeim > Nachricht > Die Kombination von Metabolom- und klinischen Indikatoren mit maschinellem Lernen liefert einige vielversprechende diagnostische Marker zur präzisen Erkennung von Abstrichen

Die Kombination von Metabolom- und klinischen Indikatoren mit maschinellem Lernen liefert einige vielversprechende diagnostische Marker zur präzisen Erkennung von Abstrichen

Oct 03, 2023

BMC Infectious Diseases Band 22, Artikelnummer: 707 (2022) Diesen Artikel zitieren

1276 Zugriffe

4 Zitate

1 Altmetrisch

Details zu den Metriken

Tuberkulose (TB) war lange Zeit (2014–2019) bis zur globalen COVID-19-Pandemie die häufigste tödliche Infektionskrankheit weltweit und gehört immer noch zu den zehn häufigsten Todesursachen weltweit. Ein wichtiger Grund dafür, dass es weltweit so viele Tuberkulosepatienten und Todesfälle gibt, sind die Schwierigkeiten bei der genauen Diagnose von Tuberkulose mit gängigen Nachweismethoden, insbesondere bei einigen Fällen von abstrichnegativer Lungentuberkulose (SNPT). Die rasante Entwicklung des Metaboloms und des maschinellen Lernens bietet eine große Chance für die präzise Diagnose von Tuberkulose. Allerdings müssen die Metaboliten-Biomarker für die Präzisionsdiagnose von abstrichpositiver und abstrichnegativer Lungentuberkulose (SPPT/SNPT) noch entdeckt werden. In dieser Studie haben wir Metabolomik und klinische Indikatoren mit maschinellem Lernen kombiniert, um neue diagnostische Biomarker für die genaue Identifizierung von SPPT- und SNPT-Patienten auszusortieren.

Für 27 SPPT-Patienten, 37 SNPT-Patienten und Kontrollpersonen wurde ein ungezieltes Plasma-Metabolom-Profiling durchgeführt. Anschließend wurde die orthogonale partielle Diskriminanzanalyse der kleinsten Quadrate (OPLS-DA) durchgeführt, um unterschiedliche Metaboliten zwischen den drei Gruppen zu untersuchen. Metabolite Enriched Pathways, Random Forest (RF), Support Vector Machines (SVM) und Multilayer Perceptron Neural Network (MLP) wurden mit Metaboanalyst 5.0, dem R-Paket „caret“, dem R-Paket „e1071“ bzw. dem Python-Paket „Tensorflow“ durchgeführt.

Die metabolische Analyse ergab eine signifikante Anreicherung von Fettsäure- und Aminosäuremetaboliten im Plasma von SPPT- und SNPT-Patienten, wobei SPPT-Proben eine schwerwiegendere Funktionsstörung im Fettsäure- und Aminosäurestoffwechsel aufwiesen. Eine weitere RF-Analyse ergab vier optimierte diagnostische Biomarkerkombinationen mit zehn Merkmalen (zwei Lipide/lipidähnliche Moleküle und sieben organische Säuren/Derivate sowie ein klinischer Indikator) zur Identifizierung von SPPT-, SNPT-Patienten und Kontrollpersonen mit hoher Genauigkeit (83–93 %). ), die von SVM und MLP weiter verifiziert wurden. Unter ihnen zeigte MLP die beste Klassifizierungsleistung bei gleichzeitiger präziser Identifizierung der drei Gruppen (94,74 %), was in gewissem Maße auf den Vorteil von MLP gegenüber RF/SVM schließen lässt.

Unsere Ergebnisse offenbaren die Plasmametabolomeigenschaften von SPPT- und SNPT-Patienten, liefern einige neue vielversprechende diagnostische Marker für die Präzisionsdiagnose verschiedener Arten von Tuberkulose und zeigen das Potenzial des maschinellen Lernens beim Screening von Biomarkern aus Big Data.

Peer-Review-Berichte

Berichten der WHO zufolge war die durch Mycobacterium tuberculosis (Mtb) verursachte Tuberkulose (TB) lange Zeit (2014–2019) bis zur globalen COVID-19-Pandemie (2020–2021) die weltweit häufigste tödliche Infektionskrankheit [1], und Jedes Jahr gab es etwa 10 Millionen neue TB-Fälle [2, 3]. Laut den vom National Notifiable Disease Reporting System (NNDRS) gesammelten Daten beträgt die jährliche Inzidenz in Xinjiang 169,05/100.000 und die durchschnittliche jährliche Rate der gemeldeten PTB (Lungentuberkulose) in Kaschgar lag von 2011 bis 2020 bei 450,91/100.000 [4] . Warum gibt es weltweit so viele Tuberkulosepatienten und Todesfälle? Ein Grund dafür sind die Schwierigkeiten bei der genauen Diagnose von Tuberkulose, insbesondere bei einigen Fällen von abstrichnegativer Lungentuberkulose (SNPT), die normalerweise ähnliche Symptome wie andere Lungenerkrankungen zeigen [5, 6]. In einigen Ländern/Regionen machen SNPT-Patienten sogar mehr als 50 % aller TB-Fälle aus [7].

Obwohl derzeit drei gängige Methoden (Sputum-Abstrich-Mikroskopie, Sputum-Kulturtests und Xpert MTB/RIF-Assays) eine relativ präzise Diagnose für die meisten Tuberkulosepatienten ermöglichen, weisen sie immer noch einige Nachteile auf (z. B. eine relativ geringe Empfindlichkeit der Sputum-Abstrich-Mikroskopie, zeitaufwändig für die Sputumkultur und relativ hohe Kosten für Xpert), was außerdem zu einigen falsch negativen/positiven Fällen führt [1, 6, 8, 9, 10]. Die Diagnose eines Versagens kann zu einer verzögerten Behandlung, einem schlechten therapeutischen Effekt und höheren Behandlungskosten führen [11, 12]. Heutzutage bleibt die rechtzeitige und genaue Erkennung verschiedener Tuberkulosearten eine große Herausforderung für die weltweite Tuberkulosebekämpfung.

Die rasante Entwicklung verschiedener Omics-Technologien bietet eine große Chance für die Präzisionsdiagnose verschiedener Arten von Krankheiten [13,14,15,16]. Unter diesen wurde das Metabolom in großem Umfang bei der Entdeckung von Biomarkern zur Erkennung, Diagnose und Behandlung verschiedener Krankheiten eingesetzt, da berichtet wurde, dass sie eng mit Krankheitsgenotypen und -phänotypen verbunden sind [17]. Im Bereich der TB-Forschung haben Deng et al. berichteten über signifikant veränderte Glutathion- und Histaminwerte im Urin von Patienten mit aktiver Tuberkulose, was sie von latent mit Tuberkulose infizierten Patienten unterscheiden könnte [18]; Huang et al. lieferten einige potenzielle Biomarker für Plasmametaboliten (Xanthin, 4-Pyridoxat und D-Glutaminsäure) für die TB-Diagnose [19]; Sun et al. enthüllten einige potenzielle Metaboliten-Biomarker für die pädiatrische TB-Diagnose durch L-Valin, Brenztraubensäure und Betain im Plasma [20]. Allerdings müssen die Metaboliten-Biomarker für die Präzisionsdiagnose von abstrichpositiver und abstrichnegativer Tuberkulose (SPPT und SNPT) noch entdeckt werden.

In unserer Studie führten wir Plasma-Metabolomanalysen von 27 SPPT-Patienten, 37 SNPT-Patienten und 36 Kontrollpersonen durch. Die metabolomische Profilierung ergab dysfunktionale Fettsäure- und Aminosäurestoffwechsel bei SPPT- und SNPT-Patienten. Anschließend wurden vier optimierte diagnostische Biomarkerkombinationen (zwei Lipide/lipidähnliche Moleküle und sieben organische Säuren/Derivate sowie ein klinischer Indikator) für eine präzise Diagnose von SPPT- und SNPT-Patienten und -Kontrollen durch den Random Forest (RF) gescreent. Die Klassifizierungsleistung der vier Kombinationen wurde durch zwei weitere Methoden des maschinellen Lernens weiter verifiziert: Support Vector Machines (SVM) und Multilayer Perceptron Neural Network (MLP). Unsere Ergebnisse enthüllten die metabolischen Eigenschaften von SPPT- und SNPT-Patienten, lieferten einige vielversprechende diagnostische Marker für die Präzisionsdiagnose verschiedener Arten von TB-Patienten und zeigten das Potenzial des maschinellen Lernens bei der Erkennung diagnostischer Biomarker.

In unserer Studie wurden alle TB-Patienten (einschließlich 27 SPPT- und 37 SNPT-Patienten) von Oktober 2017 bis Oktober 2018 aus dem Tuberkulose-Präventions- und Behandlungsinstitut von Kashgar, dem Zweiten Volkskrankenhaus von Aksu und dem Kuqa County Infectious Disease Hospital rekrutiert. 36 Kontrollpersonen (Strg) ohne TB-Infektion aus dem First Affiliated Hospital der Xinjiang Medical University wurden ebenfalls eingeschrieben (Tabelle 1, Zusatzdatei 1: Abb. S1). Die Diagnose einer Tuberkulose basierte auf klinischen Symptomen und mikrobiologischen Beweisen gemäß Diagnosis for Pulmonary Tuberculosis (WS 288-2017). SPPT-Patienten wurden diagnostiziert, wenn einer der folgenden mikrobiologischen Beweise erhalten wurde: (1) positive Färbung für säurefeste Bakterien, (2) positive Kultur für Mtb, (3) positiver Xpert-Test. SNPT-Patienten wurden anhand der klassischen klinischen Symptome diagnostiziert, obwohl säurefeste Bakterien negativ waren. Zu den Ausschlusskriterien gehörten: (1) die TB-Patienten im Behandlungszeitraum; (2) die Tuberkulosepatienten mit anderen chronischen oder akuten Krankheiten wie Schwangerschaftskomplikationen, Herzfunktionsstörungen, Nierenerkrankungen, psychiatrischen Erkrankungen, Magen-Darm-Erkrankungen, unkontrolliertem Bluthochdruck und einigen schweren Stresszuständen (einschließlich kardiovaskulärer und zerebrovaskulärer Ereignisse, schwere Infektionen, traumatische Operationen, und schwere Auszehrungskrankheiten). Diese Studie wurde von der Ethikkommission des First Affiliated Hospital der Xinjiang Medical University genehmigt (20171123-06-1908A).

Insgesamt 0,5–1 ml der Vollblutprobe jedes Teilnehmers wurden durch Phlebotomie der Kubitalvene unter Verwendung eines Heparin-Antikoagulations-Sammelröhrchens entnommen. Die Blutproben wurden dann 10 Minuten lang zentrifugiert (1500 U/min, 4 °C), um die Blutzellen zu entfernen, und die Überstände wurden sofort in flüssigem Stickstoff eingefroren und bis zur Verwendung bei –80 °C gelagert. Gefrorene Plasmaproben wurden langsam bei 4 °C aufgetaut und jedes 100-μl-Aliquot wurde mit 400 μl vorgekühlter Methanol/Acetonitril-Lösung (1:1, Vol./Vol.) gemischt. Nach dem Vortexen wurde die Mischung 10 Minuten lang bei –20 °C inkubiert und dann 15 Minuten lang zentrifugiert (14.000 rcf, 4 °C). Die Überstände wurden gefriergetrocknet und in 100 μl Acetonitril/Wasser-Lösung (1:1, v/v) für die LC-MS/MS-Analyse (Shanghai Applied Protein Technology Co., Ltd, Shanghai, China) rekonstituiert.

Metaboliten wurden aus Plasmaproben extrahiert. Die ungezielte Metabolomics-Analyse wurde unter Verwendung von Ultrahochleistungsflüssigkeitschromatographie (UHPLC, 1290 Infinity LC, Agilent Technologies, Palo Alto, CA, USA) und einem Quadrupol-Flugzeitmassenspektrometer (TripleTOF 6600; AB Sciex, Framingham, USA) durchgeführt. MA, USA). Die Trennung wurde unter Verwendung einer 2,1 mm × 100 mm großen ACQUITY UPLC BEH 1,7 μm-Säule (Waters, Wexford, Irland) durchgeführt. Die mobile Phase bestand aus A. 25 mM Ammoniumacetat mit 25 mM Ammoniumhydroxid; B. Acetonitril. Die Gradientenelution wurde wie folgt durchgeführt: 95 % B für 0,5 Minuten und wurde in 7 Minuten linear auf 65 % reduziert, als nächstes wurde der Gradient in 2 Minuten auf 40 % reduziert, in 0,1 Minuten auf 95 % erhöht, dann mit einem erneuten -Äquilibrierungszeitraum von 3 Minuten. Die Flussrate wurde auf 0,3 ml min−1, die Säulentemperatur auf 25 °C und das Injektionsvolumen auf 2 µL eingestellt. Die ESI-Bedingungen waren wie folgt: Ionenquellengas1 (Gas1): 40 psi; Ionenquelle Gas2 (Gas2): 80 psi; Vorhanggas (CUR): 30 psi; Quellentemperatur: 650℃; IonSpray Voltage Floating (ISVF) ± 5500 V. Die Rohdaten wurden von MSconventer (ProteoWizard, Palo Alto, CA, USA) in MzXML konvertiert und zur Ausrichtung in XCMS-Software (Scripps Research Institute, La Jolla, CA, USA) importiert. Merkmalserkennung, Retentionszeitkorrektur und Datenfilterung.

Die multivariable Analyse wurde mit der Software SIMCA-P (Version 14.1 Umetrics, Umea, Schweden) durchgeführt. Anschließend wurde die orthogonale partielle Diskriminanzanalyse der kleinsten Quadrate (OPLS-DA, Umetrics, Umea, Schweden) durchgeführt, um die unterschiedlichen Metaboliten zu screenen, und die Robustheit des OPLS-DA-Modells wurde mithilfe der siebenfachen Kreuzvalidierung und des Antwortpermutationstests bewertet . Differenziell häufig vorkommende Metaboliten (DAMs) wurden basierend auf der variablen Wichtigkeit in der Projektion (VIP) > 1 bestätigt, die aus dem OPLS-DA-Modell und den Student-t-Test-p-Werten (p < 0,05) erhalten wurde. Die chemische Taxonomie von DAMs wurde gemäß „The Human Metabolome Database (HMDB)“ (https://hmdb.ca/) bestimmt. Die mit Metaboliten angereicherte Signalweganalyse wurde mit der Online-Software Metaboanalyst 5.0 implementiert [21].

Nach dem Entfernen der Indikatoren mit einem großen Anteil fehlender Werte (≥ 20 %, Einzelheiten siehe Zusatzdatei 1: Tabelle S1) wurden 24 verbleibende klinische Indikatoren und 96 DAMs einbezogen, um potenzielle diagnostische Biomarker herauszufiltern. Kategoriale Variablen wurden dann mit Dummy-Variablen codiert. Insgesamt 100 Personen (27 SPPT-Patienten, 37 SNPT-Patienten und 36 Kontrollpersonen) wurden dann mithilfe der Funktion „createDataPartition“ im R-Caret-Paket (http:/) zufällig in einen Trainingssatz (n = 81) und einen Testsatz (n = 19) aufgeteilt. /topepo.github.io/caret/data-splitting.html). Darüber hinaus wurde K-Nearest Neighbor übernommen, um die fehlenden Werte der verbleibenden Indikatoren zu unterstellen [22]. Konkret wurde ein KNN-Modell (http://topepo.github.io/caret/pre-processing.html) basierend auf dem Trainingssatz erstellt, das dann angewendet wurde, um die fehlenden Werte im Testsatz vorherzusagen. Als Ergebnis wurden die standardisierten Datensätze erhalten. Anschließend wurde die Hauptkomponentenanalyse (PCA) angewendet, um globale klinische Indikatoren und Stoffwechselveränderungen in verschiedenen Proben zu erkennen (23). Pearson-Korrelationskoeffizienten zwischen den klinischen Indikatoren und DAMs wurden mit der Funktion findCorrelation in der R-Software berechnet (https://github.com/topepo/caret/blob/master/pkg/caret/R/findCorrelation.R). Die Merkmale mit hohen mittleren absoluten Korrelationen (≥ 0,7) wurden ausgeschlossen (Zusatzdatei 2).

Zunächst wurden die vorab ausgewählten 20 klinischen Indikatoren und 58 identifizierten DAMs (78 Merkmale, definiert als F0-Satz) für die Klassifizierung der Gruppen SPPT/Strg, SNPT/Strg, SPPT/SNPT und SPPT/SNPT/Strg einbezogen. Anschließend wurde RF eingesetzt, um die Klassifizierungsleistung des F0-Satzes zu bewerten. AUCs wurden durch eine Receiver Operating Characteristic (ROC)-Analyse unter Verwendung der roc()-Funktion des pROC-Pakets in R berechnet [24].

Anschließend haben wir die rekursive Merkmalseliminierung (R-Paket-Caret) verwendet, um die Anzahl der Merkmale im RF-Modell zu verringern (Parameter verwenden „rfFuncs“ ​​und „cv“) [25]. Die mittlere Abnahme des Gini-Koeffizienten (MDG) wurde weiterhin zur Messung der Variablenbedeutung verwendet, und die Kombinationen wichtiger Merkmale mit einer Genauigkeit von über 90 % wurden schließlich für maschinelles Lernen ausgewählt. Hier wurden die ausgewählten Funktionen in den Gruppen SPPT/Strg, SNPT/Strg, SPPT/SNPT und SPPT/SNPT/Strg als F1, F2, F3 bzw. F4 definiert. Letztendlich wurde die Klassifizierungsgenauigkeit der oben genannten vier Funktionssätze durch zwei weitere Methoden des maschinellen Lernens überprüft: SVM und MLP. Die SVM wurde mit dem R-Paket „e1071“ realisiert. Der MLP-Klassifizierungsalgorithmus einschließlich zweier versteckter Schichten (jede Schicht besteht aus 15 Knoten) wurde mit dem „Tensorflow“-Paket von Python [26] vervollständigt. Um eine Überanpassung zu vermeiden, wurde eine zehnfache Kreuzvalidierung (CV) für den Zugsatz angewendet, die außerdem zehnmal zufällig in 90 % für den „tatsächlichen Zugsatz“ und 10 % für den „Validierungssatz“ aufgeteilt wurde. Letztendlich wurden die Testsätze verwendet, um die Genauigkeit, Sensitivität, Spezifität, den positiven Vorhersagewert (PPV) und den negativen Vorhersagewert (NPV) jedes trainierten Modells zu bewerten. Die Codes wurden auf GitHub (https://github.com/ChenF-Lab/SPPT.git) hinterlegt.

Die kontinuierlichen Variablen wurden anhand des Mittelwerts (Standardabweichung), des Medians und der Interquartilbereiche (Q1–Q3) beschrieben. Die kategorialen Variablen wurden als Häufigkeitsraten und Prozentsätze beschrieben. Der T-Test unabhängiger Stichproben wurde zum Vergleich der Mittelwerte normalverteilter Variablen verwendet, während der Mann-Whitney-U-Test für nicht normalverteilte Variablen verwendet wurde. Zum Vergleich der Variablen zwischen drei Gruppen wurden eine einfache ANOVA oder ein Kruskal-Wallis-Test verwendet. Kategoriale Variablen wurden mithilfe des Chi-Quadrat-Tests verglichen. Um den korrigierten p-Wert für mehrere Vergleiche zu erhalten, wurde eine Bonferroni-Holm-Korrektur angewendet. Alle statistischen Analysen wurden mit R-Software (Version 4.0.2; eine kostenlose Open-Source-Software) durchgeführt. Zweiseitige p-Werte von weniger als 0,05 wurden als statistisch signifikant angesehen.

In unsere Studie wurden 64 TB-Patienten, darunter 27 SPPT-Patienten und 37 SNPT-Patienten, aufgenommen, um die Biomarker-Kandidaten für die Tuberkulosediagnose zu identifizieren. Als Kontrollen wurden auch 36 Nicht-TB-Personen einbezogen. Hier sind die meisten Tuberkulosepatienten männlich (59,4 %), und mehr als 80 % der Tuberkulosepatienten sind Landwirte. Das mittlere Alter der SNPT-Patienten betrug 60,0 Jahre (Q1–Q3: 49,00–71,00) und war damit deutlich höher als das der SPPT-Patienten (51,0 Jahre, Q1–Q3: 32,50–71,00) und der Kontrollgruppe (43,5 Jahre, Q1). –Q3: 34,00–59,25). Der mittlere BMI der SPPT- und SNPT-Patienten betrug 20,22 kg/m2 (SD: 3,95) bzw. 22,82 kg/m2 (SD: 3,93) und war damit deutlich niedriger als bei den Kontrollen (p < 0,001). Die häufigsten Symptome waren Husten (92,3 %) und Auswurf (92,3 %), gefolgt von Atemnot (54,7 %) und Brustbeschwerden (20,3 %). Bemerkenswert ist, dass 70,4 % der SPPT-Patienten an kavitärer Lungentuberkulose leiden, von der zuvor gezeigt wurde, dass sie mit einer höheren Bakterienlast verbunden ist [27] (Tabelle 1).

Die Analyse der klinischen Merkmale zeigte bei den Tuberkulosepatienten einen signifikant verringerten Albumin- und Serumkreatininspiegel sowie eine erhöhte Blutsenkungsgeschwindigkeit (ESR) (Tabelle 2). Hier war das Albumin der SPPT-Patienten signifikant niedriger als das der SNPT-Patienten (SPPT: 35,30 g/L; SNPT: 39,20 g/L; angepasster p = 0,002), was auf eine schwerwiegendere chronische Entzündung/Mangelernährung bei den SPPT-Patienten hinweist [28, 29]; Das Serumkreatinin war bei TB-Patienten im Vergleich zu den Kontrollpersonen signifikant niedriger, zeigte jedoch keinen Unterschied zwischen SPPT- und SNPT-Patienten, was auf eine durch Tuberkulosemedikamente verursachte Nierenschädigung schließen lässt; Die ESR von SPPT-Patienten (67,50 mm/h) war signifikant höher als die von SNPT-Patienten (43,00 mm/h), und es wurde berichtet, dass die ESR eine aktive Tuberkulose erkennen und Lungentuberkulose von einer bakteriell ambulant erworbenen Pneumonie unterscheiden kann [30].

Darüber hinaus waren Neutrophile, C-reaktives Protein und Procalcitonin bei SPPT-Patienten deutlich höher reguliert als bei SNPT-Patienten, während das Hämoglobin bei SPPT-Patienten deutlich herunterreguliert war als bei SNPT-Patienten. Diese Indikatoren lagen alle im normalen Bereich für die SNPT-Patienten und spiegelten stärkere Immun- und Entzündungsreaktionen der SPPT-Patienten wider.

An den Plasmaproben der SPPT-, SNPT- und Ctrl-Gruppen wurde eine Metabolomanalyse durchgeführt und insgesamt 103 DAMs identifiziert (Abb. 1A, B und Zusatzdateien 3, 4, 5). Die Heatmap zeigte die DAM-Expressionsprofile für die drei Gruppen, und das metabolische Profil der SPPT-Patienten ähnelte eher dem der SNPT-Patienten als dem der Kontrollen (Abb. 1A). Anschließend haben wir alle DAMs basierend auf ihrer chemischen Taxonomie gemäß „The Human Metabolome Database“ (https://hmdb.ca/) in neun Kategorien eingeteilt, darunter „Lipide und lipidähnliche Moleküle“ (~ 44 %), „Organische Säuren“. und Derivate“ (~ 25 %), „Organoheterozyklische Verbindungen“ (12 %) und „Organische Sauerstoffverbindungen“ (~ 10 %) (Abb. 1C).

Plasma-Metabolomanalyse für SPPT-Patienten, SNPT-Patienten und Kontrollpersonen. Eine Heatmap, die 103 unterschiedliche häufig vorkommende Metaboliten (DAMs, VIP > 1, p < 0,05) in den drei Gruppen zeigt. Der farbige Balken über der Heatmap stellt die Beispiele SPPT (rot), SNPT (orange) und Strg (grün) dar. Der Farbschlüssel gibt die skalierten Expressionsniveaus der 103 Metaboliten für die drei Gruppen an. B Venn-Diagramm, das die unterschiedlichen Metaboliten zwischen den drei Gruppen zeigt. C Kreisdiagramm, das die chemische Klassifizierung der 103 deutlich unterschiedlich häufig vorkommenden Metaboliten gemäß der HMDB-Datenbank zeigt

In der SPPT/Ctrl-Gruppe wurden 70 DAMs identifiziert, von denen die meisten Lipide/lipidähnliche Moleküle (31) und organische Säuren/Derivate (16) waren (zusätzliche Datei 3). Im Vergleich zu den Kontrollen zeigten 77 % (24/31) der Lipide/lipidähnlichen Moleküle (19 Fettsäuren, 3 Glycerophospholipide usw.) und 81,5 % (13/16) der organischen Säuren/Derivate einen deutlich herunterregulierten Trend (FC <1, p <0,05) in der SPPT-Gruppe, was auf den dysfunktionalen Lipid- und Aminosäurestoffwechsel bei den SPPT-Patienten hinweist, wie bereits berichtet [31, 32].

In der SNPT/Ctrl-Gruppe wurden 79 DAMs erhalten, von denen die meisten auch zu Lipiden/lipidähnlichen Molekülen (37, Top-1) und organischen Säuren/Derivaten (16, Top-2) gehörten (Zusatzdatei 4). Im Vergleich zu den Kontrollen zeigten 73 % (27/37) der Lipide/lipidähnlichen Moleküle und 56 % (9/16) der organischen Säuren/Derivate in den SNPT-Proben einen deutlich herunterregulierten Trend, was ebenfalls auf den dysfunktionalen Lipid- und Aminosäurestoffwechsel hinweist bei den SNPT-Patienten.

In der SPPT/SNPT-Gruppe wurden 33 DAMs identifiziert, von denen die meisten auch zu Lipiden/lipidähnlichen Molekülen (17) und organischen Säuren/Derivaten (10) gehörten (Zusatzdatei 5): 53 % (9/17) der Lipide/lipidähnliche Moleküle waren signifikant herunterreguliert (4 Fettacyle, 2 Glycerophospholipide, 2 Prenollipide usw.) und 47 % (8/17) von ihnen waren signifikant hochreguliert (5 Fettacyle und 3 Steroide/Steroidderivate). ); 90 % (9/10) der organischen Säuren/Derivate waren signifikant herunterreguliert (acht Carbonsäuren und Derivate und eine organische Carbonsäure/Derivat), und nur eine war signifikant hochreguliert (Hydroxysäure/Derivat).

Insgesamt zeigten die drei Gruppen (SPPT/Ctrl, SPPT/Ctrl und SPPT/SNPT) signifikante Anreicherungen bei Lipiden/lipidähnlichen Molekülen (Top-1) und organischen Säuren/Derivaten (Top-2).

Um die Stoffwechseleigenschaften der drei Gruppen zu bewerten, führten wir außerdem die Signalweganalyse für diese DAMs mit MetaboAnalyst 5.0 durch. Die Ergebnisse zeigten eine signifikant unterschiedliche Anreicherung der Stoffwechselwege im Zusammenhang mit dem Lipid- und Aminosäurestoffwechsel zwischen den drei Gruppen (Abb. 2 und Zusatzdatei 1: Tabelle S2 – S4). In der SPPT/Ctrl-Gruppe waren die DAMs in zwei Stoffwechselwegen im Zusammenhang mit dem Fettsäurestoffwechsel („Biosynthese ungesättigter Fettsäuren“, „Linolsäurestoffwechselweg“) und einem Stoffwechselweg im Zusammenhang mit dem Aminosäurestoffwechsel („Valin, Leucin und Isoleucin“) signifikant angereichert Biosyntheseweg"), was auf einen deutlich unregulierten Stoffwechsel ungesättigter Fettsäuren und Aminosäuren in den SPPT-Proben hinweist, wie bereits berichtet [32,33,34,35]. In der SNPT/Ctrl-Gruppe waren die DAMs in den gleichen zwei fettsäurebezogenen Signalwegen wie in der SPPT/Ctrl-Gruppe signifikant angereichert. In der SPPT/SNPT-Gruppe waren vier lipidbezogene Stoffwechselwege, darunter „Linolsäure-Stoffwechselweg“, „Glycerophospholipid-Stoffwechselweg“, „Alpha-Linolensäure-Stoffwechselweg“ und „Biosynthese ungesättigter Fettsäuren“, signifikant angereichert. Dies weist auf eine schwerwiegendere Störung des Fettsäurestoffwechsels bei den SPPT-Patienten als bei den SNPT-Patienten hin. Insgesamt wurden die beiden signifikanten Stoffwechselwege der Anreicherung ungesättigter Fettsäuren von den drei Gruppen geteilt (SPPT/Ctrl, SNPT/Ctrl und SPPT/SNPT), was auf ähnliche gestörte Fettsäuremetabolismen zwischen den drei Gruppen hindeutet; Sie sollten mit dem Fortschreiten der Tuberkulose in Zusammenhang stehen.

Streudiagramme, die die signifikant angereicherten Stoffwechselwege zwischen den drei Gruppen zeigen. Die Größe und Farbe der Kreise geben den Impact Score bzw. den p-Wert der angereicherten Pfade an

Zusammengenommen zeigten die obigen Ergebnisse Störungen des Fettsäure- und Aminosäurestoffwechsels bei SPPT- und SNPT-Patienten, wobei diese Störungen bei SPPT-Patienten schwerwiegender waren als bei SNPT-Patienten.

Anschließend untersuchten wir den Klassifizierungseffekt für die drei Gruppen (SPPT-, SNPT-Patienten und Kontrollpersonen) unter Verwendung aller praktikablen klinischen Laborindikatoren (24) und DAMs (96). Hier wurden sieben arzneimittelbezogene Metaboliten (Dehydroabietinsäure, Dyphyllin, EDTA, Levofloxacin, Norethindronacetat, Sunitinib und Thioetheramid-PC) ausgeschlossen, um die allgemeine Anwendbarkeit der Klassifizierung gemäß der HMDB-Datenbank zu erhöhen [36, 37]. Die PCA-Analyse wurde zunächst angewendet, um zu untersuchen, ob klinische Indikatoren und DAMs zur Unterscheidung der SPPT-, SNPT- und Kontrollproben verwendet werden können (Abb. 3): DAMs zeigten eine offensichtliche Trennung, während klinische Indikatoren eine schlechte Trennung zwischen den drei Gruppen zeigten; Klinische Indikatoren in Kombination mit DAMs zeigten die beste Klassifizierungsleistung unter den drei Gruppen. Hier gehören die zehn wichtigsten Variablen von PC1 und PC2 alle zu DAMs, was auf einen größeren Beitrag von DAMs als auf klinische Indikatoren hinweist (Zusatzdatei 1: Abb. S2).

Hauptkomponentenanalysen klinischer Indikatoren (A), DAMs (B) und ihrer Kombination (C) zwischen SPPT, SNPT und Kontrollen. Der Farbschlüssel zeigt den Beitrag der Top-5-Variablen von hoch (rötliche Pfeile) bis niedrig (bläuliche Pfeile) an.

Alle 120 Merkmale (24 klinische Indikatoren und 96 DAMs) wurden weiter auf Korrelationskoeffizienten zwischen paarweisen Merkmalen berechnet (Zusatzdatei 2). 42 Merkmale wurden aufgrund ihrer höheren mittleren absoluten Korrelationskoeffizienten (≥ 0,7) ausgeschlossen und die verbleibenden 78 Merkmale wurden für die Klassifizierungsanalyse zwischen den drei Gruppen als F0-Satz bezeichnet. Anschließend wurden RF- und ROC-Analysen verwendet, um die Klassifizierungsleistung der 78 Merkmale für die Gruppen SPPT/Strg, SNPT/Strg, SPPT/SNPT und SPPT/SNPT/Strg zu bewerten. Die Ergebnisse zeigten eine zehnfache Kreuzvalidierungs-Durchschnittsgenauigkeit von 98 % (SD: 0,06), 100 % (SD: 0,00) und 92 % (SD: 0,09) für die binären Klassifizierungen SPPT/Strg, SNPT/Strg und SPPT/ SNPT-Gruppen jeweils in Validierungssätzen (Zusatzdatei 1: Tabelle S5). Darüber hinaus wurde für alle binären Klassifizierungen in Testsätzen eine Genauigkeit von 100 % (AUC: 1,00) erreicht (Zusatzdatei 1: Abb. S3). Für die Drei-Klassen-Klassifizierung der SPPT/SNPT/Ctrl-Gruppe zeigten die 78 Merkmale auch eine gute Klassifizierungsleistung in Validierungssätzen (durchschnittliche Genauigkeit: 95 % (SD: 0,09)) und Testsatz (Genauigkeit: 94,74 %; Empfindlichkeit: 80 %, 100 % und 100 % für SPPT, SNPT und Kontrollgruppen; und Spezifität: 100 %, 91,67 % und 100 % für SPPT, SNPT und Kontrollgruppen; PPV: 100 %, 87,50 % und 100 % für SPPT, SNPT und Kontrollgruppen ; NPV: 93,33 %, 100 % und 100 % für SPPT-, SNPT- und Kontrollgruppen;). Diese zeigten die genaue Klassifizierung zwischen den SPPT- und SNPT-Patienten und -Kontrollen anhand der Kombination aus klinischen Indikatoren und DAMs (F0).

Um die optimierten diagnostischen Biomarkerkombinationen zu untersuchen, haben wir dann den Beitrag von Merkmalen zur Klassifizierung mithilfe eines Random-Forest-Algorithmus bewertet. Die Ergebnisse zeigten die optimierten Biomarker-Kombinationen mit höherer Genauigkeit (> 0,9, Zusatzdatei 1: Abb. S4) für Präzisions-Binär- und Drei-Klassen-Klassifizierungen zwischen den drei Gruppen in Trainingssätzen, einschließlich einer Kombination aus zwei Biomarkern (Albumin und 9-OxoODE). definiert als „F1-Satz“) zur präzisen Unterscheidung von SPPT von Kontrollen, eine Kombination aus drei Biomarkern (L-Pyroglutaminsäure (PGA), Enterostatin human und 9-OxoODE, definiert als „F2-Satz“) zur präzisen Unterscheidung von SNPT von Kontrollen, ein Dreier Biomarker-Kombination (Val-Ser, Methoxyessigsäure (MAA) und Ethyl-3-hydroxybutyrat, definiert als „F3-Satz“) zur präzisen Unterscheidung von SPPT von SNPT und eine Kombination aus neun Biomarkern (9-OxoODE, PGA, Val-Ser, Ethyl 3). -Hydroxybutyrat, MAA, Enterostatin human, DL-Norvalin, His-Pro und Eicosapentaensäure (EPA), definiert als „F4-Satz“) zur gleichzeitigen präzisen Identifizierung von SPPT- und SNPT-Patienten und -Kontrollen (Abb. 4, Zusatzdatei 1: Tabelle S6).

Bedeutung der überprüften Merkmale für die Identifizierung von SPPT- und SNPT-Patienten aus Kontrollen. Eine Bedeutung der klinischen und metabolischen Merkmale verschiedener optimierter Kombinationen für die präzise binäre Klassifizierung von SPPT/Ctrl-, SNPT/Ctrl- und SPPT/SNPT-Gruppen (von oben nach unten) unter Verwendung eines Random-Forest-Modells. B Bedeutung der klinischen und metabolischen Merkmale der vier optimierten Kombinationen für die gleichzeitige Klassifizierung von SPPT-, SNPT- und CONTROL-Gruppen

Die binäre Klassifizierungsleistung der oben genannten Biomarker-Kombinationen (F1, F2 und F3) wurde in Testsätzen mit hoher Genauigkeit, Sensitivität und Spezifität weiter verifiziert (Genauigkeit: 83,33 % für SPPT/Ctrl-Klassifikator, 92,86 % für SNPT/Ctrl-Klassifikator, 83,33 % für SPPT/SNPT-Klassifikator; Sensitivität: 80,00 % für SPPT/Ctrl-Klassifikator, 85,71 % für SNPT/Ctrl-Klassifikator, 80,00 % für SPPT/SNPT-Klassifikator; Spezifität: 85,71 % für SPPT/Ctrl-Klassifikator, 100 % für SNPT/Ctrl-Klassifikator, 85,71 % für SPPT/SNPT-Klassifikator; PPV: 80,00 % für SPPT/Ctrl-Klassifikator, 100 % für SNPT/Ctrl-Klassifikator, 80,00 % für SPPT/SNPT-Klassifikator; NPV: 85,71 % für SPPT/Ctrl-Klassifikator, 87,50 % für SNPT/Ctrl Klassifikator, 85,71 % für SPPT/SNPT-Klassifikator; Tabelle 3). In der SPPT/SNPT/Ctrl-Gruppe könnte die optimierte Biomarkerkombination (F4: 9 Merkmale) eine höhere Drei-Klassen-Klassifizierungsgenauigkeit (89,47 %) und Sensitivität (80 %, 85,71 % und 100 % für SPPT, SNPT und Kontrollgruppen) erreichen. , Spezifität (100 %, 91,67 % und 91,67 % für SPPT, SNPT und Kontrollgruppen), PPV (100 %, 85,71 % und 87,50 % für SPPT, SNPT und Kontrollgruppen) und NPV (93,33 %, 91,67 % und 100 % für SPPT, SNPT und Kontrollgruppen) (Abb. 5). Diese Ergebnisse zeigten eine gute Leistung der vier Merkmalssätze (F1–F4) zur präzisen Identifizierung aller SPPT- und SNPT-Patienten und -Kontrollen.

Verwirrungsmatrizen zur Unterscheidung von SPPT, SNPT und Kontrollen mit F4-Einstellung in den Testsätzen. Verwirrungsmatrizen von links nach rechts zeigen die Klassifizierungsleistung von SPPT/SNPT/Ctrl-Gruppen in den Testsätzen unter Verwendung von RF-, SVM- bzw. MLP-Modellen. F4-Set: 9-OxoODE, PGA, Val-Ser, Ethyl-3-hydroxybutyrat, MAA, Enterostatin human, DL-Norvalin, His-Pro und Eicosapentaensäure

Die beiden anderen Methoden des maschinellen Lernens (SVM und MLP) wurden außerdem übernommen, um die Klassifizierungsleistung der oben genannten vier Biomarkerkombinationen zu überprüfen. Wie erwartet zeigten die oben genannten vier Biomarkerkombinationen eine hohe Klassifizierungsgenauigkeit bei den SVM- und MLP-Methoden sowie bei der RF-Methode (Tabelle 3, Abb. 5). Insbesondere im Vergleich zu RF- und SVM-Methoden zeigte MLP die beste Klassifizierungsleistung (Genauigkeit: 94,74 %; Sensitivität: 100 %, 85,71 % und 100 % für SPPT, SNPT und Kontrollgruppen, Spezifität: 100 %, 91,67 % und 100 % für SPPT, SNPT und Kontrollgruppen, PPV: 100 %, 100 % und 87,50 % für SPPT, SNPT und Kontrollgruppen und NPV: 100 %, 92,31 % und 100 % für SPPT, SNPT und Kontrollgruppen) zur gleichzeitigen Unterscheidung von SPPT und SNPT-Patienten und Kontrollpersonen (Abb. 5), was auf das Potenzial für die Krankheitsklassifizierung/-diagnose für MLP hinweist.

Unsere Studie ergab eine signifikante Anreicherung von Lipiden/lipidähnlichen Molekülen und organischen Säuren/Derivaten bei SPPT- und SNPT-Patienten, was auf einen gestörten Fettsäure- und Aminosäurestoffwechsel hinweist, was mit früheren Berichten übereinstimmt [32,33,34,35]. . Hier zeigten die SPPT-Proben eine schwerwiegendere Störung des Fettsäure- und Aminosäurestoffwechsels. Darüber hinaus wurden vier vielversprechende diagnostische Markerkombinationen (darunter neun Moleküle aus Lipiden/lipidähnlichen und organischen Säuren/Derivaten und ein klinischer Indikator) für eine präzise Klassifizierung von SPPT-Patienten, SNPT-Patienten und Kontrollen mit hoher Genauigkeit (83,33–92,86 %) herausgesucht: ein lipidähnliches Molekül in Kombination mit einem klinischen Indikator (Albumin und 9-OxoODE) konnte SPPT-Patienten präzise von Kontrollen unterscheiden (Genauigkeit: 83,33 %); zwei Lipid/Lipid-ähnliche und ein organisches Säuremolekül (PGA, Enterostatin human und 9-OxoODE) konnten SNPT-Patienten präzise von Kontrollen unterscheiden (Genauigkeit: 92,86 %); Drei organische Säuremoleküle (Val-Ser, MAA und Ethyl-3-hydroxybutyrat) konnten SPPT- und SNPT-Patienten präzise klassifizieren (Genauigkeit: 83,33 %); Zwei Lipid/Lipid-ähnliche und sieben organische Säuremoleküle (9-OxoODE, PGA, Val-Ser, Ethyl-3-hydroxybutyrat, MAA, Enterostatin human, DL-Norvalin, His-Pro und EPA) konnten gleichzeitig SPPT-Patienten (SNPT) präzise identifizieren Patienten und Kontrollen (Genauigkeit: 89,47 %).

Wie wir wissen, sind Lipide/lipidähnliche Moleküle eine Art wichtiges Strukturmaterial von Mtb, insbesondere in der bakteriellen Zellwand [38], die über ein reichhaltiges Depot an Lipid-Remodellierungsenzymen verfügt, um Wirtsfettsäuren für ihr Überleben unter rauen Bedingungen zu nutzen hypoxische Mikroumgebung [39], was außerdem zu schwerwiegenden Störungen des Lipidstoffwechsels bei Tuberkulosepatienten führt [40]. Da es sich bei Tuberkulose um eine chronische Konsumerkrankung handelt, sind für den Aminosäurestoffwechsel verschiedene Arten von Aminosäuren und Proteinen für das Überleben von MTB im menschlichen Körper unerlässlich, was bei Tuberkulosepatienten zu einem dysfunktionalen Aminosäurestoffwechsel führt [32]. Wie erwartet identifizierte unsere Studie einige signifikant unterschiedliche (hoch-/herunterregulierte) Lipid- und Aminosäuremetaboliten, um SPPT-Patienten, SNPT-Patienten und Kontrollpersonen mithilfe maschineller Lernmethoden präzise zu unterscheiden. Sicherlich erfordern diese Marker und Panels eine weitere Bestätigung und Optimierung durch Studien mit größeren Stichproben.

Zu den neun Lipid/Lipid-ähnlichen Molekülen und organischen Säuren/Derivaten aus vier potenziellen diagnostischen Biomarker-Kombinationen gehören zwei Lipid/Lipid-ähnliche Moleküle (9-OxoODE und EPA) und sieben organische Säuren/Derivate (PGA, DL-Norvalin, MAA, His-Pro, Val-Ser, Ethyl-3-hydroxybutyrat und Enterostatin human) (Zusätzliche Dateien 3, 4, 5).

Erstens zeigen die beiden Lipide/lipidähnlichen Moleküle bei SPPT- und SNPT-Patienten eine signifikante Herunterregulierung/Hemmung (Zusatzdatei 1: Abb. S5). Hier belegt 9-OxoODE den ersten, ersten und dritten Platz in der Klassifizierung der Biomarker für die Gruppen SPPT/Ctrl, SPPT/SNPT/Ctrl bzw. SNPT/Ctrl (Abb. 4). Eine frühere Studie hat gezeigt, dass das deutlich gehemmte 9-OxoODE auch eine negative Regulation der durch Lipolyse induzierten Entzündungsreaktion bei SPPT- und SNPT-Patienten widerspiegelt, da 9-OxoODE (Metabolit der Linolsäure) die lipogene Maschinerie als Ligand-Kernrezeptor in PPAR aktivieren kann -α und PPAR-γ [41,42,43,44]. EPA, ein weiteres Lipid/Lipid-ähnliches Molekül, belegt den siebten Platz in der Klassifizierung der Biomarker für SPPT/SNPT/Ctrl (Abb. 4). Frühere Studien haben berichtet, dass eine deutlich herunterregulierte EPA bei Tuberkulosepatienten zu dysfunktionalen Entzündungsreaktionen führen kann, indem die proinflammatorischen Zytokine herunterreguliert und die Lipidsynthese von Immunzellen hochreguliert werden [45].

Bei den oben genannten sieben organischen Säuren/Derivaten als potenzielle Klassifizierungsbiomarker zeigen im Vergleich zu den Kontrollen drei (PGA, MAA und DL-Norvalin) eine signifikante Herunterregulierung und His-Pro zeigt eine signifikante Hochregulierung sowohl bei SPPT- als auch bei SNPT-Patienten (Zusatzdatei 1: Abb . S5). Hier belegt PGA den ersten und vierten Platz bei den Klassifizierungsbiomarkern für die Gruppen SNPT/Ctrl bzw. SPPT/SNPT/Ctrl (Abb. 4). Es wurde berichtet, dass deutlich herunterreguliertes PGA das Mtb-Wachstum verbessert, indem es die Biosynthese von Glutathion im menschlichen Körper hemmt [46,47,48,49]. MAA belegt unter den Klassifikationsbiomarkern für die SPPT/SNPT- bzw. SPPT/SNPT/Ctrl-Gruppe den dritten und fünften Platz (Abb. 4). Eine deutlich herunterregulierte MAA könnte zu einer schlechten Hemmung von mPTPB führen, das für das Überleben von Mtb essentiell ist, da gezeigt wurde, dass es die Bildung eines Inhibitors eines Mycobacterium-Proteins (Tyrosinphosphatase B: mPTPB) katalysiert [50]. Darüber hinaus belegen DL-Norvalin und His-Pro den achten und neunten Platz unter den Klassifikationsbiomarkern für die SPPT/SNPT/Ctrl-Gruppe (Abb. 4), die beide ähnlich ausgeprägte Trends zeigten, was auf eine Funktionsstörung sowohl bei SPPT- als auch bei SNPT-Patienten schließen lässt.

Die verbleibenden drei organischen Säure-Biomarkermoleküle (Val-Ser, Ethyl-3-hydroxybutyrat und Enterostatin human) zeigen eine unterschiedliche Anreicherung zwischen SPPT- und SNPT-Patienten. Hier sind Val-Ser und Ethyl-3-hydroxybutyrat bei SPPT-Patienten spezifisch herunterreguliert bzw. hochreguliert (Zusatzdatei 1: Abb. S5). Sie stehen an erster und zweiter Stelle unter den Merkmalen zur Differenzierung der SPPT/SNPT-Gruppe und an dritter und zweiter Stelle unter den Merkmalen zur Differenzierung der SPPT/SNPT/Ctrl-Gruppe (Abb. 4). „Enterostatin human“ wurde speziell bei SNPT-Patienten hochreguliert und belegt den zweiten und sechsten Platz unter den ausgewählten Merkmalen für die Differenzierung der SNPT/Ctrl- bzw. SPPT/SNPT/Ctrl-Gruppen (Abb. 4). Die drei organischen Säuren/Derivate mit spezifischen Veränderungen in nur einer Gruppe weisen ein einzigartiges Merkmal für die Klassifizierung verschiedener Arten von Tuberkulosepatienten auf.

Darüber hinaus steht ein klinischer Indikator für Albumin an zweiter Stelle im Merkmalssatz für die Differenzierung der SPPT/Ctrl-Gruppe, was auf eine genauere Diagnose von SPPT-Patienten durch die Kombination von Metabolom- und klinischen Indikatoren hinweist (Abb. 4). Frühere Berichte haben darauf hingewiesen, dass Albumin, ein wichtiger Nährstoff- und entzündungsbezogener Proteinmarker, ein prognostischer Marker für Tuberkulosepatienten ist [51].

Unser Befund zeigt außerdem das Potenzial des maschinellen Lernens für die präzise Diagnose von SPPT- und SNPT-Patienten. Maschinelles Lernen wird für die Analyse mehrdimensionaler Big Data immer beliebter und wird in vielen biologischen/medizinischen Bereichen umfassend eingesetzt, darunter bei der Identifizierung diagnostischer Biomarker [52], der Erkennung therapeutischer Ziele [53], der Vorhersage des Krankheitsverlaufs [54] und der Kausalbeziehung zwischen Phänotyp und Genotyp [55]. In unserer Studie werden drei Methoden des maschinellen Lernens eingesetzt, um aus mehrdimensionalen Daten potenzielle Biomarker für die genaue Klassifizierung verschiedener TB-Typen herauszufiltern. RF wurde zunächst zum Screening präziser Klassifizierungs-Biomarker eingesetzt, seitdem es in großem Umfang zur Klassifizierung und Merkmalsauswahl für Big Data eingesetzt wird; Anschließend erhielten wir einige wichtige Klassifizierungsmerkmale entsprechend der Rangfolge der Variablen und ihrer prädiktiven Bedeutung. Frühere Studien haben auch die gute Leistung der RF-Methode zur Unterscheidung von Tuberkulose und Nicht-TB gezeigt [56]. Die beiden anderen Methoden des maschinellen Lernens (SVM und MLP) wurden außerdem verwendet, um die Klassifizierungsgenauigkeit der Biomarkerkombinationen zu überprüfen. SVM ist ein Ensemble-Maschinenlernen zur Verbesserung der Klassifizierungsleistung im Vergleich zu einem einzelnen Klassifikator, das auch bei der Vorhersage des Krankheitsverlaufs wie Brustkrebs eingesetzt wurde [57]. MLP ist sehr bekannt für seine Fähigkeit zum autonomen Lernen, ohne dass Vorkenntnisse erforderlich sind, die auch bei der Diagnose von Tuberkulose [58] und der Beurteilung des prognostischen Risikos für SNPT-Patienten eingesetzt wurde [59]. Unsere Forschung zeigte die beste Klassifizierungsleistung von MLP bei der gleichzeitigen Identifizierung von SPPT, SNPT und Kontrollen mit der höchsten Genauigkeit von 94,74 %, was auf einen gewissen Vorteil von MLP gegenüber RF und SVM schließen lässt.

Es gibt auch einige Einschränkungen in unserer Studie. Obwohl wir im Zeitraum 2017–2018 in den drei Krankenhäusern (dem Tuberkulose-Präventions- und Behandlungsinstitut von Kashgar, dem Zweiten Volkskrankenhaus von Aksu und dem Kuqa County Infectious Disease Hospital) alle Tuberkulosepatienten einbezogen haben, die die Einschluss- und Ausschlusskriterien erfüllten, ist dies der Fall in der Tat eine Einschränkung unserer Studie, da sie nicht die erforderliche Stichprobengröße für eine epidemiologische Umfrage berechnet hat. Die relativ kleinen Trainings- und Testsätze können die statistische Aussagekraft der Ergebnisse verringern, und dieser Punkt bedarf einer weiteren Bestätigung und Optimierung durch Studien mit größeren Stichprobengrößen in der Zukunft. Darüber hinaus beobachten wir nicht den Einfluss der demografischen Faktoren (Alter, Beruf, BMI usw.) auf die metabolischen Profile (Daten nicht gezeigt), eine weitere Bestätigung anhand größerer Stichproben ist jedoch ebenfalls erforderlich. Um unser Klassifizierungsmodell in die klinische Praxis umzusetzen, sind sicherlich noch viele standardisierte Arbeiten zu Daten/Workflow/Probenahme erforderlich. Insgesamt zeigten alle aus unserer Studie erhaltenen Binär- und Drei-Klassen-Klassifikatoren trotz einiger Einschränkungen eine gute Leistung bei der genauen Identifizierung von SPPT-, SNPT- und CONTROL-Gruppen, und es wurde auch berichtet, dass einige Klassifizierungsbiomarker eng mit Tuberkulose assoziiert sind [45, 49, 50].

Unsere aktuelle Studie untersucht nicht nur vier Biomarkerkombinationen für die präzise Erkennung von SPPT- und SNPT-Patienten durch die Kombination von Plasmametaboliten mit klinischen Indikatoren, sondern zeigt auch eine vielversprechende Anwendung des maschinellen Lernens bei der Identifizierung diagnostischer Biomarker aus mehrdimensionalen Big Data.

Trotz der rasanten Weiterentwicklung verschiedener Diagnosetechnologien sind Diagnosefehler (verpasste, verspätete oder falsche Diagnosen) in den letzten Jahrzehnten immer noch das häufigste Problem bei vielen wichtigen Krankheiten, wie z. B. Lungenkrebs [52]. Multi-Omics und maschinelles Lernen bieten leistungsstarke Werkzeuge zur Lösung dieser Probleme, und Forscher können durch die Integration von Multi-Omics-Daten mit maschinellem Lernen präzise Klassifizierungen/Diagnosen für fehldiagnostizierte Krankheiten erzielen [15, 18, 52]. Unsere Forschung stellt einen erfolgreichen Versuch dar, verschiedene Arten von Tuberkulose durch die Integration von Multi-Omics-Daten mit maschinellem Lernen präzise zu erkennen, und bietet darüber hinaus ein gutes Beispiel und einen guten Arbeitsablauf für zukünftige Studien zur Präzisionsdiagnose verschiedener fehldiagnostizierter Krankheiten.

Alle während dieser Studie generierten oder analysierten Daten sind in diesem veröffentlichten Artikel und seinen ergänzenden Informationsdateien enthalten. Weitere Anfragen können an die entsprechenden Autoren gerichtet werden. Metabolomics-Daten wurden in der EMBL-EBI MetaboLights-Datenbank mit der Kennung MTBLS3787 hinterlegt [60]. Die für die Analyse in dieser Studie verwendeten Daten und Codes sind auf GitHub (https://github.com/ChenF-Lab/SPPT.git) verfügbar.

Kontrolliere Menschen

Kreuzvalidierung

Unterschiedlich häufig vorkommende Metaboliten

Eicosapentaensäure

Blutsenkungsgeschwindigkeit

Interquartilbereich

K-nächster Nachbar

Methoxyessigsäure

Mittlere Abnahme des Gini-Koeffizienten

Mehrschichtiges Perzeptron-Neuronales Netzwerk

Mycobacterium tuberculosis

Orthogonale partielle Diskriminanzanalyse der kleinsten Quadrate

Hauptkomponentenanalyse

L-Pyroglutaminsäure

Zufälliger Wald

Abstrichnegative Lungentuberkulose

Betriebscharakteristik des Empfängers

Abstrichpositive Lungentuberkulose

Support-Vektor-Maschinen

Tuberkulose

Variable Bedeutung in der Projektion

Weltgesundheitsorganisation. Globaler Tuberkulosebericht 2021. Genf: Weltgesundheitsorganisation; 2021. https://www.who.int/teams/global-tuberculosis-programme/data.

Bussi C, Gutierrez MG. Mycobacterium tuberculosis-Infektion von Wirtszellen in Raum und Zeit. FEMS Microbiol Rev. 2019;43(4):341–61.

Artikel CAS PubMed PubMed Central Google Scholar

Huang H, Ding N, Yang T, Li C, Jia X, Wang G, et al. Querschnittssequenzierung des gesamten Genoms und epidemiologische Untersuchung des multiresistenten Mycobacterium tuberculosis in China. Clin Infect Dis. 2019;69(3):405–13.

Artikel CAS PubMed Google Scholar

Tusun D, ​​Abulimiti M, Mammoth X, Liu Z, Xu D, Li G, et al. Die epidemiologischen Merkmale der Lungentuberkulose – Präfektur Kaschgar, Uigurisches Autonomes Gebiet Xinjiang, China, 2011–2020. China CDC Wkly. 2021;3(26):557–61.

Artikel PubMed PubMed Central Google Scholar

Lv L, Li C, Zhang X, Ding N, Cao T, Jia X, et al. RNA-Profiling-Analyse der Serum-Exosomen von Patienten mit aktiver und latenter Mycobacterium tuberculosis-Infektion. Vordere Mikrobiol. 2017;8:1051.

Artikel PubMed PubMed Central Google Scholar

Zhang G, Zhang L, Zhang M, Pan L, Wang F, Huang J, et al. Screening und Bewertung von 11 Mycobacterium tuberculosis-Proteinen als potenzielle serodiagnostische Marker zur Unterscheidung von Tuberkulosepatienten und BCG-Impflingen. Genom-Proteom-Bioinf. 2009;7(3):107–15.

Artikel CAS Google Scholar

Campos LC, Rocha MV, Willers DM, Silva DR. Merkmale von Patienten mit abstrichnegativer Lungentuberkulose (TB) in einer Region mit hoher TB- und HIV-Prävalenz. Plus eins. 2016;11(1): e0147933.

Artikel PubMed PubMed Central CAS Google Scholar

Steingart KR, Ng V, Henry M, Hopewell PC, Ramsay A, Cunningham J, et al. Sputumverarbeitungsmethoden zur Verbesserung der Empfindlichkeit der Abstrichmikroskopie bei Tuberkulose: eine systematische Überprüfung. Lancet Infect Dis. 2006;6(10):664–74.

Artikel PubMed Google Scholar

Chakaya J, Khan M, Ntoumi F, Aklillu E, Fatima R, Mwaba P, et al. Globaler Tuberkulosebericht 2020 – Überlegungen zur weltweiten Tuberkulosebelastung, Behandlung und Präventionsbemühungen. Int J Infect Dis. 2021;113:S7

Artikel CAS PubMed PubMed Central Google Scholar

Dorman SE, Schumacher SG, Alland D, Nabeta P, Armstrong DT, King B, et al. Xpert MTB/RIF ultra zum Nachweis von Mycobacterium tuberculosis und Rifampicin-Resistenz: eine prospektive multizentrische diagnostische Genauigkeitsstudie. Lancet Infect Dis. 2018;18(1):76–84.

Artikel CAS PubMed PubMed Central Google Scholar

Getahun H, Harrington M, O'Brien R, Nunn P. Diagnose von abstrichnegativer Lungentuberkulose bei Menschen mit HIV-Infektion oder AIDS in ressourcenbeschränkten Umgebungen: Information über dringende politische Änderungen. Lanzette. 2007;369(9578):2042–9.

Artikel PubMed Google Scholar

Böhme CC, Nabeta P, Hillemann D, Nicol MP, Shenai S, Krapp F, et al. Schneller molekularer Nachweis von Tuberkulose und Rifampinresistenz. N Engl J Med. 2010;363(11):1005–15.

Artikel CAS PubMed PubMed Central Google Scholar

Olivier M, Asmis R, Hawkins GA, Howard TD, Cox LA. Der Bedarf an Multi-Omics-Biomarker-Signaturen in der Präzisionsmedizin. Int J Mol Sci. 2019;20(19):4781.

Artikel CAS PubMed Central Google Scholar

Wang E, Cho WCS, Wong SCC, Liu S. Krankheitsbiomarker für die Präzisionsmedizin: Herausforderungen und zukünftige Chancen. Genom-Proteom-Bioinf. 2017;15(2):57–8.

Artikel Google Scholar

Liu L, Wu J, Shi M, Wang F, Lu H, Liu J et al. Neue Stoffwechselveränderungen und prädiktiver Marker Pipekolsäure in Seren für Plattenepithelkarzinome des Ösophagus. Genom-Proteom-Bioinf. 2022.

Li Y, Chen L. Big Biological Data: Herausforderungen und Chancen. Genom-Proteom-Bioinf. 2014;12(5):187–9.

Artikel Google Scholar

German JB, Bauman DE, Burrin DG, Failla ML, Freake HC, King JC, et al. Metabolomik im ersten Jahrzehnt des 21. Jahrhunderts: Wege zur individuellen Gesundheit ebnen. J Nutr. 2004;134(10):2729–32.

Artikel CAS PubMed Google Scholar

Deng J, Liu L, Yang Q, Wei C, Zhang H, Xin H, et al. Urinmetabolomanalyse zur Identifizierung potenzieller Marker für die Diagnose von Tuberkulose und latenter Tuberkulose. Arch Biochem Biophys. 2021;704: 108876.

Artikel CAS PubMed Google Scholar

Huang H, Shi LY, Wei LL, Han YS, Yi WJ, Pan ZW, et al. Plasmametaboliten Xanthin, 4-Pyridoxat und D-Glutaminsäure als neue potenzielle Biomarker für Lungentuberkulose. Clin Chim Acta. 2019;498:135–42.

Artikel CAS PubMed Google Scholar

Sun L, Li JQ, Ren N, Qi H, Dong F, Xiao J, et al. Nutzen neuartiger Plasma-Stoffwechselmarker bei der Diagnose pädiatrischer Tuberkulose: ein Klassifizierungs- und Regressionsbaumanalyseansatz. J Proteome Res. 2016;15(9):3118–25.

Artikel CAS PubMed Google Scholar

Pang Z, Chong J, Zhou G, de Lima Morais DA, Chang L, Barrette M, et al. MetaboAnalyst 5.0: Verringerung der Lücke zwischen Rohspektren und funktionalen Erkenntnissen. Nukleinsäuren Res. 2021;49(W1):W388–96.

Artikel CAS PubMed PubMed Central Google Scholar

Pan R, Yang T, Cao J, Lu K, Zhang ZC, et al. Imputation fehlender Daten durch K nächste Nachbarn basierend auf grauer relationaler Struktur und gegenseitiger Information. Appl. Intel. 2015;43:614–32.

Artikel Google Scholar

Abdi H, Williams LJ. Hauptkomponentenanalyse. Wiley Interdiscip Rev Comput Stat. 2010;2:433–59.

Artikel Google Scholar

Bewick V, Cheek L, Ball J. Statistikübersicht 13: Betriebskennlinien des Receivers. Kritische Pflege. 2004;8:508.

Artikel PubMed PubMed Central Google Scholar

Breiman L. Zufällige Wälder. Mach lernen. 2001;45:5–32.

Artikel Google Scholar

Abadi M, Agarwal A, Barham P, Brevdo E, Chen Z, Citro C, et al. Tensorfluss: groß angelegtes maschinelles Lernen auf heterogenen Systemen. 2015. Online verfügbar unter: tensorflow.org.

Palaci M, Dietze R, Hadad DJ, Ribeiro FK, Peres RL, Vinhas SA, et al. Hohlraumerkrankungen und quantitative Sputumbakterienbelastung bei Lungentuberkulose. J Clin Microbiol. 2007;45(12):4064–6.

Artikel PubMed PubMed Central Google Scholar

Kang W, Wu M, Yang K, Ertai A, Wu S, Geng S, et al. Faktoren im Zusammenhang mit negativen T-SPOT.TB-Ergebnissen bei abstrichnegativen Tuberkulosepatienten in China. Sci Rep. 2018;8(1):4236.

Artikel PubMed PubMed Central CAS Google Scholar

Nakao M, Muramatsu H, Arakawa S, Sakai Y, Suzuki Y, Fujita K, et al. Immunernährungsstatus und Lungenkavitation bei Patienten mit Tuberkulose: ein erneuter Besuch mit einer Beurteilung des Verhältnisses von Neutrophilen zu Lymphozyten. Respir Investig. 2019;57(1):60–6.

Artikel PubMed Google Scholar

Berhane M, Melku M, Amsalu A, Enawgaw B, Getaneh Z, Asrie F. Die Rolle des Verhältnisses von Neutrophilen zu Lymphozytenzahl bei der Differentialdiagnose von Lungentuberkulose und bakterieller ambulant erworbener Pneumonie: eine Querschnittsstudie an den Krankenhäusern Ayder und Mekelle , Äthiopien. Clin Lab 2019, 65(4).

Shvets OM, Shevchenko OS, Todoriko LD, Shevchenko RS, Yakimets VV, Choporova OI, et al. Kohlenhydrat- und Lipidstoffwechselprofile von Tuberkulosepatienten mit beidseitigen Lungenläsionen und Mykobakterienausscheidung. Wiad Lek. 2020;73(7):1373–6.

Artikel PubMed Google Scholar

Zhang P, Zhang W, Lang Y, Qu Y, Chen J, Cui L. 1H Kernspinresonanz-basiertes Stoffwechselprofil von Liquor cerebrospinalis zur Identifizierung von Stoffwechselmerkmalen und Markern für Tuberkulose-Meningitis. Infizieren Sie Genet Evol. 2019;68:253–64.

Artikel CAS PubMed Google Scholar

Collins JM, Walker DI, Jones DP, Tukvadze N, Liu KH, Tran VT, et al. Hochauflösende Plasma-Metabolomik-Analyse zum Nachweis von Mycobacterium tuberculosis-assoziierten Metaboliten, die eine aktive Lungentuberkulose beim Menschen unterscheiden. Plus eins. 2018;13(10): e0205398.

Artikel PubMed PubMed Central CAS Google Scholar

Frediani JK, Jones DP, Tukvadze N, Uppal K, Sanikidze E, Kipiani M, et al. Plasmametabolomik bei menschlicher Lungentuberkulose: eine Pilotstudie. Plus eins. 2014;9(10): e108854.

Artikel PubMed PubMed Central CAS Google Scholar

Zhou A, Ni J, Xu Z, Wang Y, Lu S, Sha W, et al. Anwendung der (1)h-NMR-Spektroskopie-basierten Metabolomik auf Seren von Tuberkulosepatienten. J Proteome Res. 2013;12(10):4642–9.

Artikel CAS PubMed Google Scholar

[PubMed] Kim E, Kang YG, Kim YJ, Lee TR, Yoo BC, Jo M, et al. Dehydroabietinsäure unterdrückt die Entzündungsreaktion durch Unterdrückung der Src-, Syk- und TAK1-vermittelten Signalwege. Int J Mol Sci. 2019;20(7):1593.

Artikel CAS PubMed Central Google Scholar

Kartha S, Yan L, Ita ME, Amirshaghaghi A, Luo L, Wei Y, et al. Phospholipase-A2-Inhibitor-beladene Phospholipid-Mizellen beseitigen neuropathische Schmerzen. ACS Nano. 2020;14(7):8103–15.

Artikel CAS PubMed PubMed Central Google Scholar

Jankute M, Cox JA, Harrison J, Besra GS. Aufbau der mykobakteriellen Zellwand. Annu Rev Microbiol. 2015;69:405–23.

Artikel CAS PubMed Google Scholar

Srivastava S, Chaudhary S, Thukral L, Shi C, Gupta RD, Gupta R, et al. Die Assimilation ungesättigter Lipide durch Mykobakterien erfordert eine zusätzliche cis-trans-Enoyl-CoA-Isomerase. Chem. Biol. 2015;22(12):1577–87.

Artikel CAS PubMed Google Scholar

Mu J, Yang Y, Chen J, Cheng K, Li Q, Wei Y, et al. Erhöhter Lipidstoffwechsel des Wirts, nachgewiesen durch iTRAQ-basierte quantitative Proteomanalyse der Liquor cerebrospinalis von Patienten mit tuberkulöser Meningitis. Biochem Biophys Res Commun. 2015;466(4):689–95.

Artikel CAS PubMed Google Scholar

Goto T, Lee JY, Teraminami A, Kim YI, Hirai S, Uemura T, et al. Die Aktivierung des Peroxisom-Proliferator-aktivierten Rezeptor-Alpha stimuliert sowohl die Differenzierung als auch die Fettsäureoxidation in Adipozyten. J Lipid Res. 2011;52(5):873–84.

Artikel CAS PubMed PubMed Central Google Scholar

Andres Contreras G, De Koster J, de Souza J, Laguna J, Mavangira V, Nelli RK, et al. Die Lipolyse moduliert die Biosynthese von entzündlichen Lipidmediatoren, die aus Linolsäure im Fettgewebe von Milchkühen in der Geburtsphase gewonnen werden. J Milchwissenschaft. 2020;103(2):1944–55.

Artikel CAS PubMed Google Scholar

Armstrong MM, Diaz G, Kenyon V, Holman TR. Hemmende und mechanistische Untersuchungen von Oxolipiden mit humanen Lipoxygenase-Isozymen. Bioorg Med Chem. 2014;22(15):4293–7.

Artikel CAS PubMed PubMed Central Google Scholar

Mattmiller SA, Carlson BA, Gandy JC, Sordillo LM. Eine verringerte Makrophagen-Selenoprotein-Expression verändert die Biosynthese oxidierter Lipidmetaboliten aus Arachidon- und Linolsäure. J Nutr Biochem. 2014;25(6):647–54.

Artikel CAS PubMed Google Scholar

Nienaber A, Baumgartner J, Dolman RC, Ozturk M, Zandberg L, Hayford FEA, et al. Die alleinige Gabe von Omega-3-Fettsäuren und Eisen, jedoch nicht in Kombination, verringert Entzündungen und Infektionsanämie bei mit Mycobacterium tuberculosis infizierten Mäusen. Nährstoffe. 2020;12(9):2897.

Artikel CAS PubMed Central Google Scholar

Orlowski M, Meister A. Der Gamma-Glutamyl-Zyklus: ein mögliches Transportsystem für Aminosäuren. Proc Natl Acad Sci US A. 1970;67(3):1248–55.

Artikel CAS PubMed PubMed Central Google Scholar

Gamarra Y, Santiago FC, Molina-Lopez J, Castano J, Herrera-Quintana L, Dominguez A, et al. Pyroglutaminazidose aufgrund einer Blockade der Glutathionregeneration bei kritischen Patienten mit septischem Schock. Kritische Pflege. 2019;23(1):162.

Artikel PubMed PubMed Central Google Scholar

Balazy M, Kaminski PM, Mao K, Tan J, Wolin MS. S-Nitroglutathion, ein Produkt der Reaktion zwischen Peroxynitrit und Glutathion, das Stickoxid erzeugt. J Biol. Chem. 1998;273(48):32009–15.

Artikel CAS PubMed Google Scholar

Ly J, Lagman M, Saing T, Singh MK, Tudela EV, Morris D, et al. Die Ergänzung mit liposomalem Glutathion stellt die TH1-Zytokinreaktion auf eine Mycobacterium tuberculosis-Infektion bei HIV-infizierten Personen wieder her. J Interferon Cytokine Res. 2015;35(11):875–87.

Artikel CAS PubMed PubMed Central Google Scholar

He R, Zeng LF, He Y, Wu L, Gunawan AM, Zhang ZY. Organokatalytische Mehrkomponentenreaktion zur Gewinnung eines selektiven Inhibitors von mPTPB, einem Virulenzfaktor der Tuberkulose. Chem Commun (Camb). 2013;49(20):2064–6.

Artikel CAS Google Scholar

Fu YR, Yi ZJ, Guan SZ, Zhang SY, Li M. Proteomische Analyse von Sputum bei Patienten mit aktiver Lungentuberkulose. Clin Microbiol Infect. 2012;18(12):1241–7.

Artikel CAS PubMed Google Scholar

Zhang J, Han X, Gao C, Xing Y, Qi Z, Liu R, et al. 5-Hydroxymethylom in zirkulierender zellfreier DNA als potenzieller Biomarker für nichtkleinzelligen Lungenkrebs. Genom-Proteom-Bioinf. 2018;16(3):187–99.

Artikel CAS Google Scholar

Riniker S., Wang Y., Jenkins JL., Landrum GA. Nutzung von Informationen aus historischen Hochdurchsatz-Screenings zur Vorhersage aktiver Verbindungen. J Chem Inf-Modell. 2014;54(7):1880–91.

Artikel CAS PubMed Google Scholar

Wang J, Xie X, Shi J, He W, Chen Q, Chen L, et al. Der Denoising Autoencoder, ein Deep-Learning-Algorithmus, hilft bei der Identifizierung einer neuen molekularen Signatur des Lungenadenokarzinoms. Genom-Proteom-Bioinf. 2020;18(4):468–80.

Artikel Google Scholar

Akkasi A, Moens MF. Extraktion kausaler Zusammenhänge aus biomedizinischem Text mithilfe tiefer neuronaler Modelle: eine umfassende Umfrage. J Biomed Inform. 2021;119: 103820.

Artikel PubMed Google Scholar

Yang Q, Chen Q, Zhang M, Cai Y, Yang F, Zhang J, et al. Identifizierung der Acht-Protein-Biosignatur zur Diagnose von Tuberkulose. Thorax. 2020;75(7):576–83.

Artikel PubMed Google Scholar

Huang MW, Chen CW, Lin WC, Ke SW, Tsai CF. SVM und SVM-Ensembles bei der Brustkrebsvorhersage. Plus eins. 2017;12(1): e0161501.

Artikel PubMed PubMed Central CAS Google Scholar

Er O, Temurtas F, Tanrikulu AC. Diagnose von Tuberkulose-Erkrankungen mithilfe künstlicher neuronaler Netze. J Med Syst. 2010;34(3):299–302.

Artikel PubMed Google Scholar

de Souza Filho JBO, de Seixas JM, Galliez R, de Braganca Pereira B, de Mello FCQ, Dos Santos AM, et al. Ein Screening-System für abstrichnegative Lungentuberkulose unter Verwendung künstlicher neuronaler Netze. Int J Infect Dis. 2016;49:33–9.

Artikel Google Scholar

Haug K, Cochrane K, Nainala VC, Williams M, Chang J, Jayaseelan KV, et al. MetaboLights: eine Ressource, die sich als Reaktion auf die Bedürfnisse ihrer wissenschaftlichen Gemeinschaft weiterentwickelt. Nukleinsäuren Res. 2020;48(D1):D440–4.

CAS PubMed Google Scholar

Referenzen herunterladen

Die Autoren möchten allen Studienteilnehmern danken, die zu dieser Arbeit beigetragen haben, sowie dem klinischen Forschungspersonal der teilnehmenden Institutionen, die diese Forschung ermöglicht haben.

Diese Forschung wurde vom State Key Laboratory of Pathogenesis, Prevention and Treatment of High Incidence Diseases in Central Asia, Xinjiang Medical University (Fördernummer SKL-HIDCA-2021-JH10, SKL-HIDCA-2020-38, SKL-HIDCA-2020) finanziert -36 und SKL-HIDCA-2020-35), Großes Sonderprojekt für Wissenschaft und Technologie in der Uigurischen Autonomen Region Xinjiang (Zuschuss Nr. 2017A03006-2), National Natural Science Foundation of China (NSFC) (Zuschuss Nr. 82060609), Mittel für Internationale Zusammenarbeit und Austausch der National Natural Science Foundation of China (Grant No. 32061143024), Schlüsselforschungs- und Entwicklungsprojekt in der Provinz Hainan (ZDYF2021SHFZ228).

Xin Hu, Jie Wang, Yingjiao Ju und Xiuli Zhang haben gleichermaßen zu dieser Arbeit beigetragen

Staatliches Schlüssellabor für Pathogenese, Prävention und Behandlung von Krankheiten mit hoher Inzidenz in Zentralasien, Abteilung für Atemwegsmedizin, Erstes angegliedertes Krankenhaus der Medizinischen Universität Xinjiang, Urumqi, 830000, Xinjiang, China

Xin Hu & Jing Wang

Abteilung für Atemwegsmedizin, Erstes angegliedertes Krankenhaus der Medizinischen Universität Xinjiang, Urumqi, 830011, Xinjiang, China

Xin Hu

CAS Key Laboratory of Genome Sciences and Information, Beijing Institute of Genomics, Chinesische Akademie der Wissenschaften und China National Center for Bioinformation, Peking, 100101, China

Jie Wang, Yingjiao Ju, Xiuli Zhang, Cuidan Li, Liya Yue und Fei Chen

Universität der Chinesischen Akademie der Wissenschaften, Peking, 100049, China

Jie Wang, Yingjiao Ju & Fei Chen

Abteilung für Atemwegsmedizin, Zweites angegliedertes Krankenhaus der Medizinischen Universität Xinjiang, Urumqi, 830063, Xinjiang, China

Wushou'er Qimanguli

Staatliches Schlüssellabor für Pathogenese, Prävention und Behandlung von Krankheiten mit hoher Inzidenz in Zentralasien, Urumqi, 830011, Xinjiang, China

Bahetibieke Tuohetaerbaike, Ying Li, Hao Wen, Wenbao Zhang und Fei Chen

Schlüssellabor für molekulare Virologie und Immunologie, Abteilung für pathogene Pilzinfektion und Wirtsimmunität, Institut Pasteur of Shanghai, Chinesische Akademie der Wissenschaften, Shanghai, 20003, China

Changbin Chen

Abteilung für Atemwegsmedizin, Zweites angegliedertes Krankenhaus der Hainan Medical University Haikou, Hainan, 570100, China

Yefeng Yang & Jing Wang

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

FC, JingW, HW und WBZ trugen zur Konzeption und Gestaltung der Studie bei. JieW, JYJ und XLZ führten die bioinformatischen Analysen durch. XH, BT, YL, YFY und CBC sammelten Blutproben YLY hat die Figuren gezeichnet. FC, JingW, XH, JieW, JYJ, XLZ und QW haben das Manuskript geschrieben. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Jing Wang oder Fei Chen.

Diese Studie wurde von der Ethikkommission des First Affiliated Hospital der Xinjiang Medical University (Aktennummer 20171123-06-1908A) genehmigt und das Projekt wurde vom Clinical Medical Center der Provinz Hainan unterstützt. Alle eingeschriebenen Probanden gaben eine schriftliche Einverständniserklärung ab. Alle Methoden wurden in Übereinstimmung mit den relevanten Richtlinien und Vorschriften durchgeführt.

Unzutreffend.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Zusatzdaten.

Korrelationsmatrix aus 120 Merkmalen.

Detaillierte Informationen zu den 70 DAMs zwischen den SPPT-Patienten und den Kontrollpersonen.

Detaillierte Informationen zu den 79 DAMs zwischen den SNPT-Patienten und den Kontrollpersonen.

Detaillierte Informationen zu den 33 DAMs zwischen SPPT- und SNPT-Patienten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/. Der Creative Commons Public Domain Dedication-Verzicht (http://creativecommons.org/publicdomain/zero/1.0/) gilt für die in diesem Artikel zur Verfügung gestellten Daten, sofern in einer Quellenangabe für die Daten nichts anderes angegeben ist.

Nachdrucke und Genehmigungen

Hu, X., Wang, J., Ju, Y. et al. Die Kombination von Metabolom- und klinischen Indikatoren mit maschinellem Lernen liefert einige vielversprechende diagnostische Marker zur präzisen Erkennung von abstrichpositiver/negativer Lungentuberkulose. BMC Infect Dis 22, 707 (2022). https://doi.org/10.1186/s12879-022-07694-8

Zitat herunterladen

Eingegangen: 07. Januar 2022

Angenommen: 22. August 2022

Veröffentlicht: 25. August 2022

DOI: https://doi.org/10.1186/s12879-022-07694-8

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt