Eine Studie durch Forscher von der Cancer Science Institute of Singapore (CSI Singapore) an der National University of Singapore und der School of Biological Sciences der Nanyang Technological University, Singapore (NTU Singapore) offenbart ein gemeinsamer Mangel in der vorhandenen Methoden der künstlichen Intelligenz verwendet, um vorherzusagen, enhancer-Promotor-Interaktionen, die durch überhöhten performance-Messungen. Die Ergebnisse, veröffentlicht in der wissenschaftlichen Zeitschrift Nature Genetics im Juli 2019, bietet einen erweiterten Fahrplan für das Verständnis der Genregulation.
Ein enhancer ist eine kurze Sequenz der DNA, die die arbeiten zu beschleunigen, genetische Transkription, während ein Promotor ist eine DNA, welche Handlungen zu initiieren-gen-Transkription. Das Verständnis der Interaktionen zwischen einem enhancer und einem Promotor ist wichtig für Genregulation Studien, wie es ist, das große wissenschaftliche Interesse, ob Wechselwirkungen können Funktionsstörungen in Krebs-Zellen, und eine Chance für die klinische intervention. Um zu untersuchen, enhancer-Promotor-Interaktionen, die auf einem großen Maßstab und in einer kostengünstigen Art und Weise, Methoden der künstlichen Intelligenz für die Vorhersage solcher Interaktionen sind entscheidend zu erleichtern Forscher in Ihren Studien und Ihnen die Möglichkeit zu verlängern, die Verfügbarkeit solcher Daten, um neue Zelltypen.
In der Studie von Dr. Cao-Fan, research fellow am CSI Singapur, und Dr. Melissa J. Fullwood, Principal Investigator am CSI Singapore und der Nanyang Assistant Professor an der NTU Singapur, die Forschungsgruppe versucht, die Entwicklung ein enhancer-promoter Interaktion Vorhersage-Methode mit bereits vorhandenen Datensätze aus TargetFinder, einer fortschrittlichen machine learning-Methode, die vorhersagt, enhancer-Promotor-Interaktionen, basierend auf Transkriptionsfaktoren und Histon-Modifikation von Profilen im Fenster-Regionen zwischen Enhancer und Promotoren. Während dann das team beobachtet, dass die enhancer-Promotor-Interaktionen vorhergesagt wurden bei zufälligen DNA-Sequenz, die Funktionen in der Fenster-Regionen, die auf eine hohe performance.
Jedoch nach sorgfältiger Prüfung der TargetFinder-Datensätze, die dem team klar, dass die berichtete hohe Leistungen zurückgeführt werden könnten, um die hohe überschneidung zwischen Fenster-Regionen der positiven Proben in den Datensätzen, die die vorhergesagte Leistung. Um das Problem zu mildern, überlappenden Muster, das team dann ausgewertet enhancer-Promotor-Interaktion-Methoden mithilfe eines Chromosom-split-Strategie. TargetFinder erzielt deutlich geringere Leistung mit der Chromosom-split-Strategie, die bewiesen, dass die performance-Messungen waren in der Tat aufgeblasen in der früheren Vorhersage.
Das team untersuchte auch eine andere Methode, JEME, eine betreute machine-learning-Verfahren, das die Verwendung von Datensätzen, die mit signifikanten Unterschiede in der Distanz der Verteilungen zwischen positiven und negativen Proben, um vorherzusagen, enhancer-Promotor-Interaktionen. Ihre Untersuchung ergab, dass JEME auch Ergebnisse überhöhten performance-Messungen durch fehlerhafte Nutzung der Daten durch.
„Unsere Studie unterstreicht die Notwendigkeit für die sorgfältige experimentelle design bei der Anwendung des maschinellen Lernens, um genomische Forschung. Es ist der Schlüssel korrekt zu bewerten, eine enhancer-Promotor-Interaktion-Methode und berücksichtigt die Möglichkeit der Erzeugung sehr aufgeblasen performance measurement.“, sagte Dr. Cao.
„Genau enhancer-Promotor-Interaktionen Vorhersage ist essentiell in der Genregulation Studien zu erleichtern, um unsere Fähigkeit, zu verstehen, ob es Unterschiede gibt zwischen Krebs Proben, wie unterschiedlichen klinischen Subtypen von Krebs, um besser zu entwickeln Biomarker und Therapien für Krebs in der Zukunft,“ sagte Dr. Fullwood.
Moving forward, die Forschungs-team arbeitet an einem neuen präzise machine-learning-Ansatz für die Vorhersage von enhancer-Promotor-Interaktionen, und die Anwendung der Methode auf die Analyse von Krebs Kohorten, um zu verstehen, Veränderungen in der enhancer-Promotor-Interaktionen in der Krebstherapie.