https://bodybydarwin.com
Slider Image

Dieser Mann will die wissenschaftliche Forschung vor sich selbst retten

2021

DARPA, die Agentur für fortgeschrittene Verteidigungsforschungsprojekte der Bundesregierung, ist eine verführerische, mythologisierte, gelegentlich kryptische Organisation, die Freaks ausspionieren soll. Wenn Sie dies lesen, verwenden Sie mindestens ein Projekt, um aus der Agentur herauszukommen (das Internet), und statistisch gesehen haben Sie ein weiteres in Reichweite: GPS und Siri basierten ebenfalls auf DARPA-Projekten. Wenn Sie einen Blick auf die Zukunft in fünf Jahren werfen möchten, gibt es schlechtere Ausgangsbedingungen. Als ich und eine Gruppe anderer Reporter in diesem Sommer zu einer DARPA-Wissenschaftsmesse ins Pentagon eingeladen wurden, war es nicht überraschend, dass so viele von uns das Angebot aufnahmen.

Gehen Sie zum Check-in-Schalter des Pentagon, zücken Sie Ihren Führerschein, geben Sie Ihre Sozialversicherungsnummer in einen Automaten ein, gehen Sie mit einem gesprächigen Wachmann, der fragt, woher Ihr Hemd kommt, durch die Gänge und Sie haben es in den Innenhof geschafft. Als ich besuchte, war es ein warmer, häufig bewölkter Mai-Nachmittag, der drohte, das von DARPA liebenswürdig zusammengestellte Picknick zu regnen.

"Science Fair" erwies sich als eine genauere Beschreibung, als ich dachte. Es gab Dutzende von Tabellen, die nach Kategorien geordnet waren: Big Data, Cyberwar und sogar ein Nebenzelt, in dem ein Virtual-Reality-Projekt vorgestellt wurde. Es gab Software, die Terroristen aufspüren konnte, eine unüberwindliche Drohne. Und in der Mitte stand ein glatzköpfiger, bärtiger Mann mit Brille neben einem einfachen Schild mit der Aufschrift Big Mechanism. Trotz der Selbstüberschätzung schien er immer mit jemandem zu reden. Ich drehte ein paar Runden um die Stände, bevor ich mich vorstellte.

Sein Name war Paul Cohen, ein Professor für Informationswissenschaft an der Universität von Arizona, der an der DARPA ausgeliehen wurde. Er hatte die Aufgabe, ein ehrgeiziges Projekt durchzuführen: Mithilfe von Daten die Art und Weise, wie Wissenschaft betrieben wird, grundlegend zu verändern und ein Programm zu erstellen, mit dem jeder Artikel gelesen und gespeichert werden kann, der jemals zu einem Thema geschrieben wurde, dann knacken Sie diese Daten, um neue, möglicherweise brillante Lösungen für Probleme zu finden. Es ist eine Aufgabe, die kein Mensch oder keine Organisation alleine bewältigen könnte - und das Pilotprogramm wird sich auf die Behandlung von Krebs konzentrieren.

Er erklärte weiter. Nachdenklich nimmt er sich Zeit, um zu antworten. Das Aufregendste, was ich sah, war, als ein anderer Journalist die Frage stellte: Aber Maschinen können nicht wirklich originelle Gedanken haben, oder?

Cohen leuchtete schneller auf als das uniformierte Personal, das hinter uns eine Rauchpause einlegte. Ursprüngliche Gedanken? Hatte der Computer, der Kasparov beim Schach schlagen konnte, einen originellen Gedanken?

"Wetten, dass es ein origineller Gedanke war?"

***

Es werden möglicherweise 1, 8 Millionen wissenschaftliche Artikel pro Jahr veröffentlicht, aber ihre Reichweite ist zweifellos miserabel, obwohl genaue Statistiken diskutiert werden: In einer Studie wurde festgestellt, dass mehr als die Hälfte der Artikel von niemandem außerhalb von Autoren und Rezensenten gelesen wird. In vielerlei Hinsicht ähnelt die Wissenschaft immer noch dem Mittelalter: kleine Enklaven von Forschern, die ihre Papiere myopisch aneinander weitergeben, ohne sie zu einer großartigen Vision zu verbinden.

Jetzt haben wir das Internet. Wir haben Forschungszentren, private Unternehmen und Universitäten. Das Problem ist nicht die Skalierung, sondern die Lautstärke. Experten lesen viele Artikel, die für das Verständnis ihres Fachgebiets von entscheidender Bedeutung sind, und Institutionen lesen gemeinsam viel mehr, aber keine Person oder Organisation kann sie alle lesen und auf diese Weise Verbindungen zwischen ihnen herstellen. Wir werden nie den Wald mit so vielen Bäumen im Weg sehen.

Der Informatiker Paul Newell formulierte das Problem beredt und beinahe forschend in Kommentaren zu Beiträgen auf einem Symposium von 1973. Der Aufsatz heißt "Man kann nicht 20 Fragen mit der Natur spielen und gewinnen und Cohen ist ein Fan:

Wir scheinen in der experimentellen Literatur niemals die Ergebnisse aller Experimente zusammenzufassen. Der Beitrag von Posner im vorliegenden Symposium ist ein hervorragendes Beispiel - hervorragend, um sowohl die geschickten Versuche zu zeigen, die wir derzeit machen, als auch um zu zeigen, wie kurz dies ist, um die Ergebnisse wirklich zu integrieren. Wir machen - Posner macht - Versuchsreihen. Das Gestänge ist aber außerordentlich locker. Man wählt aus den qualitativen Zusammenfassungen eines bestimmten Experiments aus, was vorgebracht und den Anliegen einer gegenwärtigen Behandlung gegenübergestellt werden soll.

Der Direktor des Information Innovation Office der DARPA, in dem Cohen stationiert ist, hielt nach den Demo-Feierlichkeiten einen Vortrag vor Reportern. Als charmanter, unerbittlich aufgeregter Mann ging er zu einer PowerPoint-Folie, in der der riesige Hangar 51 von Raiders of the Lost Ark mit Versandkisten gefüllt war, und verglich ihn mit der Fülle an Informationen, die wir ständig durchforsten. Stellen Sie sich vor, die nächste große Heilung für eine Krankheit wäre da.

Es ist da drin, sagte er. "Geh und finde es, Indiana Jones."

Cohen möchte diese überwältigende Menge an Forschung zu einem Ganzen zusammenführen. Das ist nicht so schwierig, wie es sich anhört. Es ist ausnahmsweise schwieriger als es sich anhört.

Software, die Sprache wirklich verstehen kann, steckt noch in den Kinderschuhen. Wenn Sie einen Artikel lesen - entweder einen wissenschaftlichen Artikel oder beispielsweise einen Artikel wie den, den Sie gerade lesen -, greift die Software bestimmte Hinweise auf. Wenn man die Bedeutung eines Wortes hier und eines Ausdrucks dort erfasst, kann die Sprache einen zusammenhängenden Sinn haben, zumindest um einen verwandten Artikel oder eine verwandte Arbeit vorzuschlagen. Aber dieses Verständnis ist flüchtig. Jeder, der versucht hat, Google Übersetzer zu verwenden, kann Ihnen sagen, dass Maschinen immer noch häufig Probleme haben, Entscheidungen mit dem Kontext zu treffen. Sie sind möglicherweise in der Lage, einen Satz oder eine Phrase genau zu übersetzen, stolpern jedoch, wenn sie die intuitiven Sprünge ausführen, die für einen Absatz oder einen längeren Text erforderlich sind.

Cohen glaubt, oder hofft zumindest, dass er diese Hürden überwinden kann. Er wird klein anfangen: ungefähr hundert Artikel über Krebs. Wenn alles nach Plan verläuft, liest die Maschine, die als Big Mechanism bezeichnet wird, sie und beginnt, ein Verständnis für die Krankheit zu entwickeln. Dann wird Cohen es loslassen, damit die weltweiten Forschungsdatenbanken nach immer mehr Informationen durchsucht werden können, Tausende von Artikeln. Irgendwann wird es eine Grand Unified Theory of Cancer etablieren, ein Verständnis dafür, wie Zellen mutieren und krebsartig werden, wie sie den Körper verwüsten und welche Medikamente die Ausbreitung verlangsamen. Ein Artikel beschreibt den Beginn der Krankheit, ein anderer die Behandlung; Der große Mechanismus würde sie alle in Harmonie bringen.

Das Endergebnis wäre eine Konstellation von Papieren, die alle miteinander verbunden sind und jeweils ihren eigenen Beitrag zum Gesamtbild leisten. Bewaffnet damit könnten Forscher damit beginnen, das Modell zu optimieren und zu experimentieren, um zu sehen, was passieren könnte, wenn ein neues Medikament in die Gleichung aufgenommen wird. Besser noch, Big Mechanism könnte eines Tages in der Lage sein, potenzielle Behandlungen selbst zu entwickeln. Unsere Beziehung zu Forschung, Maschinen und Wissenschaft könnte sich ändern.

Der einzige unvermeidliche Knick im Plan sind Menschen.

***

Das DARPA-Hauptquartier ist eine riesige Glasplatte in Arlington, gegenüber einem Einkaufszentrum. Es ist imposant, aber abgesehen von der Hausnummer 675 über dem Eingang nicht gekennzeichnet. Am Tag nach den Demos traf ich Cohen dort. Die Sicherheit im Gebäude war erwartungsgemäß eng; Ich kam an einem Metalldetektor vorbei, überprüfte mein Telefon und wurde zu den Büros geführt.

Das Stockwerk, in dem Cohen arbeitet, ist ein Standard-Industriebüroplan - mehr Universitätsabteilung als verrücktes Wissenschaftlerlabor. Wir machten uns auf den Weg zu einem Konferenzraum, der dankenswerterweise als "Nicht klassifiziert" gekennzeichnet war, und setzten fort, wo wir aufgehört hatten. Cohen saß mir mit gekreuzten Beinen auf dem Stuhl gegenüber.

"Wenn du einen Satz hörst, hat er dir erklärt, dass du etwas geistige Arbeit verrichten musst."

Es sind unzählige Annahmen und Interpretationen erforderlich, damit die Sprache einen Sinn ergibt. Es gibt Unklarheiten in der Grammatik und Brocken, die ohne vollständigen Kontext bedeutungslos sind.

Selbst in der scheinbar trockenen Welt der Gesundheitsforschung gibt es gut dokumentierte Beispiele für das, was Cohen "kleinere Verbrechen" nennt: die Versuchung, die Tatsache zu begraben, dass eine Studie nur über Würmer durchgeführt wurde oder dass eine Korrelation möglicherweise nicht so entscheidend ist wie die Prosa würde dich zum Nachdenken bringen. Big Mechanism muss diese Probleme berücksichtigen. "Wissenschaftler sind nicht über rhetorische Tricks erhaben, sagte er.

Es wird natürlich eine Menge Lärm geben. Forschung kann sich als nicht reproduzierbar herausstellen; Ein Fehler in den Daten kann einen Widerruf erforderlich machen. Aber das Datenvolumen in Big Mechanism würde das Signal durch das Rauschen zwingen. Laut Cohen wird jeder Datenpunkt auf mehreren Papieren basieren, was bedeutet, dass er von mehr als einer Streustudie gestützt wird. Sobald die Maschine diese Grundlage hat, beginnt die Arbeit an der Aufnahme neuer Informationen in das Modell: Die Software nimmt die Ergebnisse aus einem Papier und findet heraus, wie sie in das große Forschungsschema passen. Mit diesem Modell könnten wir feststellen, dass Forschungen, die zuvor als unvereinbar galten, plötzlich zusammenfallen könnten. Angenommen, die Ergebnisse von Papier X scheinen den Ergebnissen von Papier Y zu widersprechen. Ein Maschinenmodell könnte die beiden Probleme lösen, indem es eine dritte Variable findet, die die unterschiedlichen Ergebnisse der Papiere erklärt. Danach ist es nur ein kurzer Sprung zur Entwicklung neuer Krebstherapien oder zur Durchführung eines noch komplizierteren Experiments.

***

So unwahrscheinlich es auch klingen mag, Krebs ist zumindest für das Big-Mechanism-Projekt ein relativ einfach zu verstehendes System. Die Krankheit wächst und breitet sich auf molekularer Ebene aus und kann durch eine enge Linse verstanden werden: etwas Chemie, etwas Biologie. Gelingt Big Mechanism jedoch, könnte das Projekt auf kompliziertere Systeme übergehen, bei denen wir wirklich keine Ahnung haben, wie sich Änderungen auf ein gesamtes System auswirken. Cohen erwähnt das Klima: "Weißt du, wie das Klima funktioniert?"

Hm. Nein?

"Du bist in guter Gesellschaft."

Er bringt das Gespenst des Geo-Engineerings zur Sprache, die umstrittene Idee, dass der Klimawandel durch Manipulation der Umwelt eingedämmt werden kann. Was würde passieren, wenn wir 100 Tonnen Eisen in den Ozean werfen würden, um das Planktonwachstum zu stimulieren, wie es ein Geo-Ingenieur tat? Die Ergebnisse könnten katastrophal sein oder nicht. Die Beziehungen im System - zwischen Land, Ozean, Pflanzen und Tieren, den unzähligen chemischen Prozessen - sind zu kompliziert, um alle Konsequenzen einer drastischen Maßnahme vorauszusehen. Aber eines Tages könnte Big Mechanism es schaffen. Dies hat DARPA, eine Abteilung für Verteidigung, in das Projekt hineingezogen. Eine andere komplizierte strukturelle Organisation könnte die Hierarchie einer Terroristengruppe sein. Big Mechanism konnte sofort verstehen, wo die Hauptakteure in einer kriminellen Vereinigung sitzen, und neue Informationen über sie in ein ständig aktualisiertes Modell integrieren.

Vieles davon ist spekulativ. Das Projekt befindet sich noch im Anfangsstadium und inwieweit es funktioniert - wenn überhaupt - ist unklar. Der große Mechanismus könnte sich als theoretisch faszinierende Idee herausstellen, die letztendlich in der praktischen Anwendung auseinanderfällt. Ich wies Cohen darauf hin, dass wir einige Jahre von Maschinen entfernt zu sein scheinen, die Moby Dick nach Metapher analysieren. Er sagte, er würde zustimmen, obwohl er optimistisch ist, was die Maschinen leisten werden.

Wie auch immer, diese theoretischen Ideen? Sie sind wirklich etwas.

Wenn das Projekt funktioniert, wenn es sich nicht nur lohnt, sondern "spektakulär gelingt", sagt Cohen, wird es ein Fall für die Schaffung einer neuen Art von Forschungssprache sein, in der die Mehrdeutigkeiten der Sprache herausgearbeitet werden Ein Programm würde die Informationen sofort in die richtige Theorie sortieren - keine menschliche Sprache, über die man sich Sorgen machen müsste. Wissenschaftler müssten nie wieder über Studien nachdenken, bis sie die relevanten Teile gefunden haben Sie würden verfügbar sein, sobald ihre Erkenntnisse vorliegen. Natürlich erfordert all dies die Bekämpfung der menschlichen Trägheit, was eine völlig andere Schlacht ist.

Newell hat in den Kommentaren von vor über 40 Jahren seine Ambivalenz gegenüber dem Problem wie folgt zum Ausdruck gebracht:

Dass ein und dasselbe menschliche Subjekt viele (radikal unterschiedliche) Methoden für dieselbe Grundaufgabe anwenden kann, hängt vom Ziel, dem Hintergrundwissen und geringfügigen Details der Abrechnungsstruktur und der Aufgabentextur ab - all dies impliziert, dass das "normale" Mittel der Wissenschaft kann nicht ausreichen. In Bezug auf die erste Frage, die Härte, wiederhole ich meinen Ausgangspunkt: Dies ist meine verwirrte und verzweifelte halbe Rede. Meine andere Hälfte ist rosa gekitzelt, wie schnell und wie weit wir in den letzten zehn Jahren gekommen sind, ganz zu schweigen von den letzten zwei Tagen.

Das schmutzige Geheimnis des Recyclings: Die meisten Dinge, die recycelt werden könnten, sind es nicht

Das schmutzige Geheimnis des Recyclings: Die meisten Dinge, die recycelt werden könnten, sind es nicht

Schwerkraft und gutes Timing halfen dem Hubble, einen Stern aus dem frühen Universum zu erkennen

Schwerkraft und gutes Timing halfen dem Hubble, einen Stern aus dem frühen Universum zu erkennen

Diese Grafiken zeigen Amerikas komplizierte Beziehung zur körperlichen Betätigung

Diese Grafiken zeigen Amerikas komplizierte Beziehung zur körperlichen Betätigung