Riesiger neuer „Index“ teilt kostenlos Daten aus 100 Millionen wissenschaftlichen Arbeiten

(Nico De Pasquale Photography/Getty Images)

Es gibt eine Fülle an Forschungsergebnissen, deren Umfang von Tag zu Tag wächst. Aber es gibt ein Problem.

Ein Großteil der vorhandenen Literatur ist nicht nur hinter einer Paywall verborgen, es kann auch schwierig sein, sie umfassend und logisch zu analysieren und zu verstehen. Was wirklich benötigt wird, ist eine superintelligente Version von Google nur für wissenschaftliche Arbeiten.

Geben Sie die ein Allgemeiner Index , eine neue Datenbank mit rund 107,2 Millionen Zeitschriftenartikeln, was in unkomprimierter Form insgesamt 38 Terabyte an Daten entspricht. Es umfasst mehr als 355 Milliarden Textzeilen, von denen jede ein Schlüsselwort oder eine Schlüsselphrase aus einem veröffentlichten Artikel enthält.



„Dies ist ein Nachschlagewerk, ein Wissenswörterbuch, eine Wissenskarte.“ sagt der Ersteller des Index , Archivar Carl Malamud. „Ein Werkzeug, von dem wir glauben, dass es eine wesentliche Einrichtung für die Ausübung der Wissenschaft in unserem modernen Zeitalter ist.“

Obwohl wir Google erwähnt haben, handelt es sich hierbei nicht wirklich um eine Suchmaschine – Wissenschaftler, die den General Index verwenden, müssen ihre eigenen Suchmaschinen programmieren, um damit zu arbeiten. Vielmehr handelt es sich um einen sorgfältig katalogisierten und strukturierten Katalog, der zur Durchsicht jahrzehntelanger wissenschaftlicher Forschung genutzt werden kann.

Sein Hauptzweck besteht darin, zu helfen Text-Mining : Mithilfe von Computern schnell Millionen von Datenpunkten scannen, um Verweise auf etwas Bestimmtes zu finden und zu verknüpfen. Menschen können unmöglich wichtige Daten aus Millionen von Zeitschriftenartikeln lesen und heraussuchen, ein Computerprogramm, das mit dem General Index verbunden ist, kann dies jedoch.

Die Reaktionen anderer Wissenschaftler waren positiv. Ein Experte, der Computerbiologe Gitanjali Yadav von der Universität Cambridge im Vereinigten Königreich, sagt, dass die neue Datenbank in gewisser Weise dazu beiträgt, das Problem des eingeschränkten Zugriffs auf zuvor veröffentlichtes Material zu lösen.

„Es gibt für mich – oder irgendjemand sonst – keine Möglichkeit, den chemischen Fingerabdruck jeder einzelnen Pflanzenart auf der Erde experimentell zu analysieren oder zu messen“, sagte Yadav Natur . „Viele der Informationen, die wir suchen, sind bereits in veröffentlichter Literatur vorhanden.“

Die Idee ist, dass der General Index für die Suche nach Pflanzen, Chemikalien, Genen, Proteinen, Materialien, Ortsnamen und vielem mehr verwendet werden kann – das Team dahinter möchte jedoch betonen, dass er noch etwas aufgeräumt und erweitert werden muss, und das ist auch der Fall noch in Arbeit (wie es wahrscheinlich immer sein wird).

Alle diese Informationen können kostenlos heruntergeladen und verwendet werden das General Index-Portal , ohne Urheberrecht und ohne Einschränkungen – der Index besteht nur aus Auszügen von Artikeln, nicht aus den Artikeln selbst. Wie wir jedoch bereits erwähnt haben, benötigen Sie einige Programmierkenntnisse, um wirklich einen Sinn daraus zu ziehen.

Anders als das umstrittene Sci-Hub-Portal Allerdings enthält der Index nicht alle Artikel in ihrer Gesamtheit Fragen wurden aufgeworfen hinsichtlich der Rechtmäßigkeit des Projekts. Für Malamud liegt das Projekt durchaus innerhalb der rechtlichen Grenzen.

„Ich bin sehr zuversichtlich, dass das, was ich tue, legal ist“, sagte Malamud Natur . „Wir tun dies nicht, um eine Klage zu provozieren, sondern um die Wissenschaft voranzubringen.“

Über Uns

Die Veröffentlichung Unabhängiger, Nachgewiesener Fakten Von Berichten Über Gesundheit, Raum, Natur, Technologie Und Umwelt.