dsu-info(at)geomar.de
Timm Schoening
Leitung DSU
Anne Hennke
Visualization & Stories
Karl Heger
Imaging & Robotics
Judith Fischer
AI, Imaging & Robotics
Sophie Schindler
Image Data Steward
Willkommen in der Data Science Materialsammlung, kuratiert von der 91̽»¨ DSU. Hier stellen wir eine Liste von Links und Beschreibungen von Materialien zur Verfügung, die wir im Zusammenhang mit Data Science für hilfreich halten: Kurse, Bücher, Veröffentlichungen von Anwendungsfällen, Datensätze usw. Wir aktualisieren diese Sammlung ständig, wenn wir auf relevante Beiträge stoßen. Teilen Sie uns gern auch Ihre Empfehlungen mit - wir fügen sie hier gerne hinzu.
Online free Python courses
Es ist schwierig, einen bestimmten Kurs zu empfehlen, ohne den Hintergrund der Programmierung und die jeweilige Anwendung zu kennen. Wenn Sie bereits Programmiererfahrung haben, können wir empfehlen, einfach mit einem Cheat sheet für Python anzufangen. Dieser kann ganz einfach einen Anfängerkurs für Python ersetzen und dann können Sie mit fortgeschritteneren Kursen beginnen.
Einige Beispiele für cheat sheets:
(etwas unübersichtlich, aber auch hilfreich)
Wir empfehlen, nach einem Kurs zu suchen, der auf Data Science ausgerichtet ist, denn Python ist so vielseitig, dass manche Kurse viele Themen abdecken, die für Naturwissenschaftler nicht unbedingt nützlich sind. Zum Beispiel:
Dies ist die Plattform, die wir auch für unseren Kurs verwenden, sie ist im Allgemeinen gut gepflegt und validiert.
Dies ist ein Python-Kurs, der auf Data Science ausgerichtet ist und durch die Anwendung von Python auf ein reales Problem lehrt.
ist auf Data Science und Daten ausgerichtet und bietet Anfängerkurse in Python an
Die Python-Gemeinschaft selbst bietet viel Material zum Lernen an
Einen sehr empfehlenswerten self-study-Kurs zum Thema "Multivariate Data Analysis" via Open Classrooms findet ihr .
Weitere Plattformen bieten eine große Auswahl an Kursen an. Die meisten von ihnen sind kostenlos, vor allem wenn Sie keine Prüfungen ablegen und ein offizielles Zertifikat benötigen:
Georgia Tech Python Kurs - sehr hohe Qualität, die Anfängerkurse sind sehr gut, aber auch sehr langsam, wenn Sie bereits Codierungserfahrung haben, hilft es, die Videos zu beschleunigen...
bietet - wie EdX - eine Vielzahl von Kursen an, darunter Python-Kurse für Anfänger und andere Anwendungen
wieder ein riesiges Angebot an kostenlosen Kursen
und eine weitere Plattform für Kurse, hat ebenfalls einen guten Ruf
Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition. by Aurélien Géron. Released September 2019. Publisher(s): O'Reilly Media, Inc.
by Wes McKinney: interne Empfehlung als "Bible für pandas und numpy" (pdf-link: )
"Python Crash Course: A Hands-On, Project-Based Introduction to Programming" by Eric Matthes
"Automate the Boring Stuff with Python: Practical Programming for Total Beginners" by Al Sweigart
"Python for Everybody: Exploring Data in Python 3" by Charles Severance
"Learning Python, 5th Edition" by Mark Lutz
"Python Programming: An Introduction to Computer Science, 3rd Edition" by John Zelle
"Introduction to Python for Science and Engineering" by David J. Pine
"Python Basics: A Practical Introduction to Python 3" by Real Python
"Think Python: How to Think Like a Computer Scientist" by Allen B. Downey
"Python 101: A Crash Course in Python Programming" by Mike Driscoll
"Python Programming for the Absolute Beginner, 3rd Edition" by Michael Dawson
by Guisan et al. (2017)
by Fletcher & Fortin (2018)
: Zeigt verfügbare Daten aus Ihrem Forschungsgebiet von allen DAM-Partnern: Bathymetrie-, Sediment- und Beobachtungsdatensätze, CONMAR-Datensätze;
: Im Weltdatenzentrum PANGAEA veröffentlichte Meeres- und Umweltdatensätze.
Veröffentlichung und gemeinsame Nutzung von Geodaten
Alle Informationen über Expeditionen, numerische Modelle und Experimente.
ZPL : Suche nach den am 91̽»¨ gelagerten Gesteinsproben und Sedimentkernen
: Veröffentlichte Datensätze im Weltdatenzentrum Klima im Deutschen Klimarechenzentrum (DKRZ).
Daten aus begutachteten Artikeln mit Ergebnissen aus numerischen Modellen.
DSHIP Underway Dat of RVs: The recorded underway data of the German research vessels are transferred ashore and archived in the long term. They can be accessed and exported via interlinked web services at 91̽»¨, BSH and AWI.
: Globale Satellitendaten finden, herunterladen und verarbeiten
: Quelle für Satellitendaten; Auswahl aus vielen verschiedenen Satelliten; Möglichkeit, Shape-Dateien zu importieren, um Bildmaterial für bestimmte Gebiete zu exportieren.
: Monatliche Proben seit 1957 an der Zeitserienstation Boknis Eck (BE) in der westlichen Ostsee.
Sammlung von weltweit vorhandenen bathymetrischen Daten einschließlich der Daten der international wichtigsten bathymetrischen Datenquellen.
: Echtzeitdaten von wissenschaftlichen Plattformen, die von 91̽»¨-Forschungsgruppen installiert wurden.
: biologische Proben von 91̽»¨ - Expeditionen
: Plattform für marine Geodaten von Marine Dateninfrastruktur Deutschland
: Datenbank zur biologischen Vielfalt der Meere
: marine und lakustrine geologische Proben
: globale Sammlung geochemischer Meeresbodenproben
: KI-geeignete Datensätze für die unterschiedlichsten Anwendungsbereiche
: Visualisiert räumliche Zeitseriendatensätze in Echtzeit. Der Viewer ist in der Lage, mit verschiedenen Datentypen umzugehen und erleichtert die interaktive Exploration von verschiedenen Datensätzen an einem Ort. Als Inhouse-Produkt kann direkter Support angeboten werden.
ARENA 2: Erkunden Sie Ihre Daten in einer hausinternen Projektionskuppel. Es visualisiert 2-4D-Geodaten, Modellläufe, großformatige Videos, Fotos und ermöglicht Telepräsenz.
: Visualisierung von Daten verschiedener Plattformen; neben der Visualisierung der Plattform-Daten ist ein wesentlicher Teil von BELUGA auch das Unterwasser Netzwerk (Kummunikation und Navigation unter Wasser).
: Werkzeug-Zusammenstellung zur Untersuchung und Klassifizierung benthischen Terrains
: Python GeoPandas ist eine beliebte Open-Source-Bibliothek für die Arbeit mit Geodaten, die es den Benutzern ermöglicht, geografische Informationen innerhalb der Python-Umgebung einfach zu manipulieren, zu analysieren und zu visualisieren.
QGIS ist eine freie und Open-Source-Software für geografische Informationssysteme (GIS), mit der Benutzer geografische Daten erstellen, bearbeiten, visualisieren und analysieren können.
: GDAL (Geospatial Data Abstraction Library) ist eine Open-Source-Softwarebibliothek, die eine Reihe von Werkzeugen und Bibliotheken für die Arbeit mit Raster- und Vektor-Geodatenformaten bereitstellt und eine vielseitige Bearbeitung und Konvertierung von Geodaten ermöglicht.
: R-Landschaftsmetriken sind eine Sammlung quantitativer Maße und Statistiken, die in der Programmiersprache R verwendet werden, um die räumlichen Muster und Merkmale von Landschaften zu bewerten und zu analysieren, was sie zu einem wertvollen Werkzeug für die Landschaftsökologie und die Flächennutzungsplanung macht.
: Python OpenCV ist eine leistungsstarke Open-Source-Computer-Vision-Bibliothek, die es Entwicklern ermöglicht, eine breite Palette von Bild- und Videoverarbeitungsaufgaben mit der Programmiersprache Python durchzuführen.
COLMAP (Structure-from-Motion and Multi-View Stereo) ist eine Bildverarbeitungssoftware, die auf die Rekonstruktion von 3D-Szenen aus 2D-Bildern spezialisiert ist und sich daher für Aufgaben wie Photogrammetrie und 3D-Modellierung eignet.
: MetaShape, ist eine professionelle Fotogrammetrie-Software, mit der Benutzer hochwertige 3D-Modelle und Karten aus einer Sammlung von 2D-Bildern erstellen können.
: Das Python-Paket pandas ist eine leistungsstarke und beliebte Bibliothek zur Datenmanipulation und -analyse, die einfach zu verwendende Datenstrukturen und Werkzeuge für die Arbeit mit strukturierten Daten bietet.
: Das Python-Paket Bokeh ist eine Datenvisualisierungsbibliothek, die eine einfache und interaktive Möglichkeit bietet, webbasierte Visualisierungen für moderne Browser zu erstellen.
: Das Python Holoviz-Paket ist eine Sammlung von Open-Source-Tools für die Datenvisualisierung und -exploration, mit denen Benutzer schnell interaktive Visualisierungen mit minimalem Code erstellen können.
: Das Python-Panel-Paket ist eine Bibliothek, mit der Benutzer auf einfache Weise interaktive webbasierte Dashboards und Anwendungen aus Python-Code erstellen können, wobei eine breite Palette von Datenquellen und Visualisierungswerkzeugen unterstützt wird.
: Blender ist ein vielseitiges und Open Source 3D-Computergrafik-Toolset, das Modellierung, Animation, Rendering, Compositing und vieles mehr unterstützt.
Hervorragende Java-Script-Bibliothek für Datenvisualisierung (genauer gesagt DOM-Manipulation). Vergleichsweise niedriges Niveau mit einer steilen Lernkurve.
: Machine Learning Playground ist ein Open-Source Projekt mit dem Ziel, Studenten und interessierten einen angeleiteten Einstieg in die komplexe Welt des maschinellen Lernens zu eröffnen.
: Eine Reihe von Jupyter-Notebooks, die durch die Grundlagen des maschinellen Lernens und des Deep Learning in Python mit Scikit-Learn, Keras und TensorFlow 2 führen.
: Eine gut nachzuvollziehender "Towards Data Science"-Artikel zur Einführung in das Arbeiten mit R
: Seeing Theory ist eine interaktive Online-Ressource, die einen intuitiven und visuellen Ansatz zum Verständnis komplexer Wahrscheinlichkeits- und Statistikkonzepte bietet.
: Distill ist eine Open-Access-Online-Publikationsplattform, die den Schwerpunkt auf klare, interaktive und visuell ansprechende Artikel legt, um Forschungsergebnisse und Konzepte in verschiedenen akademischen Disziplinen effektiv zu vermitteln.
: Colah ist der blog eines prominenten Forschers und Bloggers auf dem Gebiet der künstlichen Intelligenz, der für seine aufschlussreichen und verständlichen Texte über Deep Learning und neuronale Netze bekannt ist.
: Kaggle ist eine Online-Plattform und -Gemeinschaft, die Wettbewerbe zum maschinellen Lernen, Datensätze und Notebooks bereitstellt, die Zusammenarbeit fördert und es Datenwissenschaftlern und Enthusiasten des maschinellen Lernens ermöglicht, zu üben, zu lernen und ihre Fähigkeiten zu präsentieren.
Diverse zitierbare color maps designed für unterschiedliche wissenschaftliche Visualisierungs-Anwendungen zum Download.
präsentiert und unterstützt die Veröffentlichung von Daten, Forschungsergebnissen und Open-Source-Tools, die Data Science und KI zur Charakterisierung, Überwachung und/oder Modellierung einer Vielzahl von Umweltsystemen nutzen.