EN

RAG - Kleiner Hackathon

Datum:
19.09.2025, 10:00-13:00 Uhr

Ort:
UL 6, Raum 3053

Sprache:
Deutsch

Organisiert durch:
IZ D2MCM + CMS

Anmeldung:
iz-d2mcm.contact@hu-berlin.de

Kontakt:
iz-d2mcm.contact@hu-berlin.de


iCal-Download

RAG in der Anwendung: Mini-Hackathon

Wie setze ich Retrieval Augmented Generation (RAG) für meine Aufgaben ein?

In der modernen KI-Welt sind Large Language Models (LLMs) zu einem unverzichtbaren Werkzeug geworden. Doch trotz ihrer beeindruckenden Fähigkeiten stoßen sie an Grenzen, wenn es um die Verarbeitung von Faktenwissen und spezifischen Daten geht. Hier kommt Retrieval-Augmented Generation (RAG) ins Spiel. RAG kombiniert die Stärken von Retrieval-Systemen und generativen Modellen, um präzisere, faktenbasierte und kontextbezogene Antworten zu liefern. Dieser Workshop führt Sie in die Grundlagen von RAG ein und zeigt Ihnen, wie Sie diese Technologie in der Praxis einsetzen können.

Was ist RAG? RAG ist eine Methode, die LLMs durch die Integration externer Datenquellen erweitert. Während herkömmliche LLMs auf ihrem trainierten Wissen basieren, das bis zum Zeitpunkt des Trainings reicht, ermöglicht RAG den Zugriff auf aktuelle und spezifische Informationen. Dies geschieht durch die Kombination von zwei Hauptkomponenten:

  • Retrieval-System: Dieses System durchsucht eine Datenbank oder eine Sammlung von Dokumenten, um relevante Informationen zu finden.
  • Generatives Modell: Das generative Modell nutzt die abgerufenen Informationen, um eine natürliche und präzise Antwort zu generieren.

Durch diese Kombination können LLMs Antworten liefern, die nicht nur grammatikalisch korrekt, sondern auch faktenbasiert und überprüfbar sind – sowohl im Rahmen eines Chatbots als auch für erweiterte Suche. Nach einer Begrüßung und einer kurzen Einführung in den technischen Hintergrund wollen wir mehr als zwei Stunden in Gruppen zu unseren eigenen Anwendungsszenarien Prototypen bauen. Alle Teilnehmenden bringen mit:

  • eigene Idee für den Einsatz von RAG
  • Testdaten in einer HU-Box in den Formaten Markdown, PDF, CSV, Word, Excel, PPT, JPG
  • Rechner, Zugang zu HU VPN
  • Freude am Experimentieren

Ziel des Mini-Hackathons: Alle Teilnehmenden erstellen ihren eigenen kleinen Bot!

Anmeldung bis zum 10.09.2025 an iz-d2mcm.contact@hu-berlin.de.

Programm

Zeit Programmpunkt
10:00-10:15 Begrüßung und Einführung
10:15-10:30 Technischer Hintergrund
10:30-12:30 Hackathon in Gruppen
12:30-13:00 Vorstellung der Prototypen & Diskussion: Basisdienste vs. Forschungssoftware. Wo liegen jeweils die Vor- und Nachteile im Einsatz?

Informationen zum Dozenten/Dozentin

Dozent des Workshops: Malte Dreyer. © Malte Dreyer

Malte Dreyer ist Direktor des Computer- und Medienservice der Humboldt-Universität zu Berlin und Vorsitzender des IT-Boards sowie der Steuerungsgruppe Informationsprozesse (CIO-Gremium) der HU. Er engagiert sich in zahlreichen Projekten zur Weiterentwicklung des Forschungsdatenmanagements und zum Einsatz von Methoden der Künstlichen Intelligenz in Lehre und Lernen. Zuvor war er Direktor der Forschungs- und Entwicklungsabteilung der Max-Planck-Gesellschaft, Max Planck Digital Library. Er konzipierte und entwickelte die Forschungs- und Publikationsdateninfrastruktur für die Institute der Max-Planck-Gesellschaft sowie verschiedene Forschungswerkzeuge. Im Rahmen mehrerer großer deutscher, europäischer und internationaler Projekte war er in den Bereichen digitale Forschungsinfrastrukturen, Repositorien, virtuelle Forschungsumgebungen und Softwarearchitekturen in vielen wissenschaftlichen Disziplinen tätig. Darüber hinaus ist er Mitglied in mehreren nationalen und internationalen Gremien wie der HRK-Kommission für Digitalisierung, der Allianz Focus Group “Digital Infrastructures, Services and Data Tracking” und der US-amerikanischen CIO-Vereinigung LBCIO.