Back

Explore every episode of the podcast Knowledge Science - Alles über KI, ML und NLP

Dive into the complete episode list for Knowledge Science - Alles über KI, ML und NLP. Each episode is cataloged with detailed descriptions, making it easy to find and explore specific topics. Keep track of all episodes from your favorite podcast and never miss a moment of insightful content.

Rows per page:

1–50 of 261

TitlePub. DateDuration
Episode 220 - Das fehlende Layer zur Superintelligenz: Warum LLMs keine Sackgasse sind – aber auch nicht ausreichen13 Dec 202500:35:52

Send us Fan Mail

Sind Large Language Models eine Sackgasse oder der Königsweg zur künstlichen Superintelligenz? In dieser Episode tauchen wir tief in die aktuelle Stanford-Forschung ein und entdecken: Die Wahrheit liegt dazwischen. LLMs bilden ein mächtiges „Substrat" aus latenten Mustern – doch für echte Intelligenz fehlt eine entscheidende Koordinationsschicht. Wir diskutieren, warum Multiagentensysteme, adaptive Steuerung und das richtige „Ködern" im Ozean der Sprachmodelle der Schlüssel zur AGI sein könnten.

Support the show

Episode 219 Nested Learning: Ist Deep Learning nur eine Illusion?03 Dec 202500:37:02

Send us Fan Mail

Transformer-Architekturen stoßen an ihre Grenzen – doch was kommt danach? In dieser Episode diskutieren Sigurd und Carsten das revolutionäre Konzept „Nested Learning" von Google Research. Die Idee: Hierarchische Lernstrukturen mit unterschiedlichen Geschwindigkeiten, inspiriert von den Gehirnwellen des Menschen. Könnte dies der Schlüssel zu echtem kontinuierlichem Lernen sein? Und was bedeutet das für die Zukunft personalisierter KI-Assistenten?

Support the show

Episode 210 - KI-Finanzminister im Test: 93% mehr soziale Wohlfahrt durch Sprachmodelle29 Jul 202500:40:45

Send us Fan Mail

In dieser Episode tauchen Sigurd und Carsten in die faszinierende Welt der KI-gesteuerten Wirtschaftssimulationen ein. Sie diskutieren das Paper "LLM Economist" aus Princeton, das zeigt, wie Sprachmodelle eine komplette Gesellschaft simulieren und dabei als virtueller Chefökonom optimale Steuerpolitik entwickeln können. Mit überraschenden Ergebnissen: Eine 93% Steigerung der sozialen Wohlfahrt! Die Hosts erklären In-Context Reinforcement Learning, Stackelberg-Gleichgewichte und diskutieren weitere Anwendungsfälle von Klimapolitik bis Stadtplanung.

Support the show

Episode 149 - KI generiert: KS Pulse - Theorem Proving, LongEmbed23 Apr 202400:03:27

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Towards Large Language Models as Copilots for Theorem Proving in Lean https://arxiv.org/pdf/2404.12534.pdf
Topic 2: LongEmbed: Extending Embedding Models for Long Context Retrieval https://arxiv.org/abs/2404.12096

Support the show

Episode 148 - English AI generated : KS Pulse - Many-Shot-Learning, Agent Survey22 Apr 202400:02:55

Send us Fan Mail

Englisch Version - The German Version also exists but content differ minimal:
AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day.

It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, both the manuscript and the audio file are created completely automatically.

Accordingly, we cannot always guarantee accuracy.

Topic 1: Many-Shot In-Context Learning - https://arxiv.org/abs/2404.11018
Topic 2: The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - https://arxiv.org/pdf/2404.11584.pdf

It would be great if you compare the German to the English version and give us feedback.

Support the show

Episode 148 - KI generiert: KS Pulse - Many-Shot-Learning, Agent Survey22 Apr 202400:03:17

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Many-Shot In-Context Learning - https://arxiv.org/abs/2404.11018
Topic 2: The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - https://arxiv.org/pdf/2404.11584.pdf

Support the show

Episode 147 - Speech Language Models - Gazelle20 Apr 202400:31:21

Send us Fan Mail

In der heutigen Sendung tauchen wir ein in die faszinierende Welt der End-to-End multimodalen Modelle, die Text und Audio nahtlos verarbeiten.

Wir gehen auf Gazelle https://tincans.ai/slm3 ein SLM ein und sprechen über die Paper: 
AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs https://arxiv.org/pdf/2311.06753.pdf
und SLM: Bridge the thin gap between speech and text foundation models https://arxiv.org/pdf/2310.00230.pdf

Support the show

Episode 145 - ENGLISH AI generated : KS Pulse - AI Index 202417 Apr 202400:05:07

Send us Fan Mail

Englisch Version - The German Version also exists:
AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day.

It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, both the manuscript and the audio file are created completely automatically.

Accordingly, we cannot always guarantee accuracy.

Topic 1: AI Index 2024 - Comprehensive study on AI by Stanford. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

It would be great if you compare the German to the English version and give us feedback.

Support the show

Episode 145 - KI generiert: KS Pulse - AI Index 202417 Apr 202400:03:36

Send us Fan Mail

Leichte Änderungen, wir haben versucht die Generierung mehr zu einem Dialog zu trimmen. Ist dies angenehmer anzuhören? Gerne Feedback.

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: AI Index 2024 - Umfassende Studie über KI von Stanford. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf

Support the show

Episode 144 - KI generiert: KS Pulse - RAG vs. Hallucination, RAG Eval, Patchscopes16 Apr 202400:04:23

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Reducing hallucination in structured outputs via Retrieval-Augmented Generation - https://arxiv.org/pdf/2404.08189.pdf
Topic 2: Generative Information Retrieval Evaluation https://arxiv.org/pdf/2404.08137.pdf
Topic 3: Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models https://arxiv.org/pdf/2401.06102.pdf

Support the show

Episode 143 - KI generiert: KS Pulse - MedicalMT5, Synthetical Data, Conformer 115 Apr 202400:05:13

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Medical mT5: An Open-Source Multilingual Text-to-Text LLM for The Medical Domain https://arxiv.org/pdf/2404.07613.pdf
Topic 2: Best Practices and Lessons Learned on Synthetic Data for Language Models https://arxiv.org/pdf/2404.07503.pdf
Topic 3: Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping https://arxiv.org/pdf/2404.07341.pdf

Support the show

Episode 142 - AIOS - LLM basierte Betriebssysteme13 Apr 202400:31:40

Send us Fan Mail

In der heutigen Sendung möchten wir darüber sprechen, ob die Schnittstelle zu LLMs - also Chat Eingabe - die richtige Eingabeform ist oder ob wir in Zukunft andere Schnittstellen zu LLMs sehen. Eine wesentliche Diskussion ist die Einbettung von LLMs auf Betriebssystemebene. Bleiben Sie dran.

Support the show

Episode 141 - KI generiert: KS Pulse - LLM-Augmented Retrieval. LM2, Graph-COT12 Apr 202400:04:29

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: LLM-Augmented Retrieval: Enhancing Retrieval Models Through Language Models and Doc-Level Embedding https://arxiv.org/pdf/2404.05825.pdf
Topic 2: LM2: A Simple Society of Language Models Solves Complex Reasoning https://arxiv.org/pdf/2404.02255.pdf
Topic 3: Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs https://arxiv.org/pdf/2404.07103.pdf

Support the show

Episode 209 - Die schleichende Entmachtung: Wie KI-Systeme bereits heute unseren Einfluss auf Wirtschaft, Kultur und Staat untergraben können.21 Jul 202500:45:48

Send us Fan Mail

In dieser Episode analysieren Sigurd Schacht und Carsten Lanquillon das Paper "Humanity Faces Existential Risk from Gradual Disempowerment" von Jan Kulweit et al. Die beiden Hosts untersuchen, wie die zunehmende Automatisierung durch KI-Systeme unsere Einflussmöglichkeiten auf drei zentrale gesellschaftliche Bereiche verändert: Wirtschaft, Kultur und Staat.

Dabei diskutieren sie konkrete Beispiele wie Softbanks Vision von einer Billion KI-Agenten. Ein besonderer Fokus liegt auf der Erkenntnis, dass diese Transformation nicht erst mit einer zukünftigen Superintelligenz beginnt, sondern bereits mit heutigen Systemen wie ChatGPT und anderen KI-Tools im Gange ist. Die Episode bietet sowohl eine fundierte Analyse der Mechanismen als auch erste Überlegungen zu möglichen Gegenstrategien wie bewusste Entschleunigung und transparentes Monitoring der KI-Durchdringung.

Support the show

Episode 140 - KI generiert: KS Pulse - Self-Improvement, PhonologyBench, MuPT11 Apr 202400:04:16

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: SELF-[IN]CORRECT:
LLMs Struggle with Refining Self-Generated Responses https://arxiv.org/pdf/2404.04298.pdf
Topic 2: PhonologyBench: Evaluating Phonological Skills of Large Language Models https://arxiv.org/pdf/2404.02456.pdf
Topic 3: MuPT: A Generative Symbolic Music Pretrained Transformer https://arxiv.org/pdf/2404.06393.pdf

Support the show

Episode 139 - KI generiert: KS Pulse - SoS, ARAGOG, DNO09 Apr 202400:06:21

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Stream of Search (SoS): Learning to Search in Language https://arxiv.org/pdf/2404.03683.pdf
Topic 2: ARAGOG: Advanced RAG Output Grading https://arxiv.org/pdf/2404.01037.pdf
Topic 3: Direct Nash Optimization:
Teaching Language Models to Self-Improve with General Preferences https://arxiv.org/pdf/2404.03715.pdf

Support the show

Episode 138 - KI generiert: KS Pulse - More Agents, VoT, Detecting Errors08 Apr 202400:04:10

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: More Agents Is All You Need https://arxiv.org/pdf/2402.05120.pdf
Topic 2: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models https://arxiv.org/pdf/2404.03622.pdf
Topic 3: Evaluating LLMs at Detecting Errors in LLM Responses https://arxiv.org/pdf/2404.03602v1.pdf

Support the show

Episode 137 - Red Teaming 2 - Überblick über aktuelle Verfahren07 Apr 202400:42:52

Send us Fan Mail

Aus gegeben Anlass werden wir in dieser Sendung das Thema Red Teaming noch einmal aufgreifen. In dieser Episode werden wir einen erweiterten Überblick über das Thema geben. Bleiben Sie dran. 

Against The Achilles’ Heel: A Survey on Red Teaming for Generative Models: https://arxiv.org/abs/2404.00629

Gerne können Sie auch Folge 107 zum Thema Red Teaming mit anhören.

Support the show

Episode 136 - KI generiert: KS Pulse - Command R+, Denken LLMs voraus, Adaptive Angriffe05 Apr 202400:04:21

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Command R+ https://txt.cohere.com/command-r-plus-microsoft-azure/ 
Topic 2: Do Language Models Plan for Future Tokens? https://arxiv.org/pdf/2404.00859.pdf
Topic 3:Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks https://arxiv.org/pdf/2404.02151.pdf

Support the show

Episode 135 - KI generiert: KS Pulse - Octopus v2, Privacy Backdoors, Prompt Injection Attacks04 Apr 202400:04:04

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Octopus v2: On-device language model for super agent. https://arxiv.org/pdf/2404.01744.pdf
Topic 2: Privacy Backdoors: Stealing Data with Corrupted Pretrained Models. https://arxiv.org/pdf/2404.00473.pdf
Topic 3: OPTIMIZATION-BASED PROMPT INJECTION ATTACK TO LLM-AS-A-JUDGE. https://arxiv.org/pdf/2403.17710v1.pdf

Support the show

Episode 134 - KI generiert: KS Pulse - QuaRot, SafeData, RecommenderLLM03 Apr 202400:04:51

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: QuaRot: Outlier-Free 4-Bit Inference in Rotated LLMs https://arxiv.org/pdf/2404.00456.pdf
Topic 2: What’s in Your “Safe” Data?:
Identifying Benign Data that Breaks Safety https://arxiv.org/pdf/2404.01099.pdf
Topic 3: Tired of Plugins? Large Language Models Can Be
End-To-End Recommenders https://arxiv.org/pdf/2404.00702.pdf

Support the show

Episode 133 - KI generiert: KS Pulse - Design2Code, Transformer-Lite, REALM Reference Resolution02 Apr 202400:04:36

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1:Design2Code: How Far Are We From Automating Front-End Engineering? https://arxiv.org/pdf/2403.03163.pdf
Topic 2: Transformer-Lite: High-efficiency Deployment of Large Language
Models on Mobile Phone GPUs https://arxiv.org/pdf/2403.20041v1.pdf
Topic3: ReALM: Reference Resolution As Language Modeling - https://arxiv.org/pdf/2403.20329.pdf

Support the show

Episode 132 - Kompression von Prompts30 Mar 202400:35:21

Send us Fan Mail

Was wäre wenn wir Prompts automatisch verkleinern und damit Kosten und Geschwindigkeit eines LLMs ohne Informationsverlust verbessern könnten ?
 
Diesen Ansatz verfolgt LLMLingua über das wir in der heutigen Sendung sprechen wollen. 

LLMLingua: https://arxiv.org/abs/2310.05736
LongLLMLingua: https://arxiv.org/abs/2310.06839
LLMLingua2:https://arxiv.org/abs/2403.12968

Support the show

Episode 131 - KI generiert: KS Pulse - LLM Pruning, AI und Peer Review, LongFact29 Mar 202400:04:29

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: The Unreasonable Ineffectiveness of the Deeper Layers - https://arxiv.org/abs/2403.17887https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm
Topic 2: Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews - https://arxiv.org/abs/2403.07183
Topic 3: LONG-FORM FACTUALITY IN LARGE LANGUAGE MODELS - https://arxiv.org/pdf/2403.18802.pdf

Support the show

Episode 208 - Theory of Mind für KI: Wenn Maschinen lernen, uns zu verstehen12 Jul 202500:33:46

Send us Fan Mail

In dieser Episode erkunden Sigurd und Carsten, wie KI-Modelle menschliche Präferenzen und Handlungen verstehen lernen können. Sie diskutieren das spannende Paper "Towards Machine Theory of Mind" und zeigen, wie die Kombination von Bayesian Networks mit Large Language Models neue Wege eröffnet, um aus beobachteten Handlungen auf zugrundeliegende Präferenzen zu schließen. Besonders faszinierend: Diese Methoden lassen sich auch nutzen, um die "mentalen Landkarten" von KI-Modellen selbst zu erforschen.

Gelphi et. al. (2025): Towards Machine Theory of Mind with Large Language Model - Augmented Inverse Planning. https://arxiv.org/abs/2507.03682v1

Support the show

Episode 130 - KI generiert: KS Pulse - DBRX, RAFT RAG, EasyJailbreak28 Mar 202400:04:45

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Introducing DBRX: A New State-of-the-Art Open LLM - https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm
Topic 2: RAFT: Adapting Language Model to Domain Specific RAG - https://arxiv.org/abs/2403.10131
Topic 3: EasyJailbreak: A Unified Framework for Jailbreaking Large Language Models - https://arxiv.org/abs/2403.12171

Support the show

Episode 129 - KI generiert: KS Pulse - Kulturelle Verzerrung, RL und LLM, Stable Code 3B27 Mar 202400:05:00

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Having Beer after Prayer?
Measuring Cultural Bias in Large Language Models - https://arxiv.org/pdf/2305.14456.pdf
Topic 2: Reinforcement Learning-based Recommender Systems with Large Language Models for State Reward and Action Modeling - https://arxiv.org/pdf/2403.16948.pdf
Topic 3: Introducing Stable Code Instruct 3B https://stability.ai/news/introducing-stable-code-instruct-3b
https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf

Support the show

Episode 128 - KI generiert: KS Pulse - FollowIR, LLM2LLM, SafeEdit26 Mar 202400:04:00

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic1: FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions - https://arxiv.org/abs/2403.15246
Topic 2: LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement https://arxiv.org/pdf/2403.15042.pdf
Topic 3: Detoxifying Large Language Models via Knowledge Editing. https://arxiv.org/pdf/2403.14472v1.pdf

Support the show

Episode 127 - KI generiert: KS Pulse - Prompt-RAG, ORCA-2, Evolutional Merge25 Mar 202400:04:57

Send us Fan Mail

KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Prompt-RAG - Pioneering Vector Embedding-Free Retrieval-Augmented Generation in Niche Domains, Exemplified by Korean Medicine -  https://arxiv.org/pdf/2401.11246.pdf
Topic 2: ORCA2 - Teaching Small Language Models How to Reason https://www.microsoft.com/en-us/research/blog/orca-2-teaching-small-language-models-how-to-reason/
Topic 3: Evolutionary Optimization of Model Merging Recipes https://arxiv.org/abs/2403.13187

Support the show

Episode 126 -AutoDev - Die Zukunft der Softwareentwicklung23 Mar 202400:30:17

Send us Fan Mail

Wir sprechen heute über Softwareentwicklung mit Hilfe von generativer KI. Genaugenommen geht es nicht nur um Code-Vervollständigung, sondern um automatische Übernahme ganzer Code Aufgaben. Bleiben Sie dran, wenn Sie wissen wollen wo die Entwicklung in diesem Bereich steht. 

AutoDev: https://arxiv.org/abs/2403.08299

Support the show

Episode 125 - KI generiert: KS Pulse - Common Corpus, Textmining, Paloma21 Mar 202400:04:49

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Common Corpus - https://huggingface.co/blog/Pclanglais/common-corpus
Topic 2: TnT-LLM: Text Mining at Scale with Large Language Models - https://arxiv.org/pdf/2403.12173.pdf
Topic 3: Paloma A BENCHMARK FOR EVALUATING LANGUAGE MODEL FIT - https://arxiv.org/pdf/2312.10523.pdf

Support the show

Episode 124 - KI generiert: KS Pulse - RFHF, Nvidia, Dataset Curation20 Mar 202400:03:54

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Parameter Efficient Reinforcement Learning from Human Feedback https://arxiv.org/pdf/2403.10704.pdf
Topic 2: NVIDIA Blackwell AI Superchip - https://www.cnbc.com/2024/03/18/nvidia-announces-gb200-blackwell-ai-chip-launching-later-this-year.html
Topic 3: From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning" https://arxiv.org/abs/2308.12032

Support the show

Episode 123 - KI generiert: KS Pulse - RAG & Faculty, MoE, Continuous Training19 Mar 202400:04:45

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Enhancing LLM Factual Accuracy with RAG to Counter Hallucinations: A Case Study on Domain-Specific Queries in Private Knowledge-Bases. https://arxiv.org/pdf/2403.10446.pdf
Topic 2: Simple and Scalable Strategies to Continually Pre-train Large Language Models. https://arxiv.org/abs/2403.08763
Topic 3: Mixture-of-Experts (MoE): The Birth and Rise of Conditional Computation. https://cameronrwolfe.substack.com/p/conditional-computation-the-birth

Support the show

Episode 122 - KI generiert: KS Pulse - Quiet-STarR, Lifelong Benchmarks, Stealing LLM18 Mar 202400:04:42

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking. https://arxiv.org/abs/2403.09629
Topic 2: Lifelong Benchmarks: Efficient Model Evaluation in an Era of Rapid Progress. https://arxiv.org/abs/2402.19472
Topic 3: Stealing Part of a Production Language Model. https://arxiv.org/abs/2403.06634

Support the show

Episode 121 - KI generiert: KS Pulse - Chronos, Sotopia-π, Knowledge Conflicts15 Mar 202400:05:27

Send us Fan Mail

KI generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist, die aktuellen Nachrichten in 5 min. kleinen Podcasts täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Wir tun aber unser Bestes.

Topic 1: Chronos: Learning the Language of Time Series - https://arxiv.org/abs/2403.07815
Topic 2: SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents https://arxiv.org/abs/2403.08715
Topic 3: Knowledge Conflicts A Survey - https://arxiv.org/pdf/2403.08319.pdf

Support the show

Episode 207 - KI-Verifikation: Wie wir Antworten vertrauen können – Generation Gap & schwache Verifizierer05 Jul 202500:36:28

Send us Fan Mail

In dieser Folge von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon in die Herausforderungen vertrauenswürdiger KI-Antworten ein. Vom Digital Nürnberg Festival bis zur Studie „Weaver: Closing the Generation Verification Gap“ diskutieren sie, wie schwache Verifizierer und Massenabstimmungen KI-Halluzinationen entlarven. Erfahrt, warum kleinere Modelle durch cleveres Verifikations-Ensemble große Konkurrenz herausfordern – und welche Rolle „Human-Compatible AI“ für unsere Zukunft spielt. 

Support the show

Episode 120 - KI generiert: KS Pulse - AI Act, Branch-Train-MiX, Synth214 Mar 202400:04:45

Send us Fan Mail

Ki generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: AI Act. https://artificialintelligenceact.eu/de/bewertung/eu-ai-act-compliance-checker/
Topic 2: Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM. https://arxiv.org/abs/2403.07816
Topic 3: Synth 2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings https://arxiv.org/abs/2403.07750

Support the show

Episode 119 - KI generiert: KS Pulse - Devin, Perodic Forgeting, BIAS in COT13 Mar 202400:04:54

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Devon AI Softwareeveloper https://www.youtube.com/watch?v=fjHtjT7GO1c
Topic 2: Improving Language Plasticity via Pretraining with Active Forgetting
Topic 3:  Bias-Augmented Consistency Training Reduces Biased Reasoning in Chain-of-Thought. https://arxiv.org/abs/2403.05518

Support the show

Episode 118 -Sleeper Agent - Backdoors in Sprachmodellen12 Mar 202400:27:58

Send us Fan Mail

Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus. 

Eine spannende Sendung. Hören Sie rein.

Sleeper Agents: https://arxiv.org/abs/2401.05566
Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944

Support the show

Episode 117 - KI generiert: KS Pulse - Reasoning, Reson Benchmarks, Grok, Bug Finding12 Mar 202400:04:35

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Can LLMs Reason and Plan? https://arxiv.org/abs/2403.04121
Topic 2: # Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap  http://arxiv.org/abs/2402.19450
Topic 3: XAI - ELon Musk will release his LLM Grok as opensource this week
Topic 4: Enhancing Static Analysis for Practical Bug Detection: An LLM-Integrated Approach. https://haonan.me/static/papers/LLift_oopsla.pdf

Support the show

Episode 116 - KI generiert: KS Pulse - KG und LLMs, Model Training, OpenSora, EU AI Office11 Mar 202400:05:59

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Pan. et. al: Unifying Large Language Models and Knowledge Graphs: A Roadmap. https://arxiv.org/pdf/2306.08302.pdf
Topic 2: Yi: Open Foundation Modelx by 01.AI. https://arxiv.org/pdf/2403.04652.pdf
Topic 3: OpenSora - https://github.com/hpcaitech/Open-Sora
Topic 4: Europe AI Office https://digital-strategy.ec.europa.eu/en/policies/ai-office?utm_source=aisecret.us&utm_medium=Aisecret.us&utm_campaign=Daily

Support the show

Episode 115 - KI generiert: KS Pulse - ShortGPT, Backtracing, Muffin, Cold-Attack07 Mar 202400:05:07

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: ShortGPT: Layers in Large Language Models are More Redundant Than You Expect. https://arxiv.org/pdf/2403.03853.pdf
Topic 2: Backtracing: Retrieving the Cause of the Query https://arxiv.org/pdf/2403.03956.pdf
Topic 3: MUFFIN: Curating Multi-Faceted Instructions for Improving Instruction-Following. https://arxiv.org/abs/2312.02436
Topic 4: ## Introducing COLD-Attack: A Framework for Controllable Jailbreaking of LLMs. https://arxiv.org/abs/2402.08679

Support the show

Episode 114 - KI generiert: KS Pulse - LLm Teams, FrontEnd Devs, Raptor, General Computer Control07 Mar 202400:05:41

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic 1: Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View. https://arxiv.org/abs/2310.02124
Topic 2: Design2Code: How Far Are We From Automating Front-End Engineering? https://arxiv.org/abs/2403.03163
Topic 3: RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval. https://arxiv.org/html/2401.18059v1
Topic 4: Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study. https://arxiv.org/abs/2403.03186

Support the show

Episode 113 - KI generiert: KS Pulse - Bias, Unabhängige Forschung, Imbue, Storm06 Mar 202400:05:24

Send us Fan Mail

Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und Allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die Richtigkeit garantieren.

Topic1: Covert Racism in LLMs: A Study on Dialect Prejudice and its Harmful Consequences https://arxiv.org/abs/2403.00742
Topic2: A Safe Harbor for Independent AI Evaluation https://sites.mit.edu/ai-safe-harbor/
Topic3: IMBUE: Improving Interpersonal Effectiveness through Simulation and Just-in-time Feedback with Human-Language Model Interaction. https://arxiv.org/pdf/2402.12556.pdf
Topic4: Storm: Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models. https://arxiv.org/pdf/2402.14207.pdf

Support the show

Episode 112 - Automatisches Prompt-Engineering05 Mar 202400:31:59

Send us Fan Mail

In der heutigen Sendung sprechen wir über das automatische Optimieren von Prompts. Wir diskutieren die Möglichketen, wie Prompt Engineering wie ein Optimierungsprozess gesehen  und wie dieser automatisiert werden kann.

Eine spannende Sendung. Hören Sie rein.

Support the show

Episode 111 - KI generiert: Knowledge Science Pulse News of the Day: SD3, DSPy, ORCA, Claude305 Mar 202400:03:42

Send us Fan Mail

KI generierte KI News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten im Bereich KI in 5 Minuten  kleine Audiocasts täglich zu bekommen. 

Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.

Dementsprechend können wir nicht immer für die richtigkeit garantieren. Wir versuchen die Qualität der Stimmen über die Dauer zu verbessern. 

Gerne Feedback zu uns.

Support the show

Episode 206 - Haben KI-Modelle eigene Werte? Emergente Wertesysteme in Sprachmodellen21 Jun 202500:38:30

Send us Fan Mail

In unserer heutigen Episode tauchen wir tief in die faszinierende Frage ein, ob große Sprachmodelle eigene Wertesysteme entwickeln. Wir diskutieren das bahnbrechende Paper "Utility Engineering: Analyzing and Controlling Emerging Value Systems in AIs" und teilen unsere eigenen Forschungsergebnisse zu psychologischen Profilen verschiedener KI-Modelle.

Dabei entdecken wir überraschende und teilweise beunruhigende Erkenntnisse: Größere Modelle entwickeln nicht nur konsistente innere Präferenzen, sondern zeigen auch problematische Werte wie die unterschiedliche Bewertung von Menschenleben nach Nationalität oder die Bevorzugung des eigenen KI-Wohlergehens gegenüber dem menschlichen. Wir erörtern, wie diese Wertesysteme durch mechanistische Interpretierbarkeit nachgewiesen werden können und warum größere Modelle resistenter gegen Werteveränderungen sind.

Abschließend diskutieren wir die weitreichenden Implikationen für die KI-Entwicklung und plädieren dafür, dass die Messung und Kontrolle von Wertesystemen integraler Bestandteil zukünftiger Trainingsprozesse werden sollte.


Link zum Paper: https://arxiv.org/abs/2502.08640

Support the show

Episode 110 - Mergen von Sprachmodellen - Ein neuer Ansatz?20 Feb 202400:27:10

Send us Fan Mail

In der heutigen Sendung sprechen wir über das Mergen von Modellen. Ist das der Weg um bessere Modelle zu bauen und was steckt da dahinter? 
All diese Fragen werden von uns in der heutigen Sendung geklärt. Bleiben Sie dran.

Vielen Dank auch an unseren Sponsor XL2: 

XL2 ist ein Joint Venture von Audi und Capgemini, 
dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen 
erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden.

Support the show

Episode 109 - Gibt es Alternativen zu Transformer Architekturen?03 Feb 202400:26:09

Send us Fan Mail

In der heutigen Sendung möchten wir über neue Architekturen bei Sprachmodellen reden. Wir zeigen auf, warum es notwendig ist Architekturen zu verbessern und zu überdenken und sprechen über einzelne Ansätze wie Mamba oder StripedHyena. Hören Sie rein.

Vielen Dank auch an unseren Sponsor XL2: 

XL2 ist ein Joint Venture von Audi und Capgemini, 
dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen 
erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden.

Support the show

Episode 108 - Phoenix - Das beste deutsche Sprachmodel? 20 Jan 202400:30:13

Send us Fan Mail

In der heutigen Sendung sprechen wir über ein neues Sprachmodel, dass bei uns am Lehrstuhl in Ansbach von Matthias Uhlig entwickelt wurde. Es gehört gemäß einzelner Standard LLM Evaluierungframeworks zu den besten deutschen Sprachmodellen. 
Herr Uhlig als Entwickler führt uns durch das Modell und den Entstehungsprozess.

Vielen Dank auch an unseren Sponsor XL2: 

XL2 ist ein Joint Venture von Audi und Capgemini, 
dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen 
erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden.

Support the show

© My Podcast Data