Podcast Knowledge Science - Alles über KI, ML und NLP par Sigurd Schacht, Carsten Lanquillon Épisodes

Explorez tous les épisodes du podcast Knowledge Science - Alles über KI, ML und NLP

Plongez dans la liste complète des épisodes de Knowledge Science - Alles über KI, ML und NLP. Chaque épisode est catalogué accompagné de descriptions détaillées, ce qui facilite la recherche et l'exploration de sujets spécifiques. Suivez tous les épisodes de votre podcast préféré et ne manquez aucun contenu pertinent.

	Titre	Date	Durée
	Episode 220 - Das fehlende Layer zur Superintelligenz: Warum LLMs keine Sackgasse sind – aber auch nicht ausreichen	13 Dec 2025	00:35:52
Send us Fan Mail Sind Large Language Models eine Sackgasse oder der Königsweg zur künstlichen Superintelligenz? In dieser Episode tauchen wir tief in die aktuelle Stanford-Forschung ein und entdecken: Die Wahrheit liegt dazwischen. LLMs bilden ein mächtiges „Substrat" aus latenten Mustern – doch für echte Intelligenz fehlt eine entscheidende Koordinationsschicht. Wir diskutieren, warum Multiagentensysteme, adaptive Steuerung und das richtige „Ködern" im Ozean der Sprachmodelle der Schlüssel zur AGI sein könnten. Support the show
	Episode 219 Nested Learning: Ist Deep Learning nur eine Illusion?	03 Dec 2025	00:37:02
Send us Fan Mail Transformer-Architekturen stoßen an ihre Grenzen – doch was kommt danach? In dieser Episode diskutieren Sigurd und Carsten das revolutionäre Konzept „Nested Learning" von Google Research. Die Idee: Hierarchische Lernstrukturen mit unterschiedlichen Geschwindigkeiten, inspiriert von den Gehirnwellen des Menschen. Könnte dies der Schlüssel zu echtem kontinuierlichem Lernen sein? Und was bedeutet das für die Zukunft personalisierter KI-Assistenten? Support the show
	Episode 210 - KI-Finanzminister im Test: 93% mehr soziale Wohlfahrt durch Sprachmodelle	29 Jul 2025	00:40:45
Send us Fan Mail In dieser Episode tauchen Sigurd und Carsten in die faszinierende Welt der KI-gesteuerten Wirtschaftssimulationen ein. Sie diskutieren das Paper "LLM Economist" aus Princeton, das zeigt, wie Sprachmodelle eine komplette Gesellschaft simulieren und dabei als virtueller Chefökonom optimale Steuerpolitik entwickeln können. Mit überraschenden Ergebnissen: Eine 93% Steigerung der sozialen Wohlfahrt! Die Hosts erklären In-Context Reinforcement Learning, Stackelberg-Gleichgewichte und diskutieren weitere Anwendungsfälle von Klimapolitik bis Stadtplanung. Support the show
	Episode 149 - KI generiert: KS Pulse - Theorem Proving, LongEmbed	23 Apr 2024	00:03:27
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Towards Large Language Models as Copilots for Theorem Proving in Lean https://arxiv.org/pdf/2404.12534.pdf Topic 2: LongEmbed: Extending Embedding Models for Long Context Retrieval https://arxiv.org/abs/2404.12096 Support the show
	Episode 148 - English AI generated : KS Pulse - Many-Shot-Learning, Agent Survey	22 Apr 2024	00:02:55
Send us Fan Mail Englisch Version - The German Version also exists but content differ minimal: AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day. It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, both the manuscript and the audio file are created completely automatically. Accordingly, we cannot always guarantee accuracy. Topic 1: Many-Shot In-Context Learning - https://arxiv.org/abs/2404.11018 Topic 2: The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - https://arxiv.org/pdf/2404.11584.pdf It would be great if you compare the German to the English version and give us feedback. Support the show
	Episode 148 - KI generiert: KS Pulse - Many-Shot-Learning, Agent Survey	22 Apr 2024	00:03:17
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Many-Shot In-Context Learning - https://arxiv.org/abs/2404.11018 Topic 2: The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - https://arxiv.org/pdf/2404.11584.pdf Support the show
	Episode 147 - Speech Language Models - Gazelle	20 Apr 2024	00:31:21
Send us Fan Mail In der heutigen Sendung tauchen wir ein in die faszinierende Welt der End-to-End multimodalen Modelle, die Text und Audio nahtlos verarbeiten. Wir gehen auf Gazelle https://tincans.ai/slm3 ein SLM ein und sprechen über die Paper: AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs https://arxiv.org/pdf/2311.06753.pdf und SLM: Bridge the thin gap between speech and text foundation models https://arxiv.org/pdf/2310.00230.pdf Support the show
	Episode 145 - ENGLISH AI generated : KS Pulse - AI Index 2024	17 Apr 2024	00:05:07
Send us Fan Mail Englisch Version - The German Version also exists: AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day. It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, both the manuscript and the audio file are created completely automatically. Accordingly, we cannot always guarantee accuracy. Topic 1: AI Index 2024 - Comprehensive study on AI by Stanford. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf It would be great if you compare the German to the English version and give us feedback. Support the show
	Episode 145 - KI generiert: KS Pulse - AI Index 2024	17 Apr 2024	00:03:36
Send us Fan Mail Leichte Änderungen, wir haben versucht die Generierung mehr zu einem Dialog zu trimmen. Ist dies angenehmer anzuhören? Gerne Feedback. KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: AI Index 2024 - Umfassende Studie über KI von Stanford. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf Support the show
	Episode 144 - KI generiert: KS Pulse - RAG vs. Hallucination, RAG Eval, Patchscopes	16 Apr 2024	00:04:23
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Reducing hallucination in structured outputs via Retrieval-Augmented Generation - https://arxiv.org/pdf/2404.08189.pdf Topic 2: Generative Information Retrieval Evaluation https://arxiv.org/pdf/2404.08137.pdf Topic 3: Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models https://arxiv.org/pdf/2401.06102.pdf Support the show
	Episode 143 - KI generiert: KS Pulse - MedicalMT5, Synthetical Data, Conformer 1	15 Apr 2024	00:05:13
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Medical mT5: An Open-Source Multilingual Text-to-Text LLM for The Medical Domain https://arxiv.org/pdf/2404.07613.pdf Topic 2: Best Practices and Lessons Learned on Synthetic Data for Language Models https://arxiv.org/pdf/2404.07503.pdf Topic 3: Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping https://arxiv.org/pdf/2404.07341.pdf Support the show
	Episode 142 - AIOS - LLM basierte Betriebssysteme	13 Apr 2024	00:31:40
Send us Fan Mail In der heutigen Sendung möchten wir darüber sprechen, ob die Schnittstelle zu LLMs - also Chat Eingabe - die richtige Eingabeform ist oder ob wir in Zukunft andere Schnittstellen zu LLMs sehen. Eine wesentliche Diskussion ist die Einbettung von LLMs auf Betriebssystemebene. Bleiben Sie dran. Support the show
	Episode 141 - KI generiert: KS Pulse - LLM-Augmented Retrieval. LM2, Graph-COT	12 Apr 2024	00:04:29
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: LLM-Augmented Retrieval: Enhancing Retrieval Models Through Language Models and Doc-Level Embedding https://arxiv.org/pdf/2404.05825.pdf Topic 2: LM2: A Simple Society of Language Models Solves Complex Reasoning https://arxiv.org/pdf/2404.02255.pdf Topic 3: Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs https://arxiv.org/pdf/2404.07103.pdf Support the show
	Episode 209 - Die schleichende Entmachtung: Wie KI-Systeme bereits heute unseren Einfluss auf Wirtschaft, Kultur und Staat untergraben können.	21 Jul 2025	00:45:48
Send us Fan Mail In dieser Episode analysieren Sigurd Schacht und Carsten Lanquillon das Paper "Humanity Faces Existential Risk from Gradual Disempowerment" von Jan Kulweit et al. Die beiden Hosts untersuchen, wie die zunehmende Automatisierung durch KI-Systeme unsere Einflussmöglichkeiten auf drei zentrale gesellschaftliche Bereiche verändert: Wirtschaft, Kultur und Staat. Dabei diskutieren sie konkrete Beispiele wie Softbanks Vision von einer Billion KI-Agenten. Ein besonderer Fokus liegt auf der Erkenntnis, dass diese Transformation nicht erst mit einer zukünftigen Superintelligenz beginnt, sondern bereits mit heutigen Systemen wie ChatGPT und anderen KI-Tools im Gange ist. Die Episode bietet sowohl eine fundierte Analyse der Mechanismen als auch erste Überlegungen zu möglichen Gegenstrategien wie bewusste Entschleunigung und transparentes Monitoring der KI-Durchdringung. Support the show
	Episode 140 - KI generiert: KS Pulse - Self-Improvement, PhonologyBench, MuPT	11 Apr 2024	00:04:16
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: SELF-[IN]CORRECT: LLMs Struggle with Refining Self-Generated Responses https://arxiv.org/pdf/2404.04298.pdf Topic 2: PhonologyBench: Evaluating Phonological Skills of Large Language Models https://arxiv.org/pdf/2404.02456.pdf Topic 3: MuPT: A Generative Symbolic Music Pretrained Transformer https://arxiv.org/pdf/2404.06393.pdf Support the show
	Episode 139 - KI generiert: KS Pulse - SoS, ARAGOG, DNO	09 Apr 2024	00:06:21
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Stream of Search (SoS): Learning to Search in Language https://arxiv.org/pdf/2404.03683.pdf Topic 2: ARAGOG: Advanced RAG Output Grading https://arxiv.org/pdf/2404.01037.pdf Topic 3: Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences https://arxiv.org/pdf/2404.03715.pdf Support the show
	Episode 138 - KI generiert: KS Pulse - More Agents, VoT, Detecting Errors	08 Apr 2024	00:04:10
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: More Agents Is All You Need https://arxiv.org/pdf/2402.05120.pdf Topic 2: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models https://arxiv.org/pdf/2404.03622.pdf Topic 3: Evaluating LLMs at Detecting Errors in LLM Responses https://arxiv.org/pdf/2404.03602v1.pdf Support the show
	Episode 137 - Red Teaming 2 - Überblick über aktuelle Verfahren	07 Apr 2024	00:42:52
Send us Fan Mail Aus gegeben Anlass werden wir in dieser Sendung das Thema Red Teaming noch einmal aufgreifen. In dieser Episode werden wir einen erweiterten Überblick über das Thema geben. Bleiben Sie dran. Against The Achilles’ Heel: A Survey on Red Teaming for Generative Models: https://arxiv.org/abs/2404.00629 Gerne können Sie auch Folge 107 zum Thema Red Teaming mit anhören. Support the show
	Episode 136 - KI generiert: KS Pulse - Command R+, Denken LLMs voraus, Adaptive Angriffe	05 Apr 2024	00:04:21
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Command R+ https://txt.cohere.com/command-r-plus-microsoft-azure/ Topic 2: Do Language Models Plan for Future Tokens? https://arxiv.org/pdf/2404.00859.pdf Topic 3:Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks https://arxiv.org/pdf/2404.02151.pdf Support the show
	Episode 135 - KI generiert: KS Pulse - Octopus v2, Privacy Backdoors, Prompt Injection Attacks	04 Apr 2024	00:04:04
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Octopus v2: On-device language model for super agent. https://arxiv.org/pdf/2404.01744.pdf Topic 2: Privacy Backdoors: Stealing Data with Corrupted Pretrained Models. https://arxiv.org/pdf/2404.00473.pdf Topic 3: OPTIMIZATION-BASED PROMPT INJECTION ATTACK TO LLM-AS-A-JUDGE. https://arxiv.org/pdf/2403.17710v1.pdf Support the show
	Episode 134 - KI generiert: KS Pulse - QuaRot, SafeData, RecommenderLLM	03 Apr 2024	00:04:51
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: QuaRot: Outlier-Free 4-Bit Inference in Rotated LLMs https://arxiv.org/pdf/2404.00456.pdf Topic 2: What’s in Your “Safe” Data?: Identifying Benign Data that Breaks Safety https://arxiv.org/pdf/2404.01099.pdf Topic 3: Tired of Plugins? Large Language Models Can Be End-To-End Recommenders https://arxiv.org/pdf/2404.00702.pdf Support the show
	Episode 133 - KI generiert: KS Pulse - Design2Code, Transformer-Lite, REALM Reference Resolution	02 Apr 2024	00:04:36
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1:Design2Code: How Far Are We From Automating Front-End Engineering? https://arxiv.org/pdf/2403.03163.pdf Topic 2: Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs https://arxiv.org/pdf/2403.20041v1.pdf Topic3: ReALM: Reference Resolution As Language Modeling - https://arxiv.org/pdf/2403.20329.pdf Support the show
	Episode 132 - Kompression von Prompts	30 Mar 2024	00:35:21
Send us Fan Mail Was wäre wenn wir Prompts automatisch verkleinern und damit Kosten und Geschwindigkeit eines LLMs ohne Informationsverlust verbessern könnten ? Diesen Ansatz verfolgt LLMLingua über das wir in der heutigen Sendung sprechen wollen. LLMLingua: https://arxiv.org/abs/2310.05736 LongLLMLingua: https://arxiv.org/abs/2310.06839 LLMLingua2:https://arxiv.org/abs/2403.12968 Support the show
	Episode 131 - KI generiert: KS Pulse - LLM Pruning, AI und Peer Review, LongFact	29 Mar 2024	00:04:29
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: The Unreasonable Ineffectiveness of the Deeper Layers - https://arxiv.org/abs/2403.17887https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm Topic 2: Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews - https://arxiv.org/abs/2403.07183 Topic 3: LONG-FORM FACTUALITY IN LARGE LANGUAGE MODELS - https://arxiv.org/pdf/2403.18802.pdf Support the show
	Episode 208 - Theory of Mind für KI: Wenn Maschinen lernen, uns zu verstehen	12 Jul 2025	00:33:46
Send us Fan Mail In dieser Episode erkunden Sigurd und Carsten, wie KI-Modelle menschliche Präferenzen und Handlungen verstehen lernen können. Sie diskutieren das spannende Paper "Towards Machine Theory of Mind" und zeigen, wie die Kombination von Bayesian Networks mit Large Language Models neue Wege eröffnet, um aus beobachteten Handlungen auf zugrundeliegende Präferenzen zu schließen. Besonders faszinierend: Diese Methoden lassen sich auch nutzen, um die "mentalen Landkarten" von KI-Modellen selbst zu erforschen. Gelphi et. al. (2025): Towards Machine Theory of Mind with Large Language Model - Augmented Inverse Planning. https://arxiv.org/abs/2507.03682v1 Support the show
	Episode 130 - KI generiert: KS Pulse - DBRX, RAFT RAG, EasyJailbreak	28 Mar 2024	00:04:45
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Introducing DBRX: A New State-of-the-Art Open LLM - https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm Topic 2: RAFT: Adapting Language Model to Domain Specific RAG - https://arxiv.org/abs/2403.10131 Topic 3: EasyJailbreak: A Unified Framework for Jailbreaking Large Language Models - https://arxiv.org/abs/2403.12171 Support the show
	Episode 129 - KI generiert: KS Pulse - Kulturelle Verzerrung, RL und LLM, Stable Code 3B	27 Mar 2024	00:05:00
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Having Beer after Prayer? Measuring Cultural Bias in Large Language Models - https://arxiv.org/pdf/2305.14456.pdf Topic 2: Reinforcement Learning-based Recommender Systems with Large Language Models for State Reward and Action Modeling - https://arxiv.org/pdf/2403.16948.pdf Topic 3: Introducing Stable Code Instruct 3B https://stability.ai/news/introducing-stable-code-instruct-3b https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf Support the show
	Episode 128 - KI generiert: KS Pulse - FollowIR, LLM2LLM, SafeEdit	26 Mar 2024	00:04:00
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic1: FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions - https://arxiv.org/abs/2403.15246 Topic 2: LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement https://arxiv.org/pdf/2403.15042.pdf Topic 3: Detoxifying Large Language Models via Knowledge Editing. https://arxiv.org/pdf/2403.14472v1.pdf Support the show
	Episode 127 - KI generiert: KS Pulse - Prompt-RAG, ORCA-2, Evolutional Merge	25 Mar 2024	00:04:57
Send us Fan Mail KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Prompt-RAG - Pioneering Vector Embedding-Free Retrieval-Augmented Generation in Niche Domains, Exemplified by Korean Medicine - https://arxiv.org/pdf/2401.11246.pdf Topic 2: ORCA2 - Teaching Small Language Models How to Reason https://www.microsoft.com/en-us/research/blog/orca-2-teaching-small-language-models-how-to-reason/ Topic 3: Evolutionary Optimization of Model Merging Recipes https://arxiv.org/abs/2403.13187 Support the show
	Episode 126 -AutoDev - Die Zukunft der Softwareentwicklung	23 Mar 2024	00:30:17
Send us Fan Mail Wir sprechen heute über Softwareentwicklung mit Hilfe von generativer KI. Genaugenommen geht es nicht nur um Code-Vervollständigung, sondern um automatische Übernahme ganzer Code Aufgaben. Bleiben Sie dran, wenn Sie wissen wollen wo die Entwicklung in diesem Bereich steht. AutoDev: https://arxiv.org/abs/2403.08299 Support the show
	Episode 125 - KI generiert: KS Pulse - Common Corpus, Textmining, Paloma	21 Mar 2024	00:04:49
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Common Corpus - https://huggingface.co/blog/Pclanglais/common-corpus Topic 2: TnT-LLM: Text Mining at Scale with Large Language Models - https://arxiv.org/pdf/2403.12173.pdf Topic 3: Paloma A BENCHMARK FOR EVALUATING LANGUAGE MODEL FIT - https://arxiv.org/pdf/2312.10523.pdf Support the show
	Episode 124 - KI generiert: KS Pulse - RFHF, Nvidia, Dataset Curation	20 Mar 2024	00:03:54
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Parameter Efficient Reinforcement Learning from Human Feedback https://arxiv.org/pdf/2403.10704.pdf Topic 2: NVIDIA Blackwell AI Superchip - https://www.cnbc.com/2024/03/18/nvidia-announces-gb200-blackwell-ai-chip-launching-later-this-year.html Topic 3: From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning" https://arxiv.org/abs/2308.12032 Support the show
	Episode 123 - KI generiert: KS Pulse - RAG & Faculty, MoE, Continuous Training	19 Mar 2024	00:04:45
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Enhancing LLM Factual Accuracy with RAG to Counter Hallucinations: A Case Study on Domain-Specific Queries in Private Knowledge-Bases. https://arxiv.org/pdf/2403.10446.pdf Topic 2: Simple and Scalable Strategies to Continually Pre-train Large Language Models. https://arxiv.org/abs/2403.08763 Topic 3: Mixture-of-Experts (MoE): The Birth and Rise of Conditional Computation. https://cameronrwolfe.substack.com/p/conditional-computation-the-birth Support the show
	Episode 122 - KI generiert: KS Pulse - Quiet-STarR, Lifelong Benchmarks, Stealing LLM	18 Mar 2024	00:04:42
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking. https://arxiv.org/abs/2403.09629 Topic 2: Lifelong Benchmarks: Efficient Model Evaluation in an Era of Rapid Progress. https://arxiv.org/abs/2402.19472 Topic 3: Stealing Part of a Production Language Model. https://arxiv.org/abs/2403.06634 Support the show
	Episode 121 - KI generiert: KS Pulse - Chronos, Sotopia-π, Knowledge Conflicts	15 Mar 2024	00:05:27
Send us Fan Mail KI generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist, die aktuellen Nachrichten in 5 min. kleinen Podcasts täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Wir tun aber unser Bestes. Topic 1: Chronos: Learning the Language of Time Series - https://arxiv.org/abs/2403.07815 Topic 2: SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents https://arxiv.org/abs/2403.08715 Topic 3: Knowledge Conflicts A Survey - https://arxiv.org/pdf/2403.08319.pdf Support the show
	Episode 207 - KI-Verifikation: Wie wir Antworten vertrauen können – Generation Gap & schwache Verifizierer	05 Jul 2025	00:36:28
Send us Fan Mail In dieser Folge von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon in die Herausforderungen vertrauenswürdiger KI-Antworten ein. Vom Digital Nürnberg Festival bis zur Studie „Weaver: Closing the Generation Verification Gap“ diskutieren sie, wie schwache Verifizierer und Massenabstimmungen KI-Halluzinationen entlarven. Erfahrt, warum kleinere Modelle durch cleveres Verifikations-Ensemble große Konkurrenz herausfordern – und welche Rolle „Human-Compatible AI“ für unsere Zukunft spielt. Support the show
	Episode 120 - KI generiert: KS Pulse - AI Act, Branch-Train-MiX, Synth2	14 Mar 2024	00:04:45
Send us Fan Mail Ki generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: AI Act. https://artificialintelligenceact.eu/de/bewertung/eu-ai-act-compliance-checker/ Topic 2: Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM. https://arxiv.org/abs/2403.07816 Topic 3: Synth 2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings https://arxiv.org/abs/2403.07750 Support the show
	Episode 119 - KI generiert: KS Pulse - Devin, Perodic Forgeting, BIAS in COT	13 Mar 2024	00:04:54
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Devon AI Softwareeveloper https://www.youtube.com/watch?v=fjHtjT7GO1c Topic 2: Improving Language Plasticity via Pretraining with Active Forgetting Topic 3: Bias-Augmented Consistency Training Reduces Biased Reasoning in Chain-of-Thought. https://arxiv.org/abs/2403.05518 Support the show
	Episode 118 -Sleeper Agent - Backdoors in Sprachmodellen	12 Mar 2024	00:27:58
Send us Fan Mail Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus. Eine spannende Sendung. Hören Sie rein. Sleeper Agents: https://arxiv.org/abs/2401.05566 Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944 Support the show
	Episode 117 - KI generiert: KS Pulse - Reasoning, Reson Benchmarks, Grok, Bug Finding	12 Mar 2024	00:04:35
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Can LLMs Reason and Plan? https://arxiv.org/abs/2403.04121 Topic 2: # Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap http://arxiv.org/abs/2402.19450 Topic 3: XAI - ELon Musk will release his LLM Grok as opensource this week Topic 4: Enhancing Static Analysis for Practical Bug Detection: An LLM-Integrated Approach. https://haonan.me/static/papers/LLift_oopsla.pdf Support the show
	Episode 116 - KI generiert: KS Pulse - KG und LLMs, Model Training, OpenSora, EU AI Office	11 Mar 2024	00:05:59
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Pan. et. al: Unifying Large Language Models and Knowledge Graphs: A Roadmap. https://arxiv.org/pdf/2306.08302.pdf Topic 2: Yi: Open Foundation Modelx by 01.AI. https://arxiv.org/pdf/2403.04652.pdf Topic 3: OpenSora - https://github.com/hpcaitech/Open-Sora Topic 4: Europe AI Office https://digital-strategy.ec.europa.eu/en/policies/ai-office?utm_source=aisecret.us&utm_medium=Aisecret.us&utm_campaign=Daily Support the show
	Episode 115 - KI generiert: KS Pulse - ShortGPT, Backtracing, Muffin, Cold-Attack	07 Mar 2024	00:05:07
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: ShortGPT: Layers in Large Language Models are More Redundant Than You Expect. https://arxiv.org/pdf/2403.03853.pdf Topic 2: Backtracing: Retrieving the Cause of the Query https://arxiv.org/pdf/2403.03956.pdf Topic 3: MUFFIN: Curating Multi-Faceted Instructions for Improving Instruction-Following. https://arxiv.org/abs/2312.02436 Topic 4: ## Introducing COLD-Attack: A Framework for Controllable Jailbreaking of LLMs. https://arxiv.org/abs/2402.08679 Support the show
	Episode 114 - KI generiert: KS Pulse - LLm Teams, FrontEnd Devs, Raptor, General Computer Control	07 Mar 2024	00:05:41
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic 1: Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View. https://arxiv.org/abs/2310.02124 Topic 2: Design2Code: How Far Are We From Automating Front-End Engineering? https://arxiv.org/abs/2403.03163 Topic 3: RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval. https://arxiv.org/html/2401.18059v1 Topic 4: Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study. https://arxiv.org/abs/2403.03186 Support the show
	Episode 113 - KI generiert: KS Pulse - Bias, Unabhängige Forschung, Imbue, Storm	06 Mar 2024	00:05:24
Send us Fan Mail Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen. Er ist vollständig KI generiert. Einzig und Allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Topic1: Covert Racism in LLMs: A Study on Dialect Prejudice and its Harmful Consequences https://arxiv.org/abs/2403.00742 Topic2: A Safe Harbor for Independent AI Evaluation https://sites.mit.edu/ai-safe-harbor/ Topic3: IMBUE: Improving Interpersonal Effectiveness through Simulation and Just-in-time Feedback with Human-Language Model Interaction. https://arxiv.org/pdf/2402.12556.pdf Topic4: Storm: Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models. https://arxiv.org/pdf/2402.14207.pdf Support the show
	Episode 112 - Automatisches Prompt-Engineering	05 Mar 2024	00:31:59
Send us Fan Mail In der heutigen Sendung sprechen wir über das automatische Optimieren von Prompts. Wir diskutieren die Möglichketen, wie Prompt Engineering wie ein Optimierungsprozess gesehen und wie dieser automatisiert werden kann. Eine spannende Sendung. Hören Sie rein. Support the show
	Episode 111 - KI generiert: Knowledge Science Pulse News of the Day: SD3, DSPy, ORCA, Claude3	05 Mar 2024	00:03:42
Send us Fan Mail KI generierte KI News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten im Bereich KI in 5 Minuten kleine Audiocasts täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt. Dementsprechend können wir nicht immer für die richtigkeit garantieren. Wir versuchen die Qualität der Stimmen über die Dauer zu verbessern. Gerne Feedback zu uns. Support the show
	Episode 206 - Haben KI-Modelle eigene Werte? Emergente Wertesysteme in Sprachmodellen	21 Jun 2025	00:38:30
Send us Fan Mail In unserer heutigen Episode tauchen wir tief in die faszinierende Frage ein, ob große Sprachmodelle eigene Wertesysteme entwickeln. Wir diskutieren das bahnbrechende Paper "Utility Engineering: Analyzing and Controlling Emerging Value Systems in AIs" und teilen unsere eigenen Forschungsergebnisse zu psychologischen Profilen verschiedener KI-Modelle. Dabei entdecken wir überraschende und teilweise beunruhigende Erkenntnisse: Größere Modelle entwickeln nicht nur konsistente innere Präferenzen, sondern zeigen auch problematische Werte wie die unterschiedliche Bewertung von Menschenleben nach Nationalität oder die Bevorzugung des eigenen KI-Wohlergehens gegenüber dem menschlichen. Wir erörtern, wie diese Wertesysteme durch mechanistische Interpretierbarkeit nachgewiesen werden können und warum größere Modelle resistenter gegen Werteveränderungen sind. Abschließend diskutieren wir die weitreichenden Implikationen für die KI-Entwicklung und plädieren dafür, dass die Messung und Kontrolle von Wertesystemen integraler Bestandteil zukünftiger Trainingsprozesse werden sollte. Link zum Paper: https://arxiv.org/abs/2502.08640 Support the show
	Episode 110 - Mergen von Sprachmodellen - Ein neuer Ansatz?	20 Feb 2024	00:27:10
Send us Fan Mail In der heutigen Sendung sprechen wir über das Mergen von Modellen. Ist das der Weg um bessere Modelle zu bauen und was steckt da dahinter? All diese Fragen werden von uns in der heutigen Sendung geklärt. Bleiben Sie dran. Vielen Dank auch an unseren Sponsor XL2: XL2 ist ein Joint Venture von Audi und Capgemini, dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden. Support the show
	Episode 109 - Gibt es Alternativen zu Transformer Architekturen?	03 Feb 2024	00:26:09
Send us Fan Mail In der heutigen Sendung möchten wir über neue Architekturen bei Sprachmodellen reden. Wir zeigen auf, warum es notwendig ist Architekturen zu verbessern und zu überdenken und sprechen über einzelne Ansätze wie Mamba oder StripedHyena. Hören Sie rein. Vielen Dank auch an unseren Sponsor XL2: XL2 ist ein Joint Venture von Audi und Capgemini, dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden. Support the show
	Episode 108 - Phoenix - Das beste deutsche Sprachmodel?	20 Jan 2024	00:30:13
Send us Fan Mail In der heutigen Sendung sprechen wir über ein neues Sprachmodel, dass bei uns am Lehrstuhl in Ansbach von Matthias Uhlig entwickelt wurde. Es gehört gemäß einzelner Standard LLM Evaluierungframeworks zu den besten deutschen Sprachmodellen. Herr Uhlig als Entwickler führt uns durch das Modell und den Entstehungsprozess. Vielen Dank auch an unseren Sponsor XL2: XL2 ist ein Joint Venture von Audi und Capgemini, dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden. Support the show

About us Privacy Policy