Explorez tous les épisodes du podcast Knowledge Science - Alles über KI, ML und NLP
Plongez dans la liste complète des épisodes de Knowledge Science - Alles über KI, ML und NLP. Chaque épisode est catalogué accompagné de descriptions détaillées, ce qui facilite la recherche et l'exploration de sujets spécifiques. Suivez tous les épisodes de votre podcast préféré et ne manquez aucun contenu pertinent.
Rows per page:
50
1–50 of 261
Titre
Date
Durée
Episode 220 - Das fehlende Layer zur Superintelligenz: Warum LLMs keine Sackgasse sind – aber auch nicht ausreichen
Sind Large Language Models eine Sackgasse oder der Königsweg zur künstlichen Superintelligenz? In dieser Episode tauchen wir tief in die aktuelle Stanford-Forschung ein und entdecken: Die Wahrheit liegt dazwischen. LLMs bilden ein mächtiges „Substrat" aus latenten Mustern – doch für echte Intelligenz fehlt eine entscheidende Koordinationsschicht. Wir diskutieren, warum Multiagentensysteme, adaptive Steuerung und das richtige „Ködern" im Ozean der Sprachmodelle der Schlüssel zur AGI sein könnten.
Transformer-Architekturen stoßen an ihre Grenzen – doch was kommt danach? In dieser Episode diskutieren Sigurd und Carsten das revolutionäre Konzept „Nested Learning" von Google Research. Die Idee: Hierarchische Lernstrukturen mit unterschiedlichen Geschwindigkeiten, inspiriert von den Gehirnwellen des Menschen. Könnte dies der Schlüssel zu echtem kontinuierlichem Lernen sein? Und was bedeutet das für die Zukunft personalisierter KI-Assistenten?
In dieser Episode tauchen Sigurd und Carsten in die faszinierende Welt der KI-gesteuerten Wirtschaftssimulationen ein. Sie diskutieren das Paper "LLM Economist" aus Princeton, das zeigt, wie Sprachmodelle eine komplette Gesellschaft simulieren und dabei als virtueller Chefökonom optimale Steuerpolitik entwickeln können. Mit überraschenden Ergebnissen: Eine 93% Steigerung der sozialen Wohlfahrt! Die Hosts erklären In-Context Reinforcement Learning, Stackelberg-Gleichgewichte und diskutieren weitere Anwendungsfälle von Klimapolitik bis Stadtplanung.
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Towards Large Language Models as Copilots for Theorem Proving in Lean https://arxiv.org/pdf/2404.12534.pdf Topic 2: LongEmbed: Extending Embedding Models for Long Context Retrieval https://arxiv.org/abs/2404.12096
Englisch Version - The German Version also exists but content differ minimal: AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day.
It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, both the manuscript and the audio file are created completely automatically.
Accordingly, we cannot always guarantee accuracy.
Topic 1: Many-Shot In-Context Learning - https://arxiv.org/abs/2404.11018 Topic 2: The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - https://arxiv.org/pdf/2404.11584.pdf
It would be great if you compare the German to the English version and give us feedback.
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Many-Shot In-Context Learning - https://arxiv.org/abs/2404.11018 Topic 2: The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey - https://arxiv.org/pdf/2404.11584.pdf
In der heutigen Sendung tauchen wir ein in die faszinierende Welt der End-to-End multimodalen Modelle, die Text und Audio nahtlos verarbeiten.
Wir gehen auf Gazelle https://tincans.ai/slm3 ein SLM ein und sprechen über die Paper: AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs https://arxiv.org/pdf/2311.06753.pdf und SLM: Bridge the thin gap between speech and text foundation models https://arxiv.org/pdf/2310.00230.pdf
Englisch Version - The German Version also exists: AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day.
It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, both the manuscript and the audio file are created completely automatically.
Accordingly, we cannot always guarantee accuracy.
Topic 1: AI Index 2024 - Comprehensive study on AI by Stanford. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
It would be great if you compare the German to the English version and give us feedback.
Leichte Änderungen, wir haben versucht die Generierung mehr zu einem Dialog zu trimmen. Ist dies angenehmer anzuhören? Gerne Feedback.
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: AI Index 2024 - Umfassende Studie über KI von Stanford. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Reducing hallucination in structured outputs via Retrieval-Augmented Generation - https://arxiv.org/pdf/2404.08189.pdf Topic 2: Generative Information Retrieval Evaluation https://arxiv.org/pdf/2404.08137.pdf Topic 3: Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models https://arxiv.org/pdf/2401.06102.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Medical mT5: An Open-Source Multilingual Text-to-Text LLM for The Medical Domain https://arxiv.org/pdf/2404.07613.pdf Topic 2: Best Practices and Lessons Learned on Synthetic Data for Language Models https://arxiv.org/pdf/2404.07503.pdf Topic 3: Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping https://arxiv.org/pdf/2404.07341.pdf
In der heutigen Sendung möchten wir darüber sprechen, ob die Schnittstelle zu LLMs - also Chat Eingabe - die richtige Eingabeform ist oder ob wir in Zukunft andere Schnittstellen zu LLMs sehen. Eine wesentliche Diskussion ist die Einbettung von LLMs auf Betriebssystemebene. Bleiben Sie dran.
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: LLM-Augmented Retrieval: Enhancing Retrieval Models Through Language Models and Doc-Level Embedding https://arxiv.org/pdf/2404.05825.pdf Topic 2: LM2: A Simple Society of Language Models Solves Complex Reasoning https://arxiv.org/pdf/2404.02255.pdf Topic 3: Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs https://arxiv.org/pdf/2404.07103.pdf
In dieser Episode analysieren Sigurd Schacht und Carsten Lanquillon das Paper "Humanity Faces Existential Risk from Gradual Disempowerment" von Jan Kulweit et al. Die beiden Hosts untersuchen, wie die zunehmende Automatisierung durch KI-Systeme unsere Einflussmöglichkeiten auf drei zentrale gesellschaftliche Bereiche verändert: Wirtschaft, Kultur und Staat.
Dabei diskutieren sie konkrete Beispiele wie Softbanks Vision von einer Billion KI-Agenten. Ein besonderer Fokus liegt auf der Erkenntnis, dass diese Transformation nicht erst mit einer zukünftigen Superintelligenz beginnt, sondern bereits mit heutigen Systemen wie ChatGPT und anderen KI-Tools im Gange ist. Die Episode bietet sowohl eine fundierte Analyse der Mechanismen als auch erste Überlegungen zu möglichen Gegenstrategien wie bewusste Entschleunigung und transparentes Monitoring der KI-Durchdringung.
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: SELF-[IN]CORRECT: LLMs Struggle with Refining Self-Generated Responses https://arxiv.org/pdf/2404.04298.pdf Topic 2: PhonologyBench: Evaluating Phonological Skills of Large Language Models https://arxiv.org/pdf/2404.02456.pdf Topic 3: MuPT: A Generative Symbolic Music Pretrained Transformer https://arxiv.org/pdf/2404.06393.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Stream of Search (SoS): Learning to Search in Language https://arxiv.org/pdf/2404.03683.pdf Topic 2: ARAGOG: Advanced RAG Output Grading https://arxiv.org/pdf/2404.01037.pdf Topic 3: Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences https://arxiv.org/pdf/2404.03715.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: More Agents Is All You Need https://arxiv.org/pdf/2402.05120.pdf Topic 2: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models https://arxiv.org/pdf/2404.03622.pdf Topic 3: Evaluating LLMs at Detecting Errors in LLM Responses https://arxiv.org/pdf/2404.03602v1.pdf
Aus gegeben Anlass werden wir in dieser Sendung das Thema Red Teaming noch einmal aufgreifen. In dieser Episode werden wir einen erweiterten Überblick über das Thema geben. Bleiben Sie dran.
Against The Achilles’ Heel: A Survey on Red Teaming for Generative Models: https://arxiv.org/abs/2404.00629
Gerne können Sie auch Folge 107 zum Thema Red Teaming mit anhören.
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Command R+ https://txt.cohere.com/command-r-plus-microsoft-azure/ Topic 2: Do Language Models Plan for Future Tokens? https://arxiv.org/pdf/2404.00859.pdf Topic 3:Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks https://arxiv.org/pdf/2404.02151.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Octopus v2: On-device language model for super agent. https://arxiv.org/pdf/2404.01744.pdf Topic 2: Privacy Backdoors: Stealing Data with Corrupted Pretrained Models. https://arxiv.org/pdf/2404.00473.pdf Topic 3: OPTIMIZATION-BASED PROMPT INJECTION ATTACK TO LLM-AS-A-JUDGE. https://arxiv.org/pdf/2403.17710v1.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: QuaRot: Outlier-Free 4-Bit Inference in Rotated LLMs https://arxiv.org/pdf/2404.00456.pdf Topic 2: What’s in Your “Safe” Data?: Identifying Benign Data that Breaks Safety https://arxiv.org/pdf/2404.01099.pdf Topic 3: Tired of Plugins? Large Language Models Can Be End-To-End Recommenders https://arxiv.org/pdf/2404.00702.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1:Design2Code: How Far Are We From Automating Front-End Engineering? https://arxiv.org/pdf/2403.03163.pdf Topic 2: Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs https://arxiv.org/pdf/2403.20041v1.pdf Topic3: ReALM: Reference Resolution As Language Modeling - https://arxiv.org/pdf/2403.20329.pdf
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: The Unreasonable Ineffectiveness of the Deeper Layers - https://arxiv.org/abs/2403.17887https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm Topic 2: Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews - https://arxiv.org/abs/2403.07183 Topic 3: LONG-FORM FACTUALITY IN LARGE LANGUAGE MODELS - https://arxiv.org/pdf/2403.18802.pdf
In dieser Episode erkunden Sigurd und Carsten, wie KI-Modelle menschliche Präferenzen und Handlungen verstehen lernen können. Sie diskutieren das spannende Paper "Towards Machine Theory of Mind" und zeigen, wie die Kombination von Bayesian Networks mit Large Language Models neue Wege eröffnet, um aus beobachteten Handlungen auf zugrundeliegende Präferenzen zu schließen. Besonders faszinierend: Diese Methoden lassen sich auch nutzen, um die "mentalen Landkarten" von KI-Modellen selbst zu erforschen.
Gelphi et. al. (2025): Towards Machine Theory of Mind with Large Language Model - Augmented Inverse Planning. https://arxiv.org/abs/2507.03682v1
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Introducing DBRX: A New State-of-the-Art Open LLM - https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm Topic 2: RAFT: Adapting Language Model to Domain Specific RAG - https://arxiv.org/abs/2403.10131 Topic 3: EasyJailbreak: A Unified Framework for Jailbreaking Large Language Models - https://arxiv.org/abs/2403.12171
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Having Beer after Prayer? Measuring Cultural Bias in Large Language Models - https://arxiv.org/pdf/2305.14456.pdf Topic 2: Reinforcement Learning-based Recommender Systems with Large Language Models for State Reward and Action Modeling - https://arxiv.org/pdf/2403.16948.pdf Topic 3: Introducing Stable Code Instruct 3B https://stability.ai/news/introducing-stable-code-instruct-3b https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic1: FollowIR: Evaluating and Teaching Information Retrieval Models to Follow Instructions - https://arxiv.org/abs/2403.15246 Topic 2: LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement https://arxiv.org/pdf/2403.15042.pdf Topic 3: Detoxifying Large Language Models via Knowledge Editing. https://arxiv.org/pdf/2403.14472v1.pdf
KI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Prompt-RAG - Pioneering Vector Embedding-Free Retrieval-Augmented Generation in Niche Domains, Exemplified by Korean Medicine - https://arxiv.org/pdf/2401.11246.pdf Topic 2: ORCA2 - Teaching Small Language Models How to Reason https://www.microsoft.com/en-us/research/blog/orca-2-teaching-small-language-models-how-to-reason/ Topic 3: Evolutionary Optimization of Model Merging Recipes https://arxiv.org/abs/2403.13187
Wir sprechen heute über Softwareentwicklung mit Hilfe von generativer KI. Genaugenommen geht es nicht nur um Code-Vervollständigung, sondern um automatische Übernahme ganzer Code Aufgaben. Bleiben Sie dran, wenn Sie wissen wollen wo die Entwicklung in diesem Bereich steht.
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Common Corpus - https://huggingface.co/blog/Pclanglais/common-corpus Topic 2: TnT-LLM: Text Mining at Scale with Large Language Models - https://arxiv.org/pdf/2403.12173.pdf Topic 3: Paloma A BENCHMARK FOR EVALUATING LANGUAGE MODEL FIT - https://arxiv.org/pdf/2312.10523.pdf
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Parameter Efficient Reinforcement Learning from Human Feedback https://arxiv.org/pdf/2403.10704.pdf Topic 2: NVIDIA Blackwell AI Superchip - https://www.cnbc.com/2024/03/18/nvidia-announces-gb200-blackwell-ai-chip-launching-later-this-year.html Topic 3: From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning" https://arxiv.org/abs/2308.12032
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Enhancing LLM Factual Accuracy with RAG to Counter Hallucinations: A Case Study on Domain-Specific Queries in Private Knowledge-Bases. https://arxiv.org/pdf/2403.10446.pdf Topic 2: Simple and Scalable Strategies to Continually Pre-train Large Language Models. https://arxiv.org/abs/2403.08763 Topic 3: Mixture-of-Experts (MoE): The Birth and Rise of Conditional Computation. https://cameronrwolfe.substack.com/p/conditional-computation-the-birth
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking. https://arxiv.org/abs/2403.09629 Topic 2: Lifelong Benchmarks: Efficient Model Evaluation in an Era of Rapid Progress. https://arxiv.org/abs/2402.19472 Topic 3: Stealing Part of a Production Language Model. https://arxiv.org/abs/2403.06634
KI generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist, die aktuellen Nachrichten in 5 min. kleinen Podcasts täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren. Wir tun aber unser Bestes.
Topic 1: Chronos: Learning the Language of Time Series - https://arxiv.org/abs/2403.07815 Topic 2: SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents https://arxiv.org/abs/2403.08715 Topic 3: Knowledge Conflicts A Survey - https://arxiv.org/pdf/2403.08319.pdf
In dieser Folge von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon in die Herausforderungen vertrauenswürdiger KI-Antworten ein. Vom Digital Nürnberg Festival bis zur Studie „Weaver: Closing the Generation Verification Gap“ diskutieren sie, wie schwache Verifizierer und Massenabstimmungen KI-Halluzinationen entlarven. Erfahrt, warum kleinere Modelle durch cleveres Verifikations-Ensemble große Konkurrenz herausfordern – und welche Rolle „Human-Compatible AI“ für unsere Zukunft spielt.
Ki generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Paketen täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: AI Act. https://artificialintelligenceact.eu/de/bewertung/eu-ai-act-compliance-checker/ Topic 2: Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM. https://arxiv.org/abs/2403.07816 Topic 3: Synth 2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings https://arxiv.org/abs/2403.07750
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Devon AI Softwareeveloper https://www.youtube.com/watch?v=fjHtjT7GO1c Topic 2: Improving Language Plasticity via Pretraining with Active Forgetting Topic 3: Bias-Augmented Consistency Training Reduces Biased Reasoning in Chain-of-Thought. https://arxiv.org/abs/2403.05518
Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus.
Eine spannende Sendung. Hören Sie rein.
Sleeper Agents: https://arxiv.org/abs/2401.05566 Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Can LLMs Reason and Plan? https://arxiv.org/abs/2403.04121 Topic 2: # Functional Benchmarks for Robust Evaluation of Reasoning Performance, and the Reasoning Gap http://arxiv.org/abs/2402.19450 Topic 3: XAI - ELon Musk will release his LLM Grok as opensource this week Topic 4: Enhancing Static Analysis for Practical Bug Detection: An LLM-Integrated Approach. https://haonan.me/static/papers/LLift_oopsla.pdf
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Pan. et. al: Unifying Large Language Models and Knowledge Graphs: A Roadmap. https://arxiv.org/pdf/2306.08302.pdf Topic 2: Yi: Open Foundation Modelx by 01.AI. https://arxiv.org/pdf/2403.04652.pdf Topic 3: OpenSora - https://github.com/hpcaitech/Open-Sora Topic 4: Europe AI Office https://digital-strategy.ec.europa.eu/en/policies/ai-office?utm_source=aisecret.us&utm_medium=Aisecret.us&utm_campaign=Daily
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: ShortGPT: Layers in Large Language Models are More Redundant Than You Expect. https://arxiv.org/pdf/2403.03853.pdf Topic 2: Backtracing: Retrieving the Cause of the Query https://arxiv.org/pdf/2403.03956.pdf Topic 3: MUFFIN: Curating Multi-Faceted Instructions for Improving Instruction-Following. https://arxiv.org/abs/2312.02436 Topic 4: ## Introducing COLD-Attack: A Framework for Controllable Jailbreaking of LLMs. https://arxiv.org/abs/2402.08679
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic 1: Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View. https://arxiv.org/abs/2310.02124 Topic 2: Design2Code: How Far Are We From Automating Front-End Engineering? https://arxiv.org/abs/2403.03163 Topic 3: RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval. https://arxiv.org/html/2401.18059v1 Topic 4: Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study. https://arxiv.org/abs/2403.03186
Ki Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in 5 min. kleinen Packeten täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und Allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die Richtigkeit garantieren.
Topic1: Covert Racism in LLMs: A Study on Dialect Prejudice and its Harmful Consequences https://arxiv.org/abs/2403.00742 Topic2: A Safe Harbor for Independent AI Evaluation https://sites.mit.edu/ai-safe-harbor/ Topic3: IMBUE: Improving Interpersonal Effectiveness through Simulation and Just-in-time Feedback with Human-Language Model Interaction. https://arxiv.org/pdf/2402.12556.pdf Topic4: Storm: Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models. https://arxiv.org/pdf/2402.14207.pdf
In der heutigen Sendung sprechen wir über das automatische Optimieren von Prompts. Wir diskutieren die Möglichketen, wie Prompt Engineering wie ein Optimierungsprozess gesehen und wie dieser automatisiert werden kann.
KI generierte KI News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten im Bereich KI in 5 Minuten kleine Audiocasts täglich zu bekommen.
Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.
Dementsprechend können wir nicht immer für die richtigkeit garantieren. Wir versuchen die Qualität der Stimmen über die Dauer zu verbessern.
In unserer heutigen Episode tauchen wir tief in die faszinierende Frage ein, ob große Sprachmodelle eigene Wertesysteme entwickeln. Wir diskutieren das bahnbrechende Paper "Utility Engineering: Analyzing and Controlling Emerging Value Systems in AIs" und teilen unsere eigenen Forschungsergebnisse zu psychologischen Profilen verschiedener KI-Modelle.
Dabei entdecken wir überraschende und teilweise beunruhigende Erkenntnisse: Größere Modelle entwickeln nicht nur konsistente innere Präferenzen, sondern zeigen auch problematische Werte wie die unterschiedliche Bewertung von Menschenleben nach Nationalität oder die Bevorzugung des eigenen KI-Wohlergehens gegenüber dem menschlichen. Wir erörtern, wie diese Wertesysteme durch mechanistische Interpretierbarkeit nachgewiesen werden können und warum größere Modelle resistenter gegen Werteveränderungen sind.
Abschließend diskutieren wir die weitreichenden Implikationen für die KI-Entwicklung und plädieren dafür, dass die Messung und Kontrolle von Wertesystemen integraler Bestandteil zukünftiger Trainingsprozesse werden sollte.
In der heutigen Sendung sprechen wir über das Mergen von Modellen. Ist das der Weg um bessere Modelle zu bauen und was steckt da dahinter? All diese Fragen werden von uns in der heutigen Sendung geklärt. Bleiben Sie dran.
Vielen Dank auch an unseren Sponsor XL2:
XL2 ist ein Joint Venture von Audi und Capgemini, dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden.
In der heutigen Sendung möchten wir über neue Architekturen bei Sprachmodellen reden. Wir zeigen auf, warum es notwendig ist Architekturen zu verbessern und zu überdenken und sprechen über einzelne Ansätze wie Mamba oder StripedHyena. Hören Sie rein.
Vielen Dank auch an unseren Sponsor XL2:
XL2 ist ein Joint Venture von Audi und Capgemini, dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden.
In der heutigen Sendung sprechen wir über ein neues Sprachmodel, dass bei uns am Lehrstuhl in Ansbach von Matthias Uhlig entwickelt wurde. Es gehört gemäß einzelner Standard LLM Evaluierungframeworks zu den besten deutschen Sprachmodellen. Herr Uhlig als Entwickler führt uns durch das Modell und den Entstehungsprozess.
Vielen Dank auch an unseren Sponsor XL2:
XL2 ist ein Joint Venture von Audi und Capgemini, dass die digitale Transformation in der Automobilindustrie vorantreibt. Das Unternehmen erarbeitet innovative End-to-End-Prozesse und implementiert maßgeschneiderte IT-Lösungen für seine Kunden.