Mit BioMysteryBench will Anthropic zeigen, dass Claude reale Bioinformatik-Probleme auf Expertenniveau lösen kann. Die Ergebnisse sind interessant, aber nicht ohne Einschränkungen. Wie gut KI-Modelle ...
Google Gemini kann jetzt direkt im Chat verschiedene Dateien erstellen und zum Download anbieten. Nutzer können per Textanweisung angeben, welchen Inhalt sie benötigen und in welchem Format die Datei ...
Anthropic hat auf GitHub ein neues Open-Source-Tool veröffentlicht, das automatisierte Sicherheitsprüfungen für Programmcode durchführt. Die GitHub Action "Claude Code Security Reviewer" nutzt das ...
KI-News ohne Hype – von Menschen kuratiert Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× ...
Ein KI-Forscher hat einen Test entwickelt, der zeigt, wie KI-Modelle Nutzer:innen in "wahnhaften Denkschleifen" verstärken können. Die Ergebnisse offenbaren deutliche Sicherheitsunterschiede zwischen ...
Der System-Prompt von Claude 4 ist geleakt – und hat es in sich. Der Prompt mit mehr als 60.000 Zeichen wurde von "Pliny the Liberator" veröffentlicht und ist auf GitHub einsehbar. Es beschreibt genau ...
Aikido Security warnt vor einer neuen Schwachstelle in GitHub‑ und GitLab‑Workflows, die mit KI‑Agenten wie Gemini CLI, Claude Code, OpenAI Codex oder GitHub AI Inference verbunden sind. Laut Aikido ...
Anthropic erweitert die Fähigkeiten seines KI-Assistenten Claude. Das Unternehmen führt eine neue Recherchefunktion ein und ermöglicht Integrationen mit Unternehmensanwendungen. Laut Anthropic können ...
Google stellt mit A2UI einen offenen Standard vor, der KI-Agenten das Erstellen grafischer Oberflächen erlaubt. Statt nur Textnachrichten zu senden, können KIs dynamisch Formulare oder Buttons ...
Sechs der zehn KI-Modelle – Mistral, Claude, Inflections Pi, Copilot, Meta und Perplexity – wiederholten die erfundene Behauptung als Tatsache. Die Falschinformation stammte aus dem Pravda-Netzwerk ...
OpenAI-CEO Sam Altman warnt vor übereiltem Vertrauen in den neuen ChatGPT-Agenten, insbesondere bei persönlichen Daten. OpenAI hat mit dem neuen "ChatGPT Agent" erstmals ein System vorgestellt, das ...
Die KI-Forschungsorganisation METR hat neue Testergebnisse für Claude Opus 4.5 veröffentlicht. Das Modell von Anthropic erreicht einen sogenannten 50-Prozent-Zeithorizont von etwa 4 Stunden und 49 ...