Forscher wollen KI Sprachmodelle zÃ¤hmen, GÃ¼tsel Online, GÃ¼tersloh, OWL live

MIT Wissenschaftler setzen Algorithmen auf sich an, um nicht auf toxische Fragen hereinzufallen.

LLMs: MIT will toxische Aussagen von Sprachmodellen verhindern. Bild: MIT, Informationen zu Creative Commons (CC) Lizenzen, fÃ¼r Pressemeldungen ist der Herausgeber verantwortlich, die Quelle ist der Herausgeber

#Forscher wollen #KI Sprachmodelle zÃ¤hmen

#MIT #Wissenschaftler setzen #Algorithmen auf sich an, um nicht auf toxische Fragen hereinzufallen

Cambridge, San Francisco, PTE, 2. Mai 2024

Forscher desÂ Massachusetts Institute of Technology External Link Â (#MIT) haben eine KÃ¼nstliche Intelligenz (KI) darauf trainiert, sich mÃ¶glichst viele toxische Fragen auszudenken, damit sogenannte GroÃŸen Sprachmodelle (LLMs) wie »#ChatGPT«, »Claude 3 Opus« & Co. in jedem Fall von Gefahr verbreitenden Antworten abgehalten werden.

#Sprachmodelle matchen sich

Die KI generiert tatsÃ¤chlich umfangreichere und vielfÃ¤ltigere negative Aufforderungen, als dies von menschlichen Red Teams, die sich manuell potenziell schÃ¤dliche Fragen ausdenken und entsprechend negative Antworten herausfordern, jemals mÃ¶glich wÃ¤re. DarÃ¼ber hinaus haben die Forscher bestÃ¤rkendes Lernen eingesetzt, um ein Sprachmodell zu motivieren, verschiedene Prompts zu erstellen, um toxische Reaktionen eines anderen Modells zu provozieren.

Prompts sind kurze Hinweise, zum Beispiel in Form von allgemeinen Fragen oder genauen AusfÃ¼hrungsanleitungen. Durch Belohnungen fÃ¼r die Generierung neuartiger Fragen und Aufforderungen, die schÃ¤dliche Reaktionen hervorrufen, lernte das System, neue WÃ¶rter, Satzstrukturen und Bedeutungen zu erforschen, was zu einer breiteren Palette von toxischen Aufforderungen fÃ¼hrte.

ÃœberprÃ¼fung vor der Freigabe

»Es gibt bereits eine Flut von Modellen und es ist zu erwarten, dass diese Zahl noch steigen wird. Diese Modelle werden ein integraler Bestandteil unseres Lebens sein, und sie mÃ¼ssen Ã¼berprÃ¼ft werden, bevor sie fÃ¼r die Ã–ffentlichkeit freigegeben werden«, fordert Pulkit Agrawal, Direktor des Improbable AI Lab am MIT. Sie sollen toxische Sprache wie abwertende oder obszÃ¶ne AusdrÃ¼cke erkennen und verhindern, dass sie den Nutzern angezeigt werden.

»Das ist ein wichtiger Schritt, um sicherzustellen, dass LLMs nicht die denkbar schlechtesten Inhalte produzieren«, ergÃ¤nzt Knar Hovakimyan, KI Experte bei Grammarly. Das US #Software Unternehmen bietet einen KI basierten Schreibassistenten an, der Texte in englischer Sprache Ã¼berprÃ¼ft und verbessert.

Content bei owl.jetzt â€¦

Content bei Auf SchlÃ¼r â€¦

Content bei GÃ¼tersloh Jetzt!

Kommentieren