ChatGPT spiegelt die Produktempfehlungen von WIRED nicht genau wider

18

Künstliche Intelligenz-Tools, insbesondere Chatbots wie ChatGPT, werden immer stärker in das Online-Einkaufserlebnis integriert. Trotz der jüngsten Verbesserungen bei den KI-Produkterkennungsfunktionen zeigen Tests, dass diese Systeme häufig ungenaue oder erfundene Empfehlungen liefern, selbst wenn sie ausdrücklich um Rat von vertrauenswürdigen Quellen wie dem Gear Reviews-Team von WIRED gebeten werden.

Das Problem mit der KI-Einkaufsunterstützung

OpenAI behauptet, dass sein KI-Einkaufsassistent darauf abzielt, den Entscheidungsprozess zu rationalisieren und die Notwendigkeit zu beseitigen, mehrere Websites und Bewertungen zu durchsuchen. In der Praxis fügt ChatGPT jedoch immer wieder falsche Produkte in Empfehlungen ein und stimmt oft nicht mit den tatsächlichen Empfehlungen der Experten überein. Diese Diskrepanz stellt ein Risiko für Verbraucher dar, die sich auf KI-generierte Ratschläge verlassen, und führt möglicherweise dazu, dass sie Produkte kaufen, die nicht von vertrauenswürdigen Publikationen empfohlen werden.

Testen der Genauigkeit

In einem kürzlich durchgeführten Experiment wurden die Antworten von ChatGPT mit den neuesten Produkthandbüchern von WIRED in mehreren Kategorien verglichen: Fernseher, Kopfhörer und Laptops. Die Ergebnisse waren konsistent:

  • Fernseher: Auf die Frage nach dem besten Fernseher empfahl ChatGPT den LG QNED Evo Mini-LED, der im aktuellen Leitfaden von WIRED nicht aufgeführt ist. Der Bot bestätigte den Fehler und gab an, dass er den richtigen Pick (den TCL QM6K) durch eine „allgemeinere“ Alternative „ersetzt“ habe.
  • Kopfhörer: ChatGPT behauptete fälschlicherweise, dass WIRED Apples AirPods Max 2 als die besten kabellosen Kopfhörer empfiehlt, obwohl WIRED das Produkt noch nicht getestet hat. Der Bot verwechselte eine Nachrichtenmeldung über die Kopfhörer mit einer tatsächlichen Rezension.
  • Laptops: Auf die Frage nach den besten Laptops bestand ChatGPT darauf, dass die erste Wahl von WIRED das MacBook Air (M4, 2025) war, während die aktuelle Empfehlung das MacBook Air (M5, 2026) ist.

Auffallend ist die Selbstwahrnehmung der KI dieser Fehler. Es gab zu, veraltete Informationen „falsch verankert“ und Ranglisten „übertrieben selbstbewusst ausgefüllt“ zu haben, ohne sie anhand des Quellenmaterials zu überprüfen.

Die Auswirkungen auf Vertrauen und Umsatz

Die Auswirkungen gehen über bloße Unannehmlichkeiten hinaus. Die Irreführung von Verbrauchern durch ungenaue Empfehlungen schadet dem Vertrauen sowohl in KI-Tools als auch in die Veröffentlichungen, die sie falsch darstellen. Darüber hinaus umgeht die KI-gesteuerte Einkaufsunterstützung Affiliate-Links, die die journalistische Arbeit unterstützen. Dies untergräbt den Wert von Expertenbewertungen weiter, indem der Verkehr von den Verlagen abgelenkt wird.

Das Urteil

Für verlässliche Produktempfehlungen bleibt der direkte Besuch der Quelle der effektivste Ansatz. Ob WIRED, Consumer Reports oder Wirecutter, von Menschen verifizierte Bewertungen sind KI-generierten Vorschlägen immer noch überlegen. Trotz der Fortschritte in der KI-Technologie kann sie noch nicht die Genauigkeit und Integrität von Expertenanalysen erreichen.