ChatGPT Не вміє точно відображати Рекомендації Продуктів від WIRED

1

Інструменти штучного інтелекту, особливо чат-боти, такі як ChatGPT, все більше інтегруються в онлайн-шопінг. Незважаючи на нещодавні покращення у функціях пошуку продуктів за допомогою ІІ, тести показують, що ці системи часто надають неточні або вигадані рекомендації, навіть якщо їх спеціально просять керуватися думками надійних джерел, таких як команда оглядів техніки від WIRED.

Проблема з ІІ-помічниками в Шопінгу

OpenAI стверджує, що їхній ІІ-помічник покликаний спростити процес прийняття рішень, позбавляючи необхідності переглядати безліч веб-сайтів і оглядів. Однак на практиці ChatGPT послідовно вставляє невірні продукти в рекомендації, які часто не збігаються з фактичним вибором експертів. Цей розрив є ризиком для споживачів, що покладаються на ІІ-генеровані поради, що може призвести до купівлі продуктів, не схвалених авторитетними виданнями.

Тестування Точності

Недавній експеримент порівняв відповіді ChatGPT з останніми посібниками з продуктів від WIRED у кількох категоріях: телевізори, навушники та ноутбуки. Результати були незмінними:

  • Телевізори: На питання про найкращий телевізор ChatGPT порекомендував LG QNED Evo Mini-LED, який не представлений у поточному посібнику WIRED. Бот визнав помилку, заявивши, що «замінив» правильний вибір (TCL QM6K) на «універсальніший» варіант.
  • Навушники: ChatGPT помилково заявив, що WIRED рекомендує Apple AirPods Max 2 як найкращі бездротові навушники, хоча WIRED ще не тестував цей продукт. Робот переплутав новинне оголошення про навушники з фактичним оглядом.
  • Ноутбуки: На питання про кращі ноутбуки ChatGPT наполягав, що найкращим вибором WIRED є MacBook Air (M4, 2025), тоді як поточна рекомендація – MacBook Air (M5, 2026).

Самосвідомість ІІ щодо цих помилок вражає. Він зізнався, що «некоректно спирався» на застарілу інформацію та «самовпевно заповнював» рейтинги, не перевіряючи їх за вихідним матеріалом.

Вплив на Довіру та Дохід

Наслідки виходять за межі простої незручності. Введення споживачів в оману неточними рекомендаціями підриває довіру як до інструментів ІІ, так і до неправильно представлених видань. Крім того, ІІ-помічники у шопінгу оминають партнерські посилання, які підтримують журналістську роботу. Це ще більше знижує цінність експертних оглядів, перенаправляючи трафік від видавців.

Вердикт

Для надійних рекомендацій продуктів найефективнішим підходом залишається відвідування джерела безпосередньо. Будь то WIRED, Consumer Reports або Wirecutter, перевірені людиною огляди, як і раніше, перевершують ІІ-генеровані пропозиції. Незважаючи на досягнення в галузі ІІ, він поки що не може відтворити точність та цілісність експертного аналізу.