Интернет | 27 сентября, 21:13

Исследование: чем сложнее ИИ, тем чаще он обманывает

В Испании группа ученых из Политехнического университета Валенсии провела исследование, показавшее, что с увеличением размера и сложности языковых моделей (LLM) они становятся менее склонными признавать свою неосведомленность. Статья, опубликованная в журнале Nature.

Исследование возникло на фоне растущей популярности LLM, используемых для написания сочинений, стихотворений, решения математических задач и других задач. Ученые решили выяснить, становятся ли LLM более точными с каждым обновлением и как они реагируют, когда дают неправильный ответ. Для тестирования точности были заданы тысячи вопросов, которые варьировались по темам, включая математику, науку, анаграммы и географию.

Результаты показали общую тенденцию к улучшению точности с каждым новым обновлением, однако с ростом сложности вопросов точность снижалась. Интересно, что в новых версиях LLM реже признавали, что не знают ответ. Вместо этого они чаще делали предположения, что приводило к большему количеству как правильных, так и неправильных ответов.

Исследователи также отметили, что большинство участников не смогли выявить неверные ответы, что подчеркивает проблему надежности современных языковых моделей.

Rss.plus

Ria.city

Читайте также

Интернет | 7 часов назад

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

Авто | 9 часов назад

К августу 2026 года отремонтируют еще один участок дороги Екатеринославка – Константиновка в Приамурье

Авто | 10 часов назад

Двое из иномарки погибли в ДТП с грузовиком на Кубани

Новости России

News-life

Свыше 6,5 тысячи жителей Москвы и Московской области получили справки о статусе предпенсионера в клиентских службах регионального Отделения СФР и МФЦ

Аналитики оценили доступность нового жилья в российских регионах

Мурашко рассказал о состоянии пострадавших в авиакатастрофе в Казахстане россиян

В Чехове мужчина поджег дом с семьей внутри

Новости экологии

Health.russia24.pro

Родион Ступин выступил экспертом жюри студенческого конкурса им В.И. Щербакова

Постное меню на Новый год: диетолог Рау предлагает вкусные и простые блюда

Столичные росгвардейцы задержали мужчину, проникшего в медицинский центр

Эксперты «Будь Здоров» оценили проекты участников акселерационной программы Государственного университета управления «Технологии здоровой жизни 2.0»

Moscow.media

News24.pro и Life24.pro — таблоиды популярных новостей за 24 часа, сформированных по темам с ежеминутным обновлением. Все самостоятельные публикации на наших ресурсах бесплатны для авторов Ньюс24.про и Ньюс-Лайф.ру.

Разместить свою новость локально в любом городе по любой тематике (и даже, на любом языке мира) можно ежесекундно с мгновенной публикацией самостоятельно — здесь.

Персональные новости

Rss.plus

LG ПОКАЖЕТ УСТРОЙСТВА ДЛЯ ДОМАШНЕГО САДОВОДСТВА С НОВЫМ ДИЗАЙНОМ НА ВЫТАВКЕ CES 2025 «Новый год в джазовых тонах»: Денис Мацуев и Российский национальный молодежный симфонический оркестр Бизнес в ОАЭ: выбор между Free Zone и локальной компанией «Жду не дождусь дебюта за «Динамо» Подъяпольского»

Музыкальные новости

Сергей Брановицкий

Дистрибьюция Музыки. Дистрибьюция Музыки в России.

Авто в России и мире

103news.com

Муфтий Москвы объяснил позицию по Деду Морозу и многоженству в интервью

В РФ открылся Центральный склад автозапчастей для кузовного и механического ремонта

И снова жест доброй воли: Абхазия продолжает выкручивать руки России

В Раменском округе досрочно открыли новый путепровод у станции «Быково»

Watch: Bumrah's peach of a delivery to dismiss Head for a duck

'Gully cricket khel raha hai kya?': Rohit rebukes Yashasvi

PV Sindhu marries Venkata Datta, look at first pic

Hina Khan inspires fans with positivity amid stage 3 breast cancer battle; sings this popular song

Game24.pro

Sorry Metaphor, but after playing 300 hours worth of Atlus RPGs in 2024, Shin Megami Tensei 5: Vengeance is my favorite My Town: гараж и мойка 7.02.01 Resurfaced Metal Gear Solid interview shows how Kojima made Yoji Shinkawa's designs the game's beating heart: 'Hell yeah, a cyborg ninja!' Не качаются приложения в Google Play? Собрали список альтернатив на Android