Fuente
Сповідь тестувальника | Привіт, мій щоденнику...Як там наша славетна увага до деталей?Дивлюсь ...
526 Vistas/Alcance
2025-12-07 13:00
Mensaje №48
Привіт, мій щоденнику...Як там наша славетна увага до деталей?Дивлюсь я відео одного пана про "ШІ", звісно ж. І бачу графік, що демонструє перевагу нової моделі Opus 4.5 від Антропік. Й помічаю у лівому нижньому кутку графіка цікавий символ, до якого я придивився. Бачу, що вертикальна шкала починається лише з 70%, а отже частину графіку від нас приховали.Це графік з офіційної новини Антропік, якщо що, я перевірив.При чому цікаво, що пан на відео каже, цитую "він вирвався на 10-15 відсотків від своїх конкурентів", хоча це не так ані по цифрах, ані візуально. По цифрах — значно менше, візуально — значно більше. Ну, прикинув "на око", ну ось таке в нього око. Яка різниця, правда? Олекса нудний, чіпляється до несуттєвого.Але ж це і створює у більшості людей хибне уявлення про реальність, в нашому випадку про моделі для програмування.Я створив власні графіки, при чому вони обидва використовують ті ж дані, вони реальні. Але я також "погрався" з вертикальною шкалою, щоб наочно показати, як буде змінюватися візуальне сприйняття ОДНАКОВИХ цифр залежно від представлення.Графік 1 показує реальні показники та візуальну різницю між моделями, бо починається від 0%, отже ви бачите всю "вагу" метрики.Графік 2 драматизує візуалізацію зі звіту Антропік, бо починається від 74%, що робить найнижчий показник зовсім крихітним, а закінчується на 81%, що робить найвищий показник таким, що височить над іншими.То як у нас з увагою до деталей? Річ у тім, що вона є дуже некомфортною для повсякденного життя, бо ми не можемо жити з постійним відчуттям недовіри до інформації, що оточує нас. Далі ми переносимо таку звичку й у професійне життя і все менше аналізуємо, все більше віддаємося емоціям та довіряємо тим, кому просто хочемо довіряти.Це вбиває у фахівці інженера.То що там показники? Ну, різниця між двома лідерами становить 3%.