Canal FUTURE × SIMPLE ⛩ - @thats_ai_samurai - №755
💀 Дарвін, посунься нах🤬й: 96% вінрейту та чи еволюція коду — це вже Skynet?Природі знадобилися мільйони років, щоб перетворити одноклітинний бульйон на щось, що здатне вижити в агресивному середовищі. У кремнію такого терпіння немає — він хоче все і одразу.→ Поки ми тут граємося в промпт-інжиніринг та етичні обмеження, нейрокозацтво з Sakana AI та MIТ вирішили дати АІ задачу трішки веселішу — еволюціонувати.
Відразу ж поясню для тих, хто не не розуміє чому іконка збереження — це дискет зумерів та усіх, хто не в курсі (я майже певен, що тут таких більшість): існує така гіківська розвага — гра Core War (1984).1984 — це, якщо що, не недоречна відсилка на книгу Орвелла, а рік релізу.🤯 Що вам потрібно розуміти: це вам не якийсь там Spore, шутер чи «броділка», а віртуальна гладіаторська арена в пам'яті кампутєра. Суть в тому, що дві програми («воїни») завантажуються в одну RAM і намагаються знищити одна одну. → Мета проста: змусити опонента виконати невалідну інструкцію і крашнутися. Це чистий, дистильований цифровий дарвінізм на мові Redcode — код воює з кодом на рівні асемблера.• Так от, дослідник взяли LLM (тут був GPT-4.1 mini), дали їй підручник з мови Redcode та посадили писати код цих «воїнів», а потім — і це ключове — еволюціонувати, змагаючись проти попередніх версій себе.
Назвали цей пайплайн Digital Red Queen (DRQ).👎 Якщо просто попросити написати вірус-воїна (zero-shot), результат буде, м'яко кажучи, жалюгідним.У тестах такі «воїни» перемагали лише 1.7% стандартних людських стратегій — іншими словами, цей дистилят інтернету взагалі не викупав, що робити в цьому низькорівневому коді.• Просто змусити моделі кодити — мало. Вони швидко скочуються в mode collapse (допис про це є тут), тобто починають клепати однакові нудні стратегії.
Тому тут застосували алгоритм MAP-Elites, який винагороджує агентів не просто за перемогу, а за те, що вони перемагають саме унікальним способом.🤑 Ближче до суті — цей рій цифрових покручів знайшов вразливість до 96.3% людських стратегій. Тобто, хоча один універсальний солдат ще може програти, колективний розум AI вже вирахував, як убити майже будь-який написаний людиною код.😡 Так, за трішки більше, ніж кілька ітерацій AI пройшов шлях від «а шо тут дєлать нада» до «Peace was never an option».→ Вони самі прийшли до тактик, які люди шліфували 40 років — бомбардувальників, реплікаторів та інші штуки, про які краще не знати вашому сисадміну.
Але найцікавіше тут — це convergent evolution.Різні прогони алгоритму генерували абсолютно різний код, але всі вони приходили до однієї й тієї ж вбивчої поведінки.🤨 Це як в біології: і умовні кальмари, і люди «дійшли» до того, щоб мати очі, хоча генетично ми — прірва. Ефективність диктує форму. І AI цю форму знайшов.😵 До речі, назва пайплану «Digital Red Queen» — це, якщо що, пряма відсилка персонажа Керрола, який казав «треба бігти з усіх ніг, щоб тільки залишатися на місці», і запустили її створювати віруси))))))Загалом це все для того, щоб показати, що кібербезпека майбутнього — це не статичні стіни, а постійна війна адаптивних агентів.• DRQ — це невеличкий натяк: або ми створимо AI, який захищає нас, постійно еволюціонуючи (шось типу чорномуру з Cyberpunk 2077), або просто станемо тренувальним датасетом для наступної ітерації.
Отже, я свою справу зробив — може трішки налякав, може мінімально просвітив. 💻 Тепер ваша черга тицяти вподобайки, бо інакше адмін біологічна нейромережа цього каналу теж почне еволюціонувати не в той бік, який нам треба)))
1160
26-02-03 09:12