Iniciar sesión Registro
Anuncios
Tu espacio publicitario
Reserva este slot exclusivo para el periodo elegido.
Comprar publicidad →
Logotipo de la comunidad de telegram - коклети на сковорідці | #УкрТґ
Añadido 31 oct. 2021

коклети на сковорідці | #УкрТґ

@viomeme
Número de suscriptores: 586
Fotos: 22,700
Videos: 1,980
Enlaces: 4,750
Descripción:
меми новини та фемінізм мамин агрегатор адмінка вивчає зорезнавство учасниця sage community @sage_memes
Fuente

коклети на сковорідці | #УкрТґ | Вікіпедія існує 340+ мовами, але якість розділів англійською чи німець...

Logotipo de la comunidad de telegram - коклети на сковорідці | #УкрТґ коклети на сковорідці | #УкрТґ @viomeme
134 Vistas/Alcance 2025-09-30 12:56 Mensaje №34419
Вікіпедія існує 340+ мовами, але якість розділів англійською чи німецькою і розділу, скажімо, мовою інуктитут дуже відрізняється.Англомовна Вікіпедія традиційно найбільша і найкраща. Україномовна відстає від англійської у більшості тем, але загалом є в топ-20 мов за багатьма різними показниками.Більші проблеми починаються десь на другій чи третій сотні мовних розділів. П’ять років тому був великий скандал із шотландською Вікіпедією — виявилося, що значну частину статей написав американський підліток, який не знає шотландської мови.Шотландську Вікіпедію підчистили, але проблема, хоч і не в таких масштабах, залишається і в деяких інших мовних розділах. Про це — велика нова стаття MIT Technology Review. Заголовок чіткий і промовистий: «як ШІ та Вікіпедія загнали вразливі мови у замкнене коло занепаду» (“how AI and Wikipedia have sent vulnerable languages into a doom spiral”).Суть цієї doom spiral: у невеликому мовному розділі на кшталт гренландської Вікіпедії велика частина статей створюється з допомогою автоперекладу поганої якості людьми, які не є впевненими носіями мови => ШІ-моделі згодом тренуються на цьому наборі даних (бо Вікіпедія ж є важливим джерелом для тренування великих мовних моделей) => як наслідок корпус доступних текстів цією мовою стає ще гіршим.У повній статті на чотири тисячі слів значно більше прикладів і деталей.Для української вікіспільноти це теж актуальна загроза, хоча поки більш теоретична.Українській мові така doom spiral, звичайно, не загрожує, але ми також намагаємося розвивати кримськотатарську Вікіпедію, і там все складніше. Є багато людей, щиро зацікавлених у розвитку кримськотатарської Вікіпедії, але далеко не всі з них гарно знають мову. Ми намагаємося залучати носіїв мови до створення і вичитки статей, і деколи це вдається, але все ще сушимо голову над тим, як налаштувати постійну системну роботу.Тому якщо ви знаєте носіїв кримськотатарської мови, які хотіли б покращувати кримськотатарську Вікіпедію, а заодно і якість майбутніх текстів кримськотатарською — перешліть їм цей пост. Якщо знаєте меценатів, готових системно підтримувати цю роботу — також.