Fuente
Глобальна мережа журналістів-розслідувачів | Як вручну зібрати й проаналізувати великий об’єм данихАналіз роботи ал...
126 Vistas/Alcance
2025-01-07 13:18
Mensaje №619
Як вручну зібрати й проаналізувати великий об’єм данихАналіз роботи алгоритму ціноутворення сервісу Grab (основний конкурент Uber на Філіппінах) показало: навіть без доступу до внутрішніх даних компанії можна проаналізувати, як формується ціна на поїздки та довести безпричинне завищення тарифів 🤯Для цього дослідження журналісти Pulitzer Center збирали дані вручну, заручилися допомогою користувачів сервісу та фахівців зі статистики.Ось що вони радять тим, хто хоче повторити їхній шлях:🟥 Систематизуйте збір данихРозробіть чітку методологію, в основі якої лежить аналіз конкретних змінних (наприклад, маршрут або час). Дотримуйтеся однієї методології протягом усього дослідження.🟥 Використовуйте різні джерелаПоєднуйте ручний збір даних з автоматизованими методами, наприклад, через API. Це дозволяє перевіряти та доповнювати отримані результати.Також залучіть зовнішні джерела, наприклад, Google Maps, для отримання відсутніх даних (наприклад, відстань маршруту).🟥 Детально документуйте процесФіксуйте дані за допомогою скриншотів та зберігайте їх у таблицях для подальшого аналізу.🟥 Аналізуйте глибоко та всебічноЯкщо дані складні й мають багато змінних, співпрацюйте з експертами у сфері статистики. Це допоможе знайти реальні закономірності та уникнути помилкових висновків.Також досліджуйте взаємозв’язок між змінними, щоб підтвердити або спростувати заяви компанії (наприклад, залежність між підвищеними тарифами та скороченням часу очікування).🟥 Не ігноруйте людський факторСпілкуйтеся з користувачами та працівниками сервісу. Їхній досвід може допомогти зрозуміти реальний вплив алгоритму на життя і пояснити контекст.🟥 Приділяйте увагу етичним аспектамУникайте збору даних, які можуть порушувати приватність користувачів, і повідомте компанію про результати дослідження, щоб дати їм змогу відповісти або виправити недоліки.🟥 Будьте готові до труднощівВраховуйте обмеження методології. Наприклад, короткий термін збору даних може впливати на результати. Також залучайте додаткові змінні, такі як погода чи трафік, якщо вони важливі для вашого аналізу.📕 Більше про те, як команда Pulitzer Center дослідила роботу закритого алгоритму Grab, читайте на GIJN.