Я запитав @JacquelineSYC19 про проблему даних ШІ: "Переміщення даних здається оманливо простою справою. Але ви працюєте з гетерогенними системами. Постгрес побудований інакше, ніж Сноуфлейк. Існують різні типи даних і довжини символів. Потрібно зробити невеликі конверсії, щоб дані залишалися послідовними. Під час розробки системи потрібно переконатися, що всі дані, які копіюються, є точними. І що нічого не впускається по дорозі. Більшість систем можуть містити сотні терабайт або навіть петабайти даних. Кожного разу, коли ви викликаєте Uber, заселяєтеся в готель, надсилаєте повідомлення або навіть відкриваєте додаток — усе це зберігається. Усі ці крайні випадки накопичуються, коли ви ростете. Коли ви накопичуєте дані, деякі компанії шардують свої бази даних. І це робить усе ще складнішим. Деякі компанії мають сотні баз даних, які потрапляють у центральне сховище даних. Деякі компанії навіть мають кілька сховищ даних. Це робить просте зберігання та роботу з великими обсягами даних дуже складною задачею, яку ми вирішили на @artie_labs.»