Tôi đã hỏi @JacquelineSYC19 về vấn đề dữ liệu của AI: "Di chuyển dữ liệu có vẻ như là một việc đơn giản một cách lừa dối. Nhưng bạn đang làm việc với các hệ thống không đồng nhất. Postgres được xây dựng khác với Snowflake. Có các loại dữ liệu và độ dài ký tự khác nhau. Có những chuyển đổi nhỏ mà bạn cần xây dựng dọc đường để giữ cho dữ liệu nhất quán. Khi bạn xây dựng hệ thống, bạn phải đảm bảo rằng tất cả dữ liệu được sao chép là chính xác. Và không có gì bị mất dọc đường. Hầu hết các hệ thống có thể có hàng trăm terabyte hoặc thậm chí petabyte dữ liệu. Mỗi khi bạn gọi Uber, nhận phòng khách sạn, gửi tin nhắn, hoặc thậm chí mở một ứng dụng, tất cả đều được lưu trữ. Tất cả những trường hợp biên này cứ tích lũy khi bạn phát triển. Khi bạn tích lũy dữ liệu, một số công ty phân mảnh cơ sở dữ liệu của họ. Và điều này làm cho mọi thứ trở nên phức tạp hơn. Một số công ty có hàng trăm cơ sở dữ liệu chảy vào một kho dữ liệu trung tâm. Và một số công ty thậm chí còn có nhiều kho dữ liệu. Điều này làm cho việc đơn giản lưu trữ và làm việc với một lượng lớn dữ liệu trở thành một vấn đề rất khó mà chúng tôi đã giải quyết tại @artie_labs."