Công nghệ mới giúp AI ‘học cùng’ chứ không ‘soi’ dữ liệu người dùng

SONG TRÍ

Federated Learning cho phép AI học trực tiếp trên thiết bị của người dùng, vẫn thông minh hơn mỗi ngày mà không cần thu thập hay lưu trữ dữ liệu cá nhân.

Trong kỷ nguyên số, dữ liệu cá nhân là "nhiên liệu" để AI phát triển. Nhưng cũng chính từ đó, một nghịch lý xuất hiện: AI càng hiểu con người bao nhiêu, chúng ta càng dễ bị "soi chiếu" bấy nhiêu.

Những vụ rò rỉ thông tin, quảng cáo cá nhân hóa quá mức hay hành vi thu thập dữ liệu không minh bạch đã khiến người dùng ngày càng cảnh giác trước việc "trao" dữ liệu của mình cho các nền tảng.

Trong bối cảnh đó, cộng đồng công nghệ bắt đầu tìm kiếm cách để AI vẫn học hỏi mà không cần thu thập dữ liệu riêng tư, và đó chính là Federated Learning (học liên kết phân tán).

Cách AI học mà không cần thấy dữ liệu

Khác với mô hình huấn luyện truyền thống, tất cả dữ liệu như tin nhắn, hình ảnh, hay thói quen sử dụng đều phải được gửi lên máy chủ để AI học. Điều này khiến nhiều người lo ngại vì dữ liệu cá nhân có thể bị thu thập hoặc lộ ra ngoài.

Dữ liệu cá nhân của bạn đang 'trôi' đi đâu khi dùng AI miễn phí?ĐỌC NGAY

Với Federated Learning (học liên kết), cách làm được đảo ngược: quá trình học diễn ra ngay trên thiết bị của bạn, ví dụ như điện thoại. AI chỉ "quan sát" cách bạn gõ phím hay dùng ứng dụng để tự rút ra kinh nghiệm học, chứ không gửi dữ liệu thật lên máy chủ.

Sau đó điện thoại chỉ gửi một bản tóm tắt kết quả học được (dưới dạng con số hoặc công thức toán học) để hệ thống trung tâm tổng hợp.

Tưởng tượng đơn giản: hàng triệu chiếc điện thoại cùng chia sẻ "kinh nghiệm học" chứ không chia sẻ "bài làm". Nhờ đó, AI vẫn trở nên thông minh hơn, nhưng dữ liệu riêng của bạn không bao giờ rời khỏi máy.

Năm 2017, Google đã áp dụng Federated Learning trên Gboard bàn phím mặc định của Android. Nhờ đó ứng dụng có thể học cách người dùng gõ, dự đoán từ tiếp theo hay sửa lỗi chính tả mà không cần gửi nội dung tin nhắn về máy chủ.

Không dừng ở đó, Federated Learning còn mở ra tiềm năng lớn trong lĩnh vực y tế. Thay vì gom dữ liệu bệnh nhân vốn bị giới hạn bởi các quy định nghiêm ngặt như HIPAA (Mỹ) hay GDPR (châu Âu), các bệnh viện có thể cùng huấn luyện mô hình chẩn đoán mà không cần chia sẻ hồ sơ thật.

Dự án EXAM (2020) do NVIDIA khởi xướng là ví dụ tiêu biểu: hơn 20 bệnh viện toàn cầu đã cùng nhau huấn luyện hệ thống dự đoán tình trạng bệnh nhân COVID-19 mà không trao đổi bất kỳ dữ liệu cá nhân nào.

Không chỉ Google, mà cả Apple (áp dụng trong Siri và bàn phím QuickType), Meta (với nền tảng thử nghiệm FLUTE), cùng các tổ chức tài chính như WeBank hay Ant Group, và nhiều trường đại học hàng đầu như Stanford, MIT cũng đang nghiên cứu hoặc triển khai Federated Learning. Công nghệ này được kỳ vọng sẽ trở thành tiêu chuẩn mới cho các hệ thống AI tôn trọng quyền riêng tư của người dùng.

Chìa khóa cho AI công bằng và minh bạch

Hacker có thể lấy thông tin tuyệt mật của công ty thông qua ‘tâm sự’ với chatbot AI

Huấn luyện trên hàng triệu thiết bị với cấu hình đa dạng, đường truyền không ổn định và dung lượng pin hạn chế tạo ra nhiều thách thức về tốc độ và độ chính xác của quá trình học. Ngoài ra nguy cơ tấn công mô hình ngược cũng khiến các nhà phát triển phải kết hợp Federated Learning với các công nghệ bảo mật khác như mã hóa đồng nhất (homomorphic encryption) hay thêm nhiễu bảo vệ (differential privacy).

AI ngày càng hiểu rõ về bạn, nhưng Federated Learning mang đến hy vọng để thay đổi cách chúng ta tương tác với công nghệ. Thay vì AI thu thập dữ liệu một cách thụ động, giờ đây AI học hỏi trực tiếp trên thiết bị của bạn mà không cần truy cập vào dữ liệu cá nhân thật sự.

Điều này không chỉ bảo vệ quyền riêng tư mà còn tạo dựng mối quan hệ đối tác mới giữa con người và AI nơi AI đồng hành và học hỏi cùng bạn, thay vì xâm phạm vào cuộc sống riêng tư.

Trên thế giới, nhiều công ty và nhà nghiên cứu đang theo đuổi mục tiêu này. Federated Learning được kỳ vọng trở thành chìa khóa cho tương lai AI minh bạch, công bằng và tôn trọng người dùng khi mà AI thực sự học "cùng" bạn, thay vì "biết quá nhiều" về bạn.

Kỹ thuật mới giúp ngăn chặn AI học hỏi từ dữ liệu không được phép

Các nhà khoa học Australia vừa mới phát triển một kỹ thuật mới, có khả năng ngăn chặn các hệ thống Trí tuệ Nhân tạo (AI) học hỏi trái phép từ hình ảnh, tác phẩm nghệ thuật và các nội dung trực tuyến khác.