Chrome sử dụng thuật toán học máy để mô tả hình ảnh cho người khiếm thị

Google vừa ứng dụng học máy (machine learning) tạo công cụ mô tả hình ảnh bằng giọng nói trên Chrome nhằm hỗ trợ người khiếm thị.

Chrome sử dụng thuật toán học máy để mô tả hình ảnh cho người khiếm thị

TalkBack là trợ năng hữu ích trên Android, giúp người khiếm thị điều hướng trang web trên Chrome bằng cách đọc to thành tiếng tên các mục được chọn và khởi động. Tuy nhiên, tính năng này lại bị bị giới hạn vì không thể mô tả được hình ảnh.

Google đã phát triển một tính năng mới trên Chrome, sử dụng thuật toán học máy để nhận dạng hình ảnh, đoán nội dung và tự động diễn đạt thành văn bản. Sau đó hệ thống sẽ đọc to lên giúp người khiếm thị có thể điều khiển và sử dụng thiết bị dễ dàng hơn. Theo Phone Arena, tính năng này được thử nghiệm khá chính xác. Ví dụ, Chrome mô tả hình dưới đây là một món thức ăn nhanh.

Chrome sử dụng thuật toán học máy để mô tả hình ảnh cho người khiếm thị

Tuy nhiên, vì được phát triển trên nền tảng trí tuệ nhân tạo nên công cụ này có thể sẽ xảy ra lỗi. Nhà phát triển Dominic Mazzoni của nhóm Chrome Accessibility cho biết họ sẽ luôn bổ sung những cụm từ “dường như” hoặc “có thể” để phục vụ người dùng không quá tin tưởng vào mô tả. Vì tính năng này được phát triển bằng thuật toán học máy nên sẽ có sai sót, cho thông tin không chính xác hoặc không thể diễn đạt được một số ảnh.

Dù vậy công cụ này vẫn cho thấy sự hữu ích với hàng triệu bức ảnh từ các nguồn độc lập, như blog và phương tiện truyền thông xã hội. Thật thú vị khi thấy công nghệ học máy giúp mọi người tiếp cận với Internet dễ dàng hơn.

Theo PhoneArena