article detail

Meta ra mắt AI mới có khả năng nhận diện các chi tiết trong ảnh

luxiie
2 năm trước
Cập nhật 2 năm trước
Meta giới thiệu một mô hình trí tuệ nhân tạo (AI) có khả năng nhận diện từng chi tiết trong một ảnh, cùng với bộ dữ liệu chú thích hình ảnh mà công ty này cho là lớn nhất

Meta có một số tham vọng lớn về AI, ngay cả khi có vẻ như nó đã bắt kịp OpenAI, Microsoft và thậm chí cả Google từ lâu. Để gây chú ý một chút, vào thứ Tư, công ty đã trình diễn Mô hình phân đoạn bất kỳ thứ gì dựa trên AI mới có khả năng xác định và phân tách các đối tượng cụ thể trong hình ảnh và video một cách đáng ngạc nhiên. Đây là điểm khởi đầu, Meta đang phát hành nó cho bất kỳ ai bằng cách biến phần mềm mới của nó thành mã nguồn mở.

Có khá nhiều ứng dụng tốt để xóa các đối tượng không mong muốn khỏi hình ảnh và tất cả chúng đều đã sử dụng các mô hình AI để tìm và thay thế các đối tượng trong ảnh. Trong các thử nghiệm của riêng tôi về bản trình diễn Segment Anything, Meta đã tiến thêm một bước với sản phẩm của riêng mình. Hệ thống demo cung cấp một loại công cụ 'Magic Wand' của Photoshop trên steroid. Tôi đã thử nó bằng cách sử dụng một số hình ảnh đông đúc, chẳng hạn như ảnh chụp bộ Lego Rivendell đồ sộ. Nó không chỉ đoán chung rằng tôi đang cố gắng chọn các nhân vật nhỏ cụ thể ra khỏi nền, mà khi nó nhặt được một vài pixel không phù hợp, tôi có thể nhanh chóng ra lệnh cho nó xóa bất cứ thứ gì không phải là nhân vật Chúa tể của những chiếc nhẫn chỉ với một cú nhấp chuột duy nhất.

Chẳng hạn, chỉ cần gõ cụm từ “con mèo,” AI sẽ ngay lập tức vẽ khung hình xung quanh mỗi con mèo trong bức ảnh.

Meta ra mắt mô hình AI mới trong bối cảnh nhiều "đại gia" công nghệ đang chạy đua để thống trị lĩnh vực này.

Công ty sở hữu Facebook cũng đang thử nghiệm nội bộ một vài tính năng dựa trên Generative AI - loại AI tập trung vào việc tạo nội dung hoàn toàn mới, thay vì chỉ nhận biết hoặc phân loại dữ liệu như các AI khác.

Một công cụ Generative AI phổ biến hiện nay là ChatGPT. Giám đốc điều hành Meta Mark Zuckerberg cho biết việc tích hợp các công cụ hỗ trợ sáng tạo AI vào những ứng dụng của Meta là ưu tiên hàng đầu của công ty trong năm 2023.

Đến nay, công ty này sử dụng công nghệ tương tự SAM trong nội bộ với một số hoạt động như gắn thẻ ảnh, kiểm duyệt nội dung và xác định nội dung đề xuất cho người dùng trên nền tảng Facebook và Instagram.

Thật tuyệt khi thấy Meta sẵn sàng mở mã nguồn một trong các mô hình và dữ liệu của nó, mặc dù chúng ta không nên mong đợi nhiều thứ miễn phí hơn nữa. Meta gần đây đã tạo ra một bước chuyển mình mạnh mẽ sang AI, đến nỗi người đứng đầu bộ phận metaverse của công ty là Andrew Bosworth và các giám đốc điều hành khác đang nói về cách công ty dự định sử dụng AI tổng quát để tạo quảng cáo cùng với các sản phẩm thương mại khác. Công ty vẫn đang làm việc để phát hành công khai cho đối thủ ChatGPT có tên là LLaMA, mặc dù nó đã bị rò rỉ trực tuyến.

Chắc chắn, SAM có thể được sử dụng trong khả năng AR hoặc VR để xác định đối tượng bằng ánh mắt của người dùng, một điều khá quan trọng đối với tham vọng của Meta đối với tai nghe và kính AR của họ. Vẫn còn nhiều chỗ cho sự lạm dụng. Hệ thống phát hiện AI DeepMind của Google đã tỏ ra hiệu quả trong việc xác định các tế bào ung thư, nhưng các hệ thống tương tự đã được sử dụng để nhận dạng khuôn mặt. ACLU gần đây đã tiết lộ rằng FBI đã thử nghiệm phần mềm nhận dạng khuôn mặt đối với công dân Hoa Kỳ trong nhiều năm. Khi công nghệ này trở nên phức tạp hơn, Hoa Kỳ rất cần một lệnh cấm khuôn mặt và sinh trắc học liên bang hoặc ít nhất là nhiều quy định hơn.

Thảo luận
Tham gia thảo luận văn minh cùng anh em ThinkView
Đăng nhập